Un vieux processeur de 1997 réussit à faire tourner une IA moderne avec seulement 128 Mo de RAM

À l’heure où l’intelligence artificielle semble indissociable des cartes graphiques dernier cri et des serveurs surpuissants, une équipe de chercheurs a prouvé qu’il n’en fallait pas forcément autant. Leur pari : faire tourner un modèle moderne d’IA sur un ordinateur de 1997. Résultat ? Un exploit inattendu qui redonne ses lettres de noblesse au rétro-computing.

Quand un Pentium II renaît de ses cendres

Tout a commencé par l’achat improbable d’un Pentium II de 1997 tournant sous Windows 98, déniché pour une centaine d’euros sur eBay. La machine, limitée à 128 Mo de RAM, semblait promise à un rôle de pièce de collection. Mais pour l’équipe d’EXO Labs, menée par Andrej Karpathy, c’était le terrain de jeu parfait pour repousser les limites.

Premier obstacle : brancher des périphériques modernes. Ici, pas d’USB, seulement des ports PS/2. Le moindre branchement devenait une énigme – la souris devait obligatoirement être connectée sur le port 1, le clavier sur le port 2. Un détail qui aurait suffi à décourager bien des curieux.

Les défis du transfert de fichiers

Ensuite, il a fallu résoudre un problème de taille : comment transférer les fichiers d’un MacBook Pro flambant neuf vers cette relique de 1997 ? Les clés USB étant incompatibles, la solution a été trouvée dans une méthode d’un autre âge : un serveur FTP. Grâce à un simple adaptateur Ethernet, les deux machines ont pu échanger données et modèles.

Mais le vrai casse-tête a commencé au moment de compiler le code. Les outils modernes comme mingw échouaient à cause des limites du processeur. C’est finalement un antique logiciel, Borland C++ 5.02, datant de plus de 25 ans, qui a permis de compiler et d’adapter le code pour la vieille machine.

L’IA moderne sur un dinosaure numérique

Après de multiples ajustements, l’équipe a réussi l’impensable : faire tourner Llama 2, un modèle d’IA récent, sur ce Pentium II. Certes, la vitesse n’a rien de comparable à celle d’un serveur moderne : environ 39 tokens par seconde pour une petite version du modèle, et à peine 1 token par seconde pour un modèle plus lourd de 15 millions de paramètres. Mais le simple fait que cela fonctionne relève déjà de la prouesse.

Le secret ? L’architecture BitNet, qui utilise des poids ternaires (-1, 0, 1) et réduit drastiquement la complexité des calculs. Une approche qui rend possible l’exécution de modèles d’IA sur des machines autrement incapables de suivre la cadence.

Une piste pour l’avenir de l’IA

Au-delà de l’exploit technique, cette expérience ouvre une réflexion majeure : l’avenir de l’IA doit-il forcément reposer sur des machines ultra-énergivores ? Selon l’Agence Internationale de l’Énergie, les besoins énergétiques liés à l’IA explosent et pourraient peser lourdement sur les réseaux électriques dans les années à venir. Des approches plus sobres et efficaces sont donc cruciales.

Avec BitNet, EXO Labs explore une voie alternative : créer des modèles plus légers, capables de fonctionner sur du matériel ancien ou des appareils du quotidien comme de vieux ordinateurs portables ou même des consoles de jeux. Un pas de plus vers la démocratisation de l’IA, où la puissance ne serait plus réservée aux data centers des géants de la tech.

En somme, ce Pentium II de 1997 rappelle que l’innovation ne consiste pas toujours à aller vers le plus gros ou le plus cher. Parfois, il suffit de regarder en arrière pour imaginer un futur différent.

Quand un Pentium II renaît de ses cendres

Les défis du transfert de fichiers

L’IA moderne sur un dinosaure numérique

Une piste pour l’avenir de l’IA

Participer à la discussion