Le géant américain des puces d’intelligence artificielle NVIDIA franchit une nouvelle étape dans la miniaturisation du calcul haute performance (HPC). L’entreprise lance cette semaine le DGX Spark, présenté comme “le plus petit superordinateur d’intelligence artificielle au monde”. NVIDIA veut permettre aux développeurs d’accéder, depuis leur poste de travail, à une puissance de calcul comparable à celle d’un centre de données.
Un format compact, mais des capacités de calcul hors norme
Cette station de travail a été pensée pour développer, entraîner et exploiter localement des modèles d’apprentissage profond (deep learning) et d’IA générative de grande envergure. Côté puissance, le géant américain annonce jusqu’à 1 pétaflop de performance en intelligence artificielle, grâce à l’accélération du superprocesseur NVIDIA GB10 Grace Blackwell, au réseau NVIDIA ConnectX®-7 à 200 Gb/s et à la technologie NVIDIA NVLink™-C2C, “qui fournit une bande passante cinq fois supérieure à celle de la cinquième génération PCIe, avec 128 Go de mémoire cohérente entre le CPU et le GPU”, précise NVIDIA. Le système donne aux développeurs la capacité d’exécuter des inférences sur des modèles d’IA comptant jusqu’à 200 milliards de paramètres et d’ajuster localement des modèles allant jusqu’à 70 milliards de paramètres. “De plus, le DGX Spark permet aux développeurs de créer des agents d’IA et d’exécuter localement des piles logicielles avancées”. Côté prix, il faut compter 3 999 dollars, soit 3 450 euros.
Prototyper et expérimenter rapidement
« En 2016, nous avons créé le DGX-1 pour donner aux chercheurs en IA leur propre superordinateur. J’ai personnellement livré le premier système à Elon, dans une petite startup appelée OpenAI — de là est né ChatGPT, déclenchant la révolution de l’IA », a déclaré Jensen Huang, fondateur et PDG de NVIDIA.
Les besoins en calcul de l’intelligence artificielle dépassent aujourd’hui largement les capacités des machines sur lesquelles des millions de développeurs s’appuient encore. Résultat : la plupart sont contraints de déporter leurs projets vers le cloud ou des centres de données spécialisés. Ici, ils peuvent accéder à l’écosystème complet NVIDIA AI, pour effectuer localement des tâches telles que “la personnalisation des modèles FLUX.1 de Black Forest Labs pour améliorer la génération d’images, la création d’agents de recherche visuelle et de résumé à partir du modèle NVIDIA Cosmos™ Reason, ou encore la conception d’un chatbot IA basé sur Qwen3, optimisé pour le DGX Spark”.
Des laboratoires de recherche, comme le NYU Global Frontier Lab, testent déjà le DGX Spark pour accélérer leurs travaux. « DGX Spark nous permet d’accéder à une puissance de calcul à l’échelle du pétaflop sur notre bureau », déclare Kyunghyun Cho, professeur en informatique et science des données au NYU Global Frontier Lab. « Cette nouvelle approche de la recherche et du développement en IA nous permet de prototyper rapidement et d’expérimenter des algorithmes et modèles avancés — même pour des applications sensibles en matière de confidentialité et de sécurité, comme la santé. »
Pour célébrer le lancement, NVIDIA raconte que Jensen Huang a remis en main propre l’une des premières unités à Elon Musk, ingénieur en chef chez SpaceX, aujourd’hui à Starbase, au Texas. “Ce geste fait écho aux origines du superordinateur, puisque Musk faisait partie de l’équipe qui avait reçu le tout premier NVIDIA DGX™-1 des mains de Huang en 2016.”