La plateforme d'IA Rubin de Nvidia décuple le coût des jetons par rapport à Blackwell. Elon Musk la qualifie de "moteur de fusée pour l'IA"

Plate-forme d'IA Rubin de Nvidia (Image source : Nvidia)

La vantardise de Tesla selon laquelle sa future puce AI5 exécutera l'inférence 10 fois moins cher que l'architecture Blackwell de Nvidia a été de courte durée. La plateforme d'IA Rubin de Nvidia offre une réduction par dix des coûts par jeton.

Daniel Zlatev (traduit par Ninh Duy), Publié 01/06/2026 🇺🇸 🇪🇸 ...

CES 2026

Nvidia a annoncé son architecture de calcul Rubin AI de nouvelle génération qui correspondra enfin à la stratégie chinoise en matière d'IA pour l'exécution d'inférences d'IA à des coûts bien inférieurs à ceux de l'actuelle édition Blackwell.

Tout comme l'architecture Nvidia Rubin AI, la plateforme est construite autour de six sous-systèmes de traitement fonctionnant ensemble : le CPU Vera, le nouveau GPU Nvidia Rubin, le commutateur NVLink 6 de troisième génération, le SuperNIC ConnectX-9, le DPU BlueField-4 et le commutateur Ethernet Spectrum-6. Ces puces sont fabriquées sur des nœuds de fonderie TSMC avancés et introduisent des optimisations d'interface visant à réduire considérablement le coût des jetons et la durée de la formation.

En fait, le "codesign" de Nvidia sur les six nouvelles puces permet d'entraîner les modèles avec un quart des GPU nécessaires à la plateforme Nvidia Blackwell actuelle et de diviser par dix les coûts par jeton. Une diminution par dix du coût des jetons est ce qu'Elon Musk promet pour la prochaine génération de jetons Tesla AI5 de Tesla ; c'est seulement qu'il n'entrera pas en production de masse avant l'année prochaine. Elon Musk a fait l'éloge de Nvidia Rubin en le qualifiant de "moteur de fusée pour l'IA" qui permettra de déployer des modèles de pointe à grande échelle.

La Chine est également fière de son bas Prix des jetons d'IA qu'elle obtient en mettant en open-sourcing des modèles tels que DeepSeek et en enchaînant un grand nombre de GPU d'IA de milieu de gamme comme le Huawei 910C l'architecture Rubin de Nvidia s'attaque donc enfin non seulement aux performances, mais aussi aux coûts d'exploitation des modèles d'IA.

La partie la plus intéressante de la plateforme Rubin est peut-être le nouveau processeur Nvidia Vera,"conçu pour le mouvement des données et le raisonnement agentique sur des systèmes accélérés, avec un support informatique confidentiel complet" Il peut être associé à un GPU Nvidia ou fonctionner comme un processeur autonome exécutant"des charges de travail d'analyse, de cloud, d'orchestration, de stockage et de calcul à haute performance (HPC)" avec une compatibilité totale avec Arm.

Les spécifications du CPU Vera incluent 88 cœurs personnalisés et 1,2 TB/s de bande passante mémoire LPDDR5X, et se caractérisent par une consommation d'énergie très frugale. L'intégration de l'interface de connectivité NVLink-C2C exécute un accès synchronisé à la mémoire CPU-GPU dans le cadre des fonctions d'optimisation qui font de la plate-forme Rubin un ordre de grandeur plus efficace que son prédécesseur basé sur Blackwell.

Achetez le supercalculateur personnel d'IA Nvidia DGX Spark sur Amazon