Nvidia a annoncé son architecture de calcul Rubin AI de nouvelle génération qui correspondra enfin à la stratégie chinoise en matière d'IA pour l'exécution d'inférences d'IA à des coûts bien inférieurs à ceux de l'actuelle édition Blackwell.
Tout comme l'architecture Nvidia Rubin AI, la plateforme est construite autour de six sous-systèmes de traitement fonctionnant ensemble : le CPU Vera, le nouveau GPU Nvidia Rubin, le commutateur NVLink 6 de troisième génération, le SuperNIC ConnectX-9, le DPU BlueField-4 et le commutateur Ethernet Spectrum-6. Ces puces sont fabriquées sur des nœuds de fonderie TSMC avancés et introduisent des optimisations d'interface visant à réduire considérablement le coût des jetons et la durée de la formation.
En fait, le "codesign" de Nvidia sur les six nouvelles puces permet d'entraîner les modèles avec un quart des GPU nécessaires à la plateforme Nvidia Blackwell actuelle et de diviser par dix les coûts par jeton. Une diminution par dix du coût des jetons est ce qu'Elon Musk promet pour la prochaine génération de jetons Tesla AI5 de Tesla ; c'est seulement qu'il n'entrera pas en production de masse avant l'année prochaine. Elon Musk a fait l'éloge de Nvidia Rubin en le qualifiant de "moteur de fusée pour l'IA" qui permettra de déployer des modèles de pointe à grande échelle.
La Chine est également fière de son bas Prix des jetons d'IA qu'elle obtient en mettant en open-sourcing des modèles tels que DeepSeek et en enchaînant un grand nombre de GPU d'IA de milieu de gamme comme le Huawei 910C l'architecture Rubin de Nvidia s'attaque donc enfin non seulement aux performances, mais aussi aux coûts d'exploitation des modèles d'IA.
La partie la plus intéressante de la plateforme Rubin est peut-être le nouveau processeur Nvidia Vera,"conçu pour le mouvement des données et le raisonnement agentique sur des systèmes accélérés, avec un support informatique confidentiel complet" Il peut être associé à un GPU Nvidia ou fonctionner comme un processeur autonome exécutant"des charges de travail d'analyse, de cloud, d'orchestration, de stockage et de calcul à haute performance (HPC)" avec une compatibilité totale avec Arm.
Les spécifications du CPU Vera incluent 88 cœurs personnalisés et 1,2 TB/s de bande passante mémoire LPDDR5X, et se caractérisent par une consommation d'énergie très frugale. L'intégration de l'interface de connectivité NVLink-C2C exécute un accès synchronisé à la mémoire CPU-GPU dans le cadre des fonctions d'optimisation qui font de la plate-forme Rubin un ordre de grandeur plus efficace que son prédécesseur basé sur Blackwell.
Achetez le supercalculateur personnel d'IA Nvidia DGX Spark sur Amazon
Source(s)
Top 10
» Le Top 10 des PC portables multimédia
» Le Top 10 des PC portables de jeu
» Le Top 10 des PC portables de jeu légers
» Le Top 10 des ordinateurs portables bureautiques
» Le Top 10 des PC portables bureautiques premium/professionnels
» Le Top 10 des Stations de travail mobiles
» Le Top 10 des Ultraportables
» Le Top 10 des Ultrabooks
» Le Top 10 des Convertibles
» Le Top 10 des Tablettes
» Le Top 10 des Tablettes Windows
» Le Top 10 des Smartphones
» Le Top 10 des PC Portables á moins de 300 euros
» Le Top 10 des PC Portables á moins de 500 euros
» Le Top 25 des meilleurs écrans d'ordinateurs






