Blackwell Successeur: Nvidia offre une vue de Rubin (Ultra) et Feynman

Blackwell Successeur: Nvidia offre une vue de Rubin (Ultra) et Feynman 15 commentaires

Nvidia s'est montré ouvertement pour le calculx en juin dernier et a permis de voir la feuille de route à Rubin (Ultra). Pour le discours du GTC 2025, le PDG de Nvidia, Jensen Huang, a donné les premiers détails techniques pour Rubin et Rubin Ultra avant qu'il n'y ait également une perspective sur l'architecture Feynman après ensuite. Les chiffres sont gigantesques.

Après que Blackwell Ultra était toujours sur la feuille de route indiquée pour le Computex il y a un an, la nouvelle solution de centre de données pour l'inférence plus rapide a été officiellement présentée aujourd'hui par des modèles de réduction de l'IA et devrait commencer au second semestre. De façon similaire à The Computex, le Nvidia ne l'a pas empêché de donner une perspective sur les trois prochaines années.

Sommaire :

Rubin GPU et Vera-CPU suivent 2026

Dans la seconde moitié de 2026, Rubin ou Double Solution Vera Rubin doit être présenté. L'homonyme est l'astronome Vera Cooper Rubin, décédée en 2016, dont les petits-enfants étaient assis dans le public du Keynote GTC aujourd'hui. Rubin était déjà sur la feuille de route pour le Computex, mais le produit n'était décrit qu'à l'époque. Aujourd'hui, Jensen Huang était étonnamment ouvert avec les détails techniques.

Nouveau schéma de noms avec le nombre de GPU

Tout d'abord, Huang a dû admettre que la désignation précédente du produit avait fait une erreur. Chez Blackwell, chaque puce est composée de deux GPU, mais par exemple, avec GB300 NVL72, il n'y a que 72 GPU, bien qu'il y ait en fait 72 paquets de puces avec 144 GPU.

Vera Rubin NVL1

144 GPU avec 20 To HBM4 dans le nouveau rack Oberon

Chez Rubin, Nvidia s'intéresse à un nouveau schéma de noms qui fait référence au nombre de GPU et non plus au nombre de packages de puces. Rubin, d'autre part, est le nouveau GPU, Vera, en revanche, est le nouveau CPU Nvidia avec des noyaux de bras. Le nom Vera Rubin NVL144 est une solution complète dans le nouveau « Oberon Rack ».

Les chiffres sont gigantesques, mais deviennent encore plus gros

Rubin est analogue à Blackwell un GPU à 2-reticel avec un dir-the-interconnect rapide (10 To / s chez Blackwell). Rubin offre 288 Go HBM4 et une performance FP4 de 50 Petaflops, ce qui correspond à une augmentation d'un facteur 3,3 fois par rapport à Blackwell Ultra. Le Vera-CPU propose 88 noyaux de bras personnalisés avec SMT pour 176 threads et est connecté au GPU avec 1,8 To / s à l'aide de Nvlink-C2C-InterConnect. Vera Rubin NVL144 en tant que rack fini atteint 3,6 exaflops pour l'inférence FP4, 1,2 EXAFLOPS pour la formation FP8 et offre 20,7 To HBM4 avec une bande passante totale de 13 To / s. Nvlink 6 rassemble tout avec une bande passante de 260 To / s.

Vera Rubin NVL1

Rubin Ultra double le nombre de GPU en 2027

Cependant, Rubin est loin de la conclusion, dans la seconde moitié de 2027, la plus grande solution Rubin Ultra avec un GPU à 4-réseaux, c'est-à-dire avec quatre GPU pour chaque paquet de puces. 16 piles HBM4E avec un total de 1 To par package fournit Nvidia pour Rubin Ultra, mais le Vera-CPU devrait rester le même qu'avec Ruby.

Aucun rack n'était emballé si serré à l'avance

En tant que «rack Kyber» complet, la solution est Rubin Ultra NVL576, car 576 GPU sont maintenant utilisés sur 144 packages. C'est deux fois plus de packages et quatre fois plus de GPU que actuellement avec Blackwell Ultra que Nvidia veut s'adapter dans un seul rack. Le rack avec 90 degrés, qui est fabriqué par NVIDIA, est à nouveau considérablement plus dense que les racks actuels avec 90 degrés. Selon Jensen Huang, la tour refroidie par l'eau arrive à une exigence énergétique de 600 kilowatts.

Rubin Ultra NVL576 Image 1 sur 3

15 exaflops pour l'inférence FP4

En retour, Rubin Ultra NVL576 propose 15 exaflops pour l'inférence FP4, 5 exaflops pour la formation FP8, 1 To HBM4E par package distribué sur 16 piles de 64 Go chacune et un total de 144 TB HBM4E avec une bande passante totale de 4,6 Pb / s.

Feynman Folgt 2028

Feynman est enfin une nouvelle architecture pour la seconde moitié de 2028, dédiée au physicien Richard Phillips Feynman. Feynman n'a pas encore été vu sur une feuille de route publique, et Nvidia était également plus couverte par la GTC.

Feuille de route avec Feynman pour 2028 Image 1 sur 2

Feynman devrait donc continuer à s'appuyer sur le Vera-CPU sur HBM « Next-Gen » et lors de la sélection de la double solution. Le NVSwitch de 8e génération pour « NVL-Next » et le nouveau réseau Solutions Spectrum7 et ConnectX 10 vont de pair avec la génération.

Techastuce a reçu des informations sur cet article de Nvidia dans le cadre d'un événement du fabricant de San Jose, en Californie. Le coût d'arrivée, le départ et cinq logements hôteliers ont été supportés par l'entreprise. Il n'y avait aucune influence du fabricant ni une obligation de signaler.

Sujets: Cartes graphiques Intelligence artificielle Nvidia Nvidia GTC 2025 Source: Nvidia

Alexandre Lefèvre

Ingénieur de formation, Alexandre partage ses connaissances sur les performances des GPU pour le gaming et la création.

Rubin GPU et Vera-CPU suivent 2026

Nouveau schéma de noms avec le nombre de GPU

144 GPU avec 20 To HBM4 dans le nouveau rack Oberon

Les chiffres sont gigantesques, mais deviennent encore plus gros

Rubin Ultra double le nombre de GPU en 2027

Aucun rack n'était emballé si serré à l'avance

15 exaflops pour l'inférence FP4

Feynman Folgt 2028

Publications similaires

Laisser un commentaire Annuler la réponse