Successore di Blackwell: Nvidia offre una visione di Rubin (Ultra) e Feynman 15 commenti
Nvidia si è espressa apertamente a favore del calcolo lo scorso giugno e ha permesso a Rubin (Ultra) di vedere la tabella di marcia. Durante il keynote del GTC 2025, il CEO di Nvidia Jensen Huang ha fornito i primi dettagli tecnici per Rubin e Rubin Ultra prima che in seguito ci fosse anche una panoramica sull’architettura Feynman. I numeri sono giganteschi.
Dopo che Blackwell Ultra era ancora sulla tabella di marcia indicata per Computex un anno fa, oggi è stata presentata ufficialmente la nuova soluzione per data center per un’inferenza più rapida con i modelli di riduzione dell‘intelligenza artificiale e il suo avvio è previsto nella seconda metà dell’anno. Analogamente al Computex, Nvidia non gli ha impedito di fornire una prospettiva sui prossimi tre anni.
GPU Rubin e CPU Vera seguono il 2026
Nella seconda metà del 2026 verrà presentato il Rubin o Doppia Soluzione Vera Rubin. L’omonima è l’astronoma Vera Cooper Rubin, morta nel 2016, i cui nipoti erano seduti oggi tra il pubblico al GTC Keynote. Rubin era già sulla tabella di marcia per Computex, ma all’epoca il prodotto era stato solo descritto. Oggi, Jensen Huang è stato sorprendentemente aperto con i dettagli tecnici.
Nuovo schema di denominazione con numero di GPU
Innanzitutto Huang ha dovuto ammettere che la precedente denominazione del prodotto era un errore. Alla Blackwell, ogni chip è composto da due GPU, ma ad esempio con il GB300 NVL72 ci sono solo 72 GPU, anche se in realtà ci sono 72 pacchetti di chip con 144 GPU.
Vera Rubin NVL1
144 GPU con 20 TB HBM4 nel nuovo rack Oberon
Presso Rubin, Nvidia è interessata ad un nuovo schema di denominazione che si riferisca al numero di GPU e non più al numero di pacchetti di chip. Rubin invece è la nuova GPU, Vera invece è la nuova CPU Nvidia con core ARM. Il nome Vera Rubin NVL144 è una soluzione completa nel nuovo “Oberon Rack”.
I numeri sono giganteschi, ma stanno diventando ancora più grandi
Rubin è analogo a Blackwell, una GPU a 2 reticoli con un’interconnessione veloce (10 TB/s a Blackwell). Rubin offre HBM4 da 288 GB e prestazioni FP4 di 50 Petaflop, ovvero un aumento di 3,3 volte rispetto a Blackwell Ultra. La CPU Vera offre 88 core ARM personalizzati con SMT per 176 thread ed è collegata alla GPU con 1,8 TB/s utilizzando Nvlink-C2C-InterConnect. Vera Rubin NVL144 come rack finito raggiunge 3,6 exaflop per l’inferenza FP4, 1,2 EXAFLOPS per l’addestramento FP8 e offre 20,7 TB HBM4 con una larghezza di banda totale di 13 TB/s. Nvlink 6 riunisce tutto con una larghezza di banda di 260 TB/s.
Vera Rubin NVL1
Rubin Ultra raddoppia il numero di GPU nel 2027
Tuttavia, Rubin è lungi dall’essere giunto alla conclusione, nella seconda metà del 2027 verrà lanciata la soluzione più grande Rubin Ultra con una GPU 4-array, cioè con quattro GPU per ciascun pacchetto di chip. 16 stack HBM4E con un totale di 1 TB per pacchetto forniscono Nvidia per Rubin Ultra, ma la Vera-CPU dovrebbe rimanere la stessa di Ruby.
Nessun rack era stato imballato così stretto in anticipo
Come “rack Kyber” completo, la soluzione è Rubin Ultra NVL576, poiché ora vengono utilizzate 576 GPU in 144 pacchetti. Si tratta del doppio dei pacchetti e del quadruplo delle GPU rispetto al Blackwell Ultra attuale che Nvidia vuole inserire in un singolo rack. Il rack a 90 gradi, prodotto da NVIDIA, è ancora una volta notevolmente più denso degli attuali rack a 90 gradi. Secondo Jensen Huang il fabbisogno energetico della torre raffreddata ad acqua è di 600 kilowatt.
Rubin Ultra NVL576 Immagine 1 di 3
15 exaflop per l’inferenza FP4
In cambio, Rubin Ultra NVL576 offre 15 exaflop per l’inferenza FP4, 5 exaflop per l’addestramento FP8, 1 TB HBM4E per pacchetto distribuito su 16 stack da 64 GB ciascuno e un totale di 144 TB HBM4E con una larghezza di banda totale di 4,6 Pb/s.
Feynman Folgt 2028
Feynman è finalmente una nuova architettura per la seconda metà del 2028, dedicata al fisico Richard Phillips Feynman. Feynman deve ancora essere visto su una tabella di marcia pubblica, e anche Nvidia è stata maggiormente coperta da GTC.
Tabella di marcia con Feynman per il 2028 Immagine 1 di 2
Feynman dovrebbe quindi continuare a fare affidamento sulla Vera-CPU della HBM “Next-Gen” e nella scelta della doppia soluzione. L’NVSwitch di ottava generazione per “NVL-Next” e le nuove soluzioni di rete Spectrum7 e ConnectX 10 vanno di pari passo con la generazione.
Techtip ha ricevuto informazioni su questo articolo da Nvidia come parte di un evento del produttore a San Jose, California. Le spese di arrivo, partenza e cinque sistemazioni alberghiere sono state a carico dell’azienda. Non vi è stata alcuna influenza da parte del produttore né obbligo di segnalazione.
Argomenti: Schede grafiche Intelligenza artificiale Nvidia Nvidia GTC 2025 Fonte: Nvidia

Ingegnere di formazione, Alexandre condivide le sue conoscenze sulle prestazioni delle GPU per gaming e creazione.