Blackwell-efterfølger: Nvidia tilbyder en visning af Rubin (Ultra) og Feynman 15 kommentarer
Nvidia kom åbent ud til calculx i juni sidste år og tillod Rubin (Ultra) at se køreplanen. Til GTC 2025 keynote gav Nvidia CEO Jensen Huang de første tekniske detaljer for Rubin og Rubin Ultra, før der også var et syn på Feynman-arkitekturen bagefter. Tallene er gigantiske.
Efter at Blackwell Ultra stadig var på køreplanen angivet for Computex for et år siden, blev den nye datacenterløsning til hurtigere inferens officielt præsenteret i dag af AI-reduktionsmodeller og forventes at begynde i anden halvdel af året. I lighed med The Computex forhindrede Nvidia det ikke i at give et syn på de næste tre år.
Rubin GPU og Vera-CPU følger 2026
I anden halvdel af 2026 skal Rubin eller Double Solution Vera Rubin præsenteres. Navnebroren er astronomen Vera Cooper Rubin, der døde i 2016, hvis børnebørn sad blandt publikum ved GTC Keynote i dag. Rubin var allerede på køreplanen for Computex, men produktet blev kun beskrevet på det tidspunkt. I dag var Jensen Huang overraskende åben med de tekniske detaljer.
Nyt navneskema med antal GPU’er
Først måtte Huang indrømme, at den tidligere produktbetegnelse havde begået en fejl. Hos Blackwell er hver chip bygget op af to GPU’er, men for eksempel med GB300 NVL72 er der kun 72 GPU’er, selvom der faktisk er 72 chippakker med 144 GPU’er.
Vera Rubin NVL1
144 GPU’er med 20 TB HBM4 i det nye Oberon-rack
Hos Rubin er Nvidia interesseret i et nyt navneskema, der refererer til antallet af GPU’er og ikke længere antallet af chippakker. Rubin på den anden side er den nye GPU, Vera på den anden side er den nye Nvidia CPU med ARM-kerner. Navnet Vera Rubin NVL144 er en komplet løsning i det nye “Oberon Rack”.
Tallene er gigantiske, men bliver endnu større
Rubin er analog med Blackwell en 2-reticel GPU med en hurtig dir-the-interconnect (10 TB/s hos Blackwell). Rubin tilbyder 288 GB HBM4 og FP4 ydeevne på 50 Petaflops, hvilket er en stigning på 3,3 gange i forhold til Blackwell Ultra. Vera-CPU’en tilbyder 88 brugerdefinerede ARM-kerner med SMT til 176 tråde og er forbundet til GPU’en med 1,8 TB/s ved hjælp af Nvlink-C2C-InterConnect. Vera Rubin NVL144 som færdigt rack opnår 3,6 exaflops for FP4-inferens, 1,2 EXAFLOPS for FP8-træning og tilbyder 20,7 TB HBM4 med en samlet båndbredde på 13 TB/s. Nvlink 6 bringer det hele sammen med 260TB/s båndbredde.
Vera Rubin NVL1
Rubin Ultra fordobler antallet af GPU’er i 2027
Rubin er dog langt fra konklusionen, i anden halvdel af 2027 den største løsning Rubin Ultra med en 4-array GPU, det vil sige med fire GPU’er for hver chippakke. 16 HBM4E stakke med i alt 1 TB pr. pakke giver Nvidia til Rubin Ultra, men Vera-CPU’en bør forblive den samme som med Ruby.
Intet stativ var pakket så tæt på forhånd
Som et komplet “Kyber-rack” er løsningen Rubin Ultra NVL576, da 576 GPU’er nu bruges på tværs af 144 pakker. Det er dobbelt så mange pakker og fire gange så mange GPU’er som i øjeblikket med Blackwell Ultra, som Nvidia ønsker at passe i et enkelt rack. Stativet med 90 grader, som er fremstillet af NVIDIA, er igen betydeligt tættere end nuværende racks med 90 grader. Ifølge Jensen Huang kommer det vandkølede tårn ind på et energibehov på 600 kilowatt.
Rubin Ultra NVL576 Billede 1 af 3
15 exaflops for FP4 inferens
Til gengæld tilbyder Rubin Ultra NVL576 15 exaflops til FP4-inferens, 5 exaflops til FP8-træning, 1 TB HBM4E pr. pakke fordelt på 16 stakke på hver 64 GB og i alt 144 TB HBM4E med en samlet båndbredde på 4,6 Pb/s.
Feynman Folgt 2028
Feynman er endelig en ny arkitektur for anden halvdel af 2028, dedikeret til fysikeren Richard Phillips Feynman. Feynman er endnu ikke blevet set på en offentlig køreplan, og Nvidia var også mere dækket i GTC.
Køreplan med Feynman for 2028 Billede 1 af 2
Feynman bør derfor fortsat stole på Vera-CPU’en på HBM “Next-Gen” og ved valg af den dobbelte løsning. 8. generations NVSwitch til “NVL-Next” og de nye Network Solutions Spectrum7 og ConnectX 10 går hånd i hånd med generationen.
Techtip modtog information om denne artikel fra Nvidia som en del af en begivenhed af producenten i San Jose, Californien. Udgifterne til ankomst, afgang og fem hotelovernatninger blev afholdt af selskabet. Der var ingen indflydelse fra producenten og heller ikke pligt til at indberette.
Emner: Grafikkort kunstig intelligens Nvidia Nvidia GTC 2025 Kilde: Nvidia

Alexandre, uddannet ingeniør, deler sin viden om GPU-ydeevne til gaming og kreativt arbejde.