Blackwell Efterträdare: Nvidia erbjuder en vy av Rubin (Ultra) och Feynman

Blackwell efterträdare: Nvidia erbjuder en vy av Rubin (Ultra) och Feynman 15 kommentarer

Nvidia kom ut öppet för calculx i juni förra året och tillät Rubin (Ultra) att se färdplanen. För GTC 2025 keynote gav Nvidias VD Jensen Huang de första tekniska detaljerna för Rubin och Rubin Ultra innan det också fanns en syn på Feynman-arkitekturen efteråt. Siffrorna är gigantiska.

Efter att Blackwell Ultra fortfarande var på vägkartan som indikerades för Computex för ett år sedan, presenterades den nya datacenterlösningen för snabbare slutledning officiellt idag av AI-reduktionsmodeller och förväntas börja under andra halvan av året. I likhet med The Computex hindrade Nvidia inte det från att ge en syn på de kommande tre åren.

Innehållsförteckning :

Rubin GPU och Vera-CPU följer 2026

Under andra halvåret 2026 ska Rubin eller Double Solution Vera Rubin presenteras. Namnebror är astronomen Vera Cooper Rubin, som dog 2016, vars barnbarn satt i publiken på GTC Keynote idag. Rubin fanns redan på färdplanen för Computex, men produkten beskrevs bara då. Idag var Jensen Huang överraskande öppen med de tekniska detaljerna.

Nytt namnschema med antal GPU:er

Först var Huang tvungen att erkänna att den tidigare produktbeteckningen hade gjort ett misstag. Hos Blackwell består varje chip av två GPU:er, men till exempel med GB300 NVL72 finns det bara 72 GPU:er, även om det faktiskt finns 72 chippaket med 144 GPU:er.

Vera Rubin NVL1

144 GPU:er med 20 TB HBM4 i det nya Oberon-racket

Hos Rubin är Nvidia intresserade av ett nytt namnschema som hänvisar till antalet GPU:er och inte längre antalet chippaket. Rubin å andra sidan är den nya grafikprocessorn, Vera å andra sidan är den nya Nvidia-processorn med ARM-kärnor. Namnet Vera Rubin NVL144 är en komplett lösning i det nya ”Oberon Rack”.

Siffrorna är gigantiska, men blir ännu större

Rubin är analog med Blackwell en 2-reticel GPU med en snabb dir-the-interconnect (10 TB/s hos Blackwell). Rubin erbjuder 288 GB HBM4- och FP4-prestanda på 50 Petaflops, vilket är en ökning med 3,3 gånger jämfört med Blackwell Ultra. Vera-CPU erbjuder 88 anpassade ARM-kärnor med SMT för 176 trådar och är ansluten till GPU:n med 1,8 TB/s med hjälp av Nvlink-C2C-InterConnect. Vera Rubin NVL144 som ett färdigt rack uppnår 3,6 exaflops för FP4-inferens, 1,2 EXAFLOPS för FP8-träning och erbjuder 20,7 TB HBM4 med en total bandbredd på 13 TB/s. Nvlink 6 sammanför allt med 260TB/s bandbredd.

Vera Rubin NVL1

Rubin Ultra fördubblar antalet GPU:er 2027

Rubin är dock långt ifrån slutsatsen, under andra halvan av 2027 den största lösningen Rubin Ultra med en 4-array GPU, det vill säga med fyra GPU:er för varje chippaket. 16 HBM4E-stackar med totalt 1 TB per paket ger Nvidia för Rubin Ultra, men Vera-CPU:n bör förbli densamma som med Ruby.

Inget ställ var packat så hårt i förväg

Som ett komplett ”Kyber-rack” är lösningen Rubin Ultra NVL576, eftersom 576 GPU:er nu används i 144 paket. Det är dubbelt så många paket och fyra gånger så många grafikprocessorer som för närvarande med Blackwell Ultra som Nvidia vill få plats i ett enda rack. Racket med 90 grader, som tillverkas av NVIDIA, är återigen betydligt tätare än nuvarande rack med 90 grader. Enligt Jensen Huang kommer det vattenkylda tornet in på ett energibehov på 600 kilowatt.

Rubin Ultra NVL576 Bild 1 av 3

15 exaflops för FP4 slutledning

I gengäld erbjuder Rubin Ultra NVL576 15 exaflops för FP4-inferens, 5 exaflops för FP8-träning, 1 TB HBM4E per paket fördelat på 16 stackar på 64 GB vardera, och totalt 144 TB HBM4E med en total bandbredd på 4,6 Pb/s.

Feynman Folgt 2028

Feynman är äntligen en ny arkitektur för andra halvan av 2028, tillägnad fysikern Richard Phillips Feynman. Feynman har ännu inte setts på en offentlig färdplan, och Nvidia täcktes också mer i GTC.

Färdkarta med Feynman för 2028 Bild 1 av 2

Feynman bör därför fortsätta att förlita sig på Vera-CPU:n på HBM ”Next-Gen” och när man väljer den dubbla lösningen. Den 8:e generationens NVSwitch för ”NVL-Next” och de nya Network Solutions Spectrum7 och ConnectX 10 går hand i hand med generationen.

Techtip fick information om den här artikeln från Nvidia som en del av ett evenemang av tillverkaren i San Jose, Kalifornien. Kostnaden för ankomst, avresa och fem hotellboenden stod för företaget. Det fanns inget inflytande från tillverkaren eller någon anmälningsplikt.

Ämnen: Grafikkort Artificiell intelligens Nvidia Nvidia GTC 2025 Källa: Nvidia