Blackwellin seuraaja: Nvidia tarjoaa näkymät Rubinille (Ultra) ja Feynmanille

Blackwellin seuraaja: tarjoaa näkymän Rubinille (Ultra) ja Feynmanille 15 kommenttia

Blackwellin seuraaja: Nvidia tarjoaa näkymät Rubinille (Ultra) ja Feynmanille

Nvidia tuli avoimesti laskentaan viime kesäkuussa ja antoi Rubinille (Ultra) nähdä tiekartan. GTC 2025 -puheenvuorossa Nvidian toimitusjohtaja Jensen Huang antoi ensimmäiset tekniset tiedot Rubinista ja Rubin Ultrasta, ennen kuin Feynman-arkkitehtuuria esitettiin myöhemmin. Luvut ovat jättimäisiä.

Sen jälkeen, kun Blackwell Ultra oli vielä vuosi sitten Computexille osoitetulla tiekartalla, tekoälyn vähentämismallit esittelivät tänään virallisesti uuden datakeskusratkaisun nopeampaan päättelyyn, ja sen odotetaan alkavan vuoden toisella puoliskolla. Samoin kuin The Computex, Nvidia ei estänyt sitä antamasta näkymää seuraavalle kolmelle vuodelle.

Rubin GPU ja Vera-CPU seuraavat vuotta 2026

Vuoden 2026 toisella puoliskolla esitellään Rubin tai Double Solution Vera Rubin. Kaima on vuonna 2016 kuollut tähtitieteilijä Vera Cooper Rubin, jonka lapsenlapset istuivat tänään GTC Keynoten yleisössä. Rubin oli jo Computexin tiekartalla, mutta tuotetta kuvattiin vasta tuolloin. Tänään Jensen Huang oli yllättävän avoin teknisissä yksityiskohdissa.

Uusi nimeämisjärjestelmä grafiikkasuorittimien määrällä

Ensin Huangin oli myönnettävä, että edellinen tuotenimitys oli tehnyt virheen. Blackwellillä jokainen siru koostuu kahdesta GPU:sta, mutta esimerkiksi GB300 NVL72:ssa on vain 72 GPU:ta, vaikka itse asiassa sirupaketteja on 72 ja 144 GPU:ta.

Vera Rubin NVL1 Vera Rubin NVL1

144 GPU:ta 20 TB HBM4:llä uudessa Oberon-telineessä

Rubinilla Nvidia on kiinnostunut uudesta nimeämisjärjestelmästä, joka viittaa grafiikkasuorittimien määrään eikä enää sirupakettien määrään. Rubin toisaalta on uusi GPU, Vera toisaalta uusi Nvidia CPU -ytimillä. Nimi Vera Rubin NVL144 on täydellinen ratkaisu uuteen ”Oberon Rackiin”.

Luvut ovat jättimäisiä, mutta yhä suurempia

Rubin on analoginen Blackwellin kanssa 2-reticel-grafiikkasuorittimelle, jossa on nopea dir-the-interconnect (10 TB/s Blackwellillä). Rubin tarjoaa 288 Gt:n HBM4- ja FP4-suorituskyvyn 50 Petaflopsilla, mikä on 3,3-kertainen Blackwell Ultraan verrattuna. Vera-CPU tarjoaa 88 mukautettua ARM-ydintä SMT:llä 176 säiettä varten, ja se on kytketty GPU:hun nopeudella 1,8 TB/s Nvlink-C2C-InterConnectin avulla. Vera Rubin NVL144 valmiina telineenä saavuttaa 3,6 exaflopsia FP4-päätelmään, 1,2 EXAFLOPSia FP8-koulutukseen ja tarjoaa 20,7 TB HBM4:n kokonaiskaistanleveydellä 13 TB/s. Nvlink 6 yhdistää kaiken 260 Tt/s kaistanleveydellä.

Vera Rubin NVL1 Vera Rubin NVL1

Rubin Ultra kaksinkertaistaa GPU:iden määrän vuonna 2027

Rubin on kuitenkin kaukana päätöksestä, vuoden 2027 toisella puoliskolla suurin ratkaisu Rubin Ultra, jossa on 4-ryhmän GPU, eli neljä GPU:ta jokaista sirupakettia kohti. 16 HBM4E-pinoa, joissa yhteensä 1 Tt pakettia kohden, tarjoaa Nvidian Rubin Ultralle, mutta Vera-CPU:n tulisi pysyä samana kuin Rubyn kanssa.

Mikään teline ei ollut pakattu näin tiukasti etukäteen

Täydellisenä ”Kyber-telineenä” ratkaisu on Rubin Ultra NVL576, koska 144 paketissa käytetään nyt 576 GPU:ta. Se on kaksi kertaa niin monta pakettia ja neljä kertaa enemmän grafiikkasuoritteita kuin tällä hetkellä Blackwell Ultrassa, että Nvidia haluaa mahtua yhteen telineeseen. NVIDIA:n valmistama 90 asteen teline on jälleen huomattavasti tiheämpi kuin nykyiset 90 asteen telineet. Jensen Huangin mukaan vesijäähdytteisen tornin energiantarve on 600 kilowattia.

Rubin Ultra NVL576

Rubin Ultra NVL576 Kuva 1/3

15 exaflopia FP4-päätelmään

Vastineeksi Rubin Ultra NVL576 tarjoaa 15 exaflopia FP4-päättelyyn, 5 exaflopsia FP8-koulutukseen, 1 Tt HBM4E pakettia kohden jaettuna 16 64 Gt:n pinoon ja yhteensä 144 Tt HBM4E:n kokonaiskaistanleveydellä 4,6 Pb/s.

Feynman Folgt 2028

Feynman on vihdoin uusi arkkitehtuuri vuoden 2028 jälkipuoliskolle, omistettu fyysikko Richard Phillips Feynmanille. Feynmania ei ole vielä nähty julkisella tiekartalla, ja myös Nvidia oli enemmän GTC:ssä.

Etenemissuunnitelma Feynmanin kanssa vuodelle 2028

Feynmanin etenemissuunnitelma vuodelle 2028 Kuva 1/2

Feynmanin tulisi siksi edelleen luottaa Vera-CPU:hun ”Next-Gen” -versiossa ja valitessaan kaksoisratkaisua. Kahdeksannen sukupolven NVSwitch NVL-Nextille ja uudet Network Solutions Spectrum7 ja ConnectX 10 kulkevat käsi kädessä sukupolven kanssa.

Techtip sai tietoa tästä artikkelista Nvidialta osana valmistajan järjestämää tapahtumaa San Josessa, Kaliforniassa. Yhtiö maksoi saapumis-, lähtö- ja viiden hotellimajoituksen kustannukset. Valmistajalla ei ollut vaikutusta eikä ilmoitusvelvollisuutta.

Aiheet: tekoäly Nvidia Lähde: Nvidia

Kommentoi

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *