Nvidia Kyber: DGX Superpod vain pakkaa telineen 6 kommenttia
Blackwell Ultra DGX -superpodin myötä Nvidia esitteli ”käyttövalmiin tekoälysupertietokoneen” Blackwell Ultra DGX -supertietokoneen kanssa, joka tarjoaa laskentatehoa tekoälyprojekteihin, joissa on 576 GPU:ta 11 EXAFLOPSissa (FP4). Kuitenkin se, mikä on edelleen jaettu neljään telineeseen, voi pian mahtua yhteen, kuten Nvidian Kyber-teline osoittaa.
Skaalaus huipulle
Skaalaus piti tehdä ennen skaalausta, Nvidian toimitusjohtaja Jensen Huang selitti yleisölle eilen. Se, mitä kuulemme, on komponenttien puristus ennen sen leveyttä. Nvidia johtaa tätä tulevaa projektia säännöllisesti tiivistetyillä telineillä ja saavuttaa alustavan huippunsa Kyber-telineellä GTC 2025 -tapahtumassa.
Kyber-teline oli puheessa vain epäsuorasti ongelma, jouduttiin kiinnittämään huomiota alaviitteisiin, jotta löytyisi telineen kehitysnimi ”Kyber” vuoden 2027 jälkipuoliskolle suunnitellun Rubin Ultra NVL576:n kuvan lisäksi. Katse sen sijaan osui nopeasti jättimäisiin numeroihin Rubin Ultran ympärillä valtavalla GPU-re Ultramoval 4-re Moval.
Kyber tekee kaiken eri tavalla
Jo pääpuheenvuorossa näkyvä Kyberin näkymä vihjasi, että Nvidia ei vain pakannut komponentteja tänne, vaan myös näyttäisi täysin erilaiselta telineessä. Vuoteen 2028 asti esitetyn tiekartan mukaisesti Nvidia oli yllättävän avoin seuraaville palvelimien sukupolville omilla GTC-messuilla ja oli jo esitellyt Kyberin ja tähän toimintaan tarvittavat uudet komponentit vain todisteena konseptista. Mutta kun otetaan huomioon se tosiasia, että Jensen Huang osoitti Rubin Ultra NVL576:n tässä rungossa kanteen, voidaan olettaa.
Kyber Rack kuva 1/8
576 GPU:ta yhdessä telineessä
Rubin Ultra NVL576 muun muassa tuo 144 sirupakettia pariksi yhteensä 576 GPU:n kanssa useiden NVLink-kytkimien kautta yhdessä telineessä. Huangin mukaan telineen energiantarve on 600 kW. Vertailun vuoksi: GB200 NVL72:ssa (ja GB300 NVL144:ssä) 132 kW ja telinettä kohti 144 GPU:ta (uusi laskentatapa GB300:lle) on jaettu 72 sirupakettiin, 36 GRACE CPUS:iin ja yhdeksään NVLink-kytkintä.
Kyber pärjää ilman nvlink-kuparikaapelia
Nvidia pyrkii siksi GPU Compression Pro -telineeseen, joka on nelinkertainen Rubin Ultralla verrattuna Rubiniin, Blackwell Ultraan ja Blackwelliin. Tätä varten telinerakenne on uusittava kokonaan, kuten Kyber vakuuttavasti osoittaa. GB300 NVL144:n ja Vera Rubin NVL144:n kanssa NVIDIA asentaa 18 laskentalokeroa, joissa on 8 GPU:ta ja 2 CPU:ta kuhunkin telineen laatikkoon, ja yhdeksän NVLink-kytkintä sijaitsevat päällekkäin kymmenen ensimmäisen ja lopun kahdeksan laskentatason välissä. Järjestelmän ”selkäranka” on 3,2 kilometriä kuparikaapeleita telineen takana, jotka yhdistävät laskenta-alustat NVLink-kytkimiin ja muodostavat ”yhden suuren GPU:n”.
GB300 NVL72 takaapäin kuparikaapeleilla NVLink-kytkimille Kuva 1/3
Kyber ei vain rakenna runoilijoita, vaan myös pärjää ilman näitä kaapeleita. Levyjen sijaan Nvidia luottaa laskenta- ja nvlink-kytkimiin, joita käännetään 90 astetta kuin kirjoja hyllyssä. Kyber pystyy absorboimaan neljä 18 laskentalevyn lohkoa eli yhteensä 72 laskentalevyä. Kyberissä jokaisen laskentalevyn rakennesyvyys on vain noin puolet Blackwell-lautasiin verrattuna, koska NVIDIA siirtyy hybridi-nesterakenteesta ainutlaatuiseen nestejäähdytteiseen rakenteeseen, joka ei enää vaadi perinteistä jäähdytyselementtiä ja tuuletinta. Tällä kertaa nestejäähdytys todella sisältää kaikki komponentit, eli ei vain GPU:t ja CPU:t, vaan myös tallennustilan, DPU:n, verkottumisen ja paljon muuta, joten fanien ei enää tarvitse räjäyttää levyjä.
Keskitasopiirilevy uutena keskitasoosana
Mutta missä Kyberissä tarvitaan NVLink-kytkimiä? Näitä ovat standardiyhteensopivien telineiden rakennesyvyyden toinen puolisko mitattuna suoraan laskentaterien takana. Näiden kahden välissä on kohtisuorassa edestä ja takaa suoritettaviin teriin nähden uusi keskikentän piirilevy, jonka molemmilla puolilla on kosketuspisteet, jotka rekisteröivät laskentalevyt edestä ja takaa NVLink-kytkentälevyt vastaavilla liitososilla. Tällä telineen alueella toimii myös nestejäähdytys, jossa kummassakin on kummankin laskennan ja nvlink-kytkimen liitännät. Lopputuloksena GPU-määrien osalta syntyy teline, jossa on 144 sirupakettia yhteensä 576 GPU:ta varten, koska Rubin Ultra neljä kahden GPU:n sijaan muodostaa sirupaketin.
Rakennuspalikat Kyber Rackissa Kuva 1/3
Blackwell Ultra DGX Superpod
Tänä vuonna Nvidian asiakkaiden on kuitenkin edelleen oltava ”tyytyväisiä” GTC:ssä julkistettuun Blackwell Ultra DGX -superpodiin, joka tarjoaa myös 576 GPU:ta, mutta jakaa ne silti neljälle telineelle hybridijäähdytyksellä. Nvidia markkinoi uutta superpodia ”AI-supertietokoneena laatikossa”, joka 576 Blackwell-Ultra-GPUS:lla ja 288 Grace-suorittimella saavuttaa FP4:lle 11,5 exaflopsin laskentatehon. Nvidian yhteistyökumppaneiden odotetaan tarjoavan Blackwell Ultra DGX -superpodin myöhemmin tänä vuonna.
Nvidia Blackwell Ultra Dgx Superpod (Kuva: Nvidia)
Techtip sai tietoa tästä artikkelista Nvidialta osana valmistajan järjestämää tapahtumaa San Josessa, Kaliforniassa. Yhtiö maksoi saapumis-, lähtö- ja viiden hotellimajoituksen kustannukset. Valmistajalla ei ollut vaikutusta eikä ilmoitusvelvollisuutta.
Aiheet: näytönohjaimet tekoäly nvidia nvidia gtc 2025

Koulutukseltaan insinööri Alexandre jakaa tietämystään näytönohjaimien suorituskyvystä pelaamiseen ja luovaan työhön.