Nvidia Kyber: DGX-superpod pakkaa vain yhden telineen

Kyber: DGX Superpod vain pakkaa telineen 6 kommenttia

Nvidia Kyber: DGX-superpod pakkaa vain yhden telineen

Blackwell Ultra DGX -superpodin myötä Nvidia esitteli ”käyttövalmiin tekoälysupertietokoneen” Blackwell Ultra DGX -supertietokoneen kanssa, joka tarjoaa laskentatehoa tekoälyprojekteihin, joissa on 576 GPU:ta 11 EXAFLOPSissa (FP4). Kuitenkin se, mikä on edelleen jaettu neljään telineeseen, voi pian mahtua yhteen, kuten Nvidian Kyber-teline osoittaa.

Skaalaus huipulle

Skaalaus piti tehdä ennen skaalausta, Nvidian toimitusjohtaja Jensen Huang selitti yleisölle eilen. Se, mitä kuulemme, on komponenttien puristus ennen sen leveyttä. Nvidia tätä tulevaa projektia säännöllisesti tiivistetyillä telineillä ja saavuttaa alustavan huippunsa Kyber-telineellä GTC 2025 -tapahtumassa.

Kyber-teline oli puheessa vain epäsuorasti ongelma, jouduttiin kiinnittämään huomiota alaviitteisiin, jotta löytyisi telineen kehitysnimi ”Kyber” vuoden 2027 jälkipuoliskolle suunnitellun Rubin Ultra NVL576:n kuvan lisäksi. Katse sen sijaan osui nopeasti jättimäisiin numeroihin Rubin Ultran ympärillä valtavalla GPU-re Ultramoval 4-re Moval.

Kyber tekee kaiken eri tavalla

Jo pääpuheenvuorossa näkyvä Kyberin näkymä vihjasi, että Nvidia ei vain pakannut komponentteja tänne, vaan myös näyttäisi täysin erilaiselta telineessä. Vuoteen 2028 asti esitetyn tiekartan mukaisesti Nvidia oli yllättävän avoin seuraaville palvelimien sukupolville omilla GTC-messuilla ja oli jo esitellyt Kyberin ja tähän toimintaan tarvittavat uudet komponentit vain todisteena konseptista. Mutta kun otetaan huomioon se tosiasia, että Jensen Huang osoitti Rubin Ultra NVL576:n tässä rungossa kanteen, voidaan olettaa.

kyber teline

Kyber Rack kuva 1/8

576 GPU:ta yhdessä telineessä

Rubin Ultra NVL576 muun muassa tuo 144 sirupakettia pariksi yhteensä 576 GPU:n kanssa useiden NVLink-kytkimien kautta yhdessä telineessä. Huangin mukaan telineen energiantarve on 600 kW. Vertailun vuoksi: GB200 NVL72:ssa (ja GB300 NVL144:ssä) 132 kW ja telinettä kohti 144 GPU:ta (uusi laskentatapa GB300:lle) on jaettu 72 sirupakettiin, 36 GRACE CPUS:iin ja yhdeksään NVLink-kytkintä.

Kyber pärjää ilman nvlink-kuparikaapelia

Nvidia pyrkii siksi GPU Compression Pro -telineeseen, joka on nelinkertainen Rubin Ultralla verrattuna Rubiniin, Blackwell Ultraan ja Blackwelliin. Tätä varten telinerakenne on uusittava kokonaan, kuten Kyber vakuuttavasti osoittaa. GB300 NVL144:n ja Vera Rubin NVL144:n kanssa NVIDIA asentaa 18 laskentalokeroa, joissa on 8 GPU:ta ja 2 CPU:ta kuhunkin telineen laatikkoon, ja yhdeksän NVLink-kytkintä sijaitsevat päällekkäin kymmenen ensimmäisen ja lopun kahdeksan laskentatason välissä. Järjestelmän ”selkäranka” on 3,2 kilometriä kuparikaapeleita telineen takana, jotka yhdistävät laskenta-alustat NVLink-kytkimiin ja muodostavat ”yhden suuren GPU:n”.

GB300 NVL72 takaapäin kuparikaapeleilla NVLink-kytkimille

GB300 NVL72 takaapäin kuparikaapeleilla NVLink-kytkimille Kuva 1/3

Kyber ei vain rakenna runoilijoita, vaan myös pärjää ilman näitä kaapeleita. Levyjen sijaan Nvidia luottaa laskenta- ja nvlink-kytkimiin, joita käännetään 90 astetta kuin kirjoja hyllyssä. Kyber pystyy absorboimaan neljä 18 laskentalevyn lohkoa eli yhteensä 72 laskentalevyä. Kyberissä jokaisen laskentalevyn rakennesyvyys on vain noin puolet Blackwell-lautasiin verrattuna, koska NVIDIA siirtyy hybridi-nesterakenteesta ainutlaatuiseen nestejäähdytteiseen rakenteeseen, joka ei enää vaadi perinteistä jäähdytyselementtiä ja tuuletinta. Tällä kertaa nestejäähdytys todella sisältää kaikki komponentit, eli ei vain GPU:t ja CPU:t, vaan myös tallennustilan, DPU:n, verkottumisen ja paljon muuta, joten fanien ei enää tarvitse räjäyttää levyjä.

Keskitasopiirilevy uutena keskitasoosana

Mutta missä Kyberissä tarvitaan NVLink-kytkimiä? Näitä ovat standardiyhteensopivien telineiden rakennesyvyyden toinen puolisko mitattuna suoraan laskentaterien takana. Näiden kahden välissä on kohtisuorassa edestä ja takaa suoritettaviin teriin nähden uusi keskikentän piirilevy, jonka molemmilla puolilla on kosketuspisteet, jotka rekisteröivät laskentalevyt edestä ja takaa NVLink-kytkentälevyt vastaavilla liitososilla. Tällä telineen alueella toimii myös nestejäähdytys, jossa kummassakin on kummankin laskennan ja nvlink-kytkimen liitännät. Lopputuloksena GPU-määrien osalta syntyy teline, jossa on 144 sirupakettia yhteensä 576 GPU:ta varten, koska Rubin Ultra neljä kahden GPU:n sijaan muodostaa sirupaketin.

Rakennuspalikat Kyber Rackissa

Rakennuspalikat Kyber Rackissa Kuva 1/3

Blackwell Ultra DGX Superpod

Tänä vuonna Nvidian asiakkaiden on kuitenkin edelleen oltava ”tyytyväisiä” GTC:ssä julkistettuun Blackwell Ultra DGX -superpodiin, joka tarjoaa myös 576 GPU:ta, mutta jakaa ne silti neljälle telineelle hybridijäähdytyksellä. Nvidia markkinoi uutta superpodia ”AI-supertietokoneena laatikossa”, joka 576 Blackwell-Ultra-GPUS:lla ja 288 Grace-suorittimella saavuttaa FP4:lle 11,5 exaflopsin laskentatehon. Nvidian yhteistyökumppaneiden odotetaan tarjoavan Blackwell Ultra DGX -superpodin myöhemmin tänä vuonna.

Nvidia Blackwell Ultra Dgx Superpod Ultra Dgx Superpod (Kuva: Nvidia)

Techtip sai tietoa tästä artikkelista Nvidialta osana valmistajan järjestämää tapahtumaa San Josessa, Kaliforniassa. Yhtiö maksoi saapumis-, lähtö- ja viiden hotellimajoituksen kustannukset. Valmistajalla ei ollut vaikutusta eikä ilmoitusvelvollisuutta.

Aiheet: näytönohjaimet tekoäly nvidia

Kommentoi

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *

Scroll to Top