Nvidia Kyber: En DGX Superpod komprimerer bare et stativ med 6 kommentarer
Med Blackwell Ultra DGX superpod præsenterede Nvidia en „klar-til-brug AI-supercomputer‟ med Blackwell Ultra DGX-supercomputeren, som leverer computerkraft til AI-projekter med 576 GPU’er på 11 EXAFLOPS (FP4). Det, der stadig er spredt ud over fire racks, kan dog snart passe ind i ét, som Nvidias Kyber-rack viser.
Skalering kørt til toppen
Skalering skulle udføres før skalering, forklarede Nvidia CEO Jensen Huang til publikum i går. Det, vi hører, er en komprimering af komponenterne før dens bredde. Nvidia leder dette kommende projekt med regelmæssigt komprimerede stativer og når det foreløbige højdepunkt med Kyber-racket ved GTC 2025.
Kyber-reolen var kun indirekte et problem for snakken, man skulle være meget opmærksom på fodnoterne for at finde udviklingsnavnet på stativet „Kyber‟ ud over billedet af Rubin Ultra NVL576, der var planlagt til anden halvdel af 2027. I stedet faldt blikket hurtigt på de gigantiske tal omkring Rubin Ultra med en kæmpe 4-gigantisk GPU.
Kyber gør alting anderledes
Allerede frontbilledet af Kyber, der blev vist på keynoten, antydede, at Nvidia ikke kun pakkede komponenterne her, men også ville se helt anderledes ud i racket. Analogt med den angivne køreplan indtil 2028, var Nvidia overraskende åben for de næste generationer af servere på sin egen GTC-messe og havde allerede udstillet Kyber og de nye komponenter, der kræves til denne aktivitet, kun som et proof of concept. Men taget i betragtning, at Jensen Huang viste, at Rubin Ultra NVL576 i dette chassis til coveret, kan det formodes.
Kyber Rack Billede 1 af 8
576 GPU’er i et enkelt rack
Rubin Ultra NVL576, blandt andre, bringer 144 chippakker parret med i alt 576 GPU’er gennem flere NVLink-switche i et enkelt rack. Ifølge Huang har stativet et energibehov på 600 kW. Til sammenligning: med GB200 NVL72 (og GB300 NVL144) er 132 kW og pr. rack 144 GPU’er (ny tællemetode for GB300) opdelt i 72 chippakker, 36 GRACE CPU’er og ni NVLink-switche.
Kyber kan undvære et nvlink kobberkabel
Nvidia stræber derfor efter et GPU Compression Pro-rack med en faktor 4x med Rubin Ultra sammenlignet med Rubin, Blackwell Ultra og Blackwell. For at gøre dette skal stativstrukturen have en fuldstændig overhaling, som Kyber på imponerende vis demonstrerer. Med GB300 NVL144 og Vera Rubin NVL144 installerer NVIDIA de 18 computerbakker med 8 GPU’er og 2 CPU’er i hver af skufferne i racket, de ni NVLink-switche ligger oven på hinanden mellem de første ti og de resterende otte computerbakker. Systemets „rygrad‟ er 3,2 kilometer kobberkabler på bagsiden af racket, som forbinder computerbakkerne med NVLink-switcherne for at skabe „én stor GPU.
GB300 NVL72 bagfra med kobberkabler til NVLink-switche Billede 1 af 3
Kyber bygger ikke kun digtere, men klarer sig også uden disse kabler. I stedet for plader er Nvidia afhængig af blade til compute- og nvlink-switcherne, som roteres 90 grader som bøger på en hylde. Kyber kan absorbere fire blokke med 18 computerblade til i alt 72 computerblade. Hos Kyber har hvert computerblad kun omkring halvdelen af byggedybden sammenlignet med Blackwell-plader, da NVIDIA bevæger sig fra en hybrid flydende struktur til en unik væskekølet struktur, der ikke længere kræver en konventionel heatsink og ventilator. Denne gang inkluderer væskekøling virkelig alle komponenter, det vil sige ikke kun GPU’er og CPU’er, men også storage, DPU, netværk og meget mere, så fansene ikke længere skal sprænge boards.
Midplane PCB som en ny midplane del
Men hvor kræves NVLink-switche i Kyber? Disse omfatter den anden halvdel af byggedybden af standard-kompatible stativer med hensyn til dimensioner direkte bag computerbladene. Mellem de to ligger vinkelret på bladene, som udføres forfra og bagfra, et nyt midtbaneprint med kontaktpunkter på begge sider til at registrere computerbladene forfra og bagved NVLink-omskifterbladene med tilsvarende forbindelsesdele. I dette område af stativet fungerer væskekøling, hver med begge tilslutninger af hver computer og nvlink-switch, også. I det endelige resultat, hvad angår antallet af GPU’er, oprettes et rack med 144 chippakker til i alt 576 GPU’er, fordi Rubin Ultra fire i stedet for to GPU’er danner en chippakke.
Byggeklodser ved Kyber Rack Billede 1 af 3
Blackwell Ultra DGX Superpod
I år skal Nvidia-kunder dog stadig „være tilfredse‟ med Blackwell Ultra DGX superpod annonceret på GTC, som også byder på 576 GPU’er, men stadig distribuerer dem på tværs af fire racks med hybrid køling. Den nye superpod markedsføres af Nvidia som en „AI-supercomputer i kassen‟, der med 576 Blackwell-Ultra-GPUS og 288 Grace CPU’er opnår en regnekraft på 11,5 exaflops til FP4. Blackwell Ultra DGX superpod forventes at blive tilbudt af Nvidia-partnere senere i år.
Nvidia Blackwell Ultra Dgx Superpod (Billede: Nvidia)
Techtip modtog information om denne artikel fra Nvidia som en del af en begivenhed af producenten i San Jose, Californien. Udgifterne til ankomst, afgang og fem hotelovernatninger blev afholdt af selskabet. Der var ingen indflydelse fra producenten og heller ikke pligt til at indberette.
Emner: grafikkort kunstig intelligens nvidia nvidia gtc 2025

Alexandre, uddannet ingeniør, deler sin viden om GPU-ydeevne til gaming og kreativt arbejde.