Blackwell Ultra: Nvidia GB300 har 288 GB HBM3e og 1,4 kW pr. GPU 46 kommentarer
Billede: Nvidia
Tekniske data for opgraderingen til Blackwell Ultra kommer fra den taiwanske forsyningskæde. Nvidia havde allerede annonceret mid-cycle opdateringen af Blackwell-arkitekturen på Computex i juni, og nu er detaljer for GB300, såsom mængden af installeret HBM3e (288 GB) eller forbruget pr. GPU (1.400 watt) afsløret.
Producenten meddelte investorerne for omkring et år siden, at Nvidia ville fremskynde tempoet med at introducere nye løsninger til AI-supercomputing. Under Computex keynote i juni i år var CEO Jensen Huang overraskende åben og gav publikum et glimt af Blackwells efterfølgere, Blackwell Ultra, Rubin og Rubin Ultra de næste par år.
Blackwell Ultra med 288 GB HBM3e
Som et resultat er Blackwell Ultra mid-cycle-opdateringen planlagt til næste år. Nvidia havde allerede officielt annonceret funktionen „8S HBM3e 12H‟ til dette formål. Det betyder: 8 HBM3e stakke, hver med 12 lag, er brugt. Hukommelsesudvidelse per GPU forventes at stige fra de nuværende 192 GB til 288 GB, rapporterer Taiwans Economic Daily med henvisning til forsyningskæden.
Tallet på 288 GB er dog ikke overraskende, da Blackwell (uden Ultra) i øjeblikket bruger 8 stakke af HBM3e, hver med 8 lag, hvilket bringer det til 192 GB med 50 % flere lag med Blackwell Ultra betyder 50 % mere hukommelse og derfor 288 GB .
TDP stiger moderat
Economic Daily-rapporten fokuserer hovedsageligt på GB300, efterfølgeren til GB200 superchippen. Det er det, Nvidia kalder kortet med to B200 GPU’er og en Grace CPU. 36 af disse kort udgør GB200 NVL72, et tæt, vandkølet rack med 72 Blackwell GPU’er, 36 Grace CPU’er, 13,5 TB HBM3e og op til 1.440 PetaFLOPS ydeevne (FP4 Tensor Core Sparse). Hvert Superchip-kort har en konfigurerbar TDP på 2.700 watt. Dette er vigtigt, når det kommer til Blackwell Ultra.
Artiklen viser en TDP på 1.400 watt for B300 GPU. Det lyder af meget, men det er ikke meget mere end B200. To Blackwell Ultra GPU’er ville nå op på maksimalt 2.800 watt, og det ville så være nødvendigt at tilføje Grace CPU’en og andre komponenter på kortet for at kunne sammenligne forbruget med den tidligere Superchip GB200. Det er forudsigeligt, at forbruget pr. kort bliver højere, men forskellen bliver ikke dramatisk, hvis vi sammenligner det med stigningen i ydeevnen. FP4-ydeevnen ville stige med 50 % til 2.160 PetaFLOPS med Blackwell Ultra ved brug af sparsom acceleration.
LPCAMM til Grace-processoren
Ud over GPU’ernes HBM3e er der også loddet 480 GB LPDDR5X til Grace-processoren på hver Superchip GB200. Den næste generation vil introducere den modulære LPCAMM, der fra starten er beregnet til bærbare computere, desktops og servere.
Ændringer i køling og energilagring
For nye AI-servere udstyret med Blackwell Ultra forventes antallet af universal quick disconnects (UQD) til vandkøling at blive øget, hvilket gør systemet mere modulært. I de nye stativer vil der også blive skabt plads til batteribackup-enheder (BBU’er) og superkondensatorer for at bruge denne energi til at afbøde udfald.
Netværk forventes at fordobles til 1,6 Tbps
Derudover planlægger Nvidia at fordoble den næste netværkshastighed til 1,6 Tbps. The Economic Daily sætter en opgradering i spil fra den gamle ConnectX-7 InfiniBand-adapter til ConnectX-8. Ifølge Computex roadmap fra juni var der kun planlagt 1,6 Tbit/s til Rubin-platformen og dens ConnectX-9, der forventes næste år. ConnectX-8 bruges også allerede i nuværende Blackwell-løsninger og giver 800 Gbps båndbredde.
Emner: Grafikkort Kunstig intelligens Nvidia Nvidia Blackwell Kilde: Economic Daily

Alexandre, uddannet ingeniør, deler sin viden om GPU-ydeevne til gaming og kreativt arbejde.