El Capitan supercomputer: AMD flagskib sænker Intel Aurora med 44.544 MI300A APU’er
Billede: HPE
El Capitan supercomputeren udstyret med AMD Instinct MI300A tilbyder 72 % mere ydeevne end Intels Aurora, men forbruger 9 MW mindre. Resultatet er et system, der er mere end dobbelt så effektivt (GFLOP/watt), produceret af i alt 11.039.616 “kerner”, hvoraf kun omkring en million er CPU-kerner.
Indholdsfortegnelse AMD’s flagskib slår Intel Aurora ud med 44.544 APU’er MI300A Lige ud af kassen 1. pladsen El Capitan har tre udløbere Computerspil som millioner Ikke kun hurtigt, men også effektivt. Vi optimerer nu yderligere
1. pladsen med det samme
Fra start til slut er det endnu en gang en mesterlig succes, som partnerne i dette projekt har opnået. Og næsten som forventet, som de involverede jokede under søndagens pressebriefing. I sidste ende var de største forhindringer godkendelser, ikke hardware. I sidste ende er alle synligt stolte, inklusive AMDs administrerende direktør Lisa Su.
HPE kabinetter udstyret med den allerede meget brugte HPE Slingshot supercomputer netværksløsning (version 11) var de første, der blev leveret for et par måneder siden, hvilket betyder, at hele netværket kunne konfigureres før installationen af de første computerknudepunkter (servere udstyret med computerkraft). ). . blev leveret. HPE er også på vej på det seneste: alle de tre bedste supercomputere er produceret af denne producent i en meget lignende konfiguration.
El Capitan for Top500 afsløring i november 2024 (Billede: HPE)
El Capitan har tre filialer
Ikke desto mindre er El Capitan unik. Men unikt betyder ikke helt alene, for pladserne 10, 20 og 49 af den nye Top500 supercomputer fra november 2024 er så at sige små udløbere af det store system med identisk hardware, men i en lavere skala.
Place 10 Tuolumne er for eksempel et åbent system, der også skal bruges til fri forskning, mens El Capitan forsvinder bag lukkede døre om få måneder for helt at hellige sig den amerikanske atomafskrækkelse. Systemet var eksplicit specialbygget og hostet på Lawrence Livermore National Laboratory (LLNL) under ledelse af National Nuclear Security Administration (NNSA).
Matematikspil i million dollar stil
11.136 noder er nu i brug, med i alt 44.544 AMD Instinct MI300A Series APU’er (detaljer) installeret – fire APU’er pr. node. Processorkernernes clockhastighed er forholdsvis lav ved 1,8 GHz.
Af de i alt 11.039.616 kerner rangeret på Top500-listen, er 9.988.224 GPU’er. Baseret på de 228 CDNA3 CU’er pr. APU specificeret af AMD, resulterer dette i 43.808 aktive APU’er i systemet, som tilbyder 1.051.392 CPU-kerner, som matematisk matcher GPU-kernerne og det samlede antal angivet nøjagtigt. I alt har systemet også over 5,4 petabyte hovedhukommelse. Som vi ved, tilbyder en APU 128 GB HBM3, pr. dobbeltknudeblad er det 1.024 GB – dette er også tilfældet for 43.808 aktive APU’er.
Alle detaljer om AMD Instinct MI300A & MI300XAMD MI300A & MI300X: Den nye Instinct-serie er en milepæl på mange områder.
I sidste ende har El Capitan 1.742 ExaFLOPs (Rmax) ud af mulige 2.746 ExaFLOPS, som er defineret som den maksimale værdi (Rpeak). Dette repræsenterer allerede 63 procent af den maksimale effekt, som alligevel næppe er tilgængelig. Den tidligere nummer 1 Frontier, også udstyret med AMD-hardware, har nået 66% af sin peak-værdi, der er nu 1.353 ExaFLOPs – ved starten i 2022 var det 1,1 ExaFLOPS.
Alene med hensyn til specifikationer ligger Frontier nu på omkring 70 % af dens beregnede top, El Capitan på omkring 62 %, da den debuterede. Dette placerer dem begge et godt stykke foran nummer 3, Intels Aurora. Dette svarer altid til 1,012 ExaFLOP, den maksimale værdi er 1,98 ExaFLOP. Kløften mellem maksimal ydeevne og praktisk anvendelig ydeevne er fortsat betydeligt større hos Intel. Til dato er Intels oprindelige plan om igen at levere verdens hurtigste supercomputer blevet fuldstændig opgivet.
El Capitan for Top500 afsløring i november 2024 (Billede: HPE)
Ikke kun hurtig, men også effektiv
Effektiviteten af AMD-systemer er ikke tilsidesat, tværtimod. Systemet scorer også point med et relativt “lavt” strømforbrug på 29,58 megawatt. Det betyder, at systemet forbruger 5 MW mere end Frontier, men også er lidt mere effektivt, så GFLOP/Watt effektivitetsværdien i sidste ende er 58,89 for El Capitan og 54,98 for Frontier . Begge er meget godt placeret, men de kommer ikke helt i nærheden af at matche effektiviteten af de mindre Instinct-systemer og Grace Hopper-løsninger ud over 60-mærket. De to øverste AMD-systemer er mere end dobbelt så effektive end Intel Aurora. Dette bruger 38,69 megawatt til cirka én ExaFLOP og opnår dermed kun en effektivitetsværdi på 26,15. Operatøren forklarer, at El Capitan endte med at rangere ret højt i pris/ydelse, på trods af et højt trecifret prisskilt.
LLNL planlægger også at fortsætte med at bruge supercomputere i topklasse i fremtiden. Det næste system vil formentlig være en exascale løsning, at tale direkte om zettascale er ikke nyttigt og er sandsynligvis stadig for langt væk. Men mindre systemer overvejes også; Til mange applikationer er disse simpelthen bedre egnede end en kæmpe supercomputer.
Nu fortsætter vi med at optimere
El Capitan vil blive yderligere optimeret i de kommende uger og måneder, og der vil sandsynligvis også være et Linpack-benchmark, som muligvis også kan indgå på Top500-ranglisten. Dette kunne resultere i endnu højere ydeevne, hvorefter systemet ville blive sat bag lukkede døre og opfylde sine nationale sikkerhedsopgaver.
Techconseil modtog information om denne artikel fra HPE og Top500 under NDA. Det eneste krav var den tidligst mulige udgivelsesdato.
Emner: AMD grafikkort HPE Instinct processorer SC24 supercomputere Økonomi
Marc afdækker processorer ved at teste deres ydeevne til gaming, indholdsproduktion og kunstig intelligens.