El Capitan superdator: AMD flaggskepp sänker Intel Aurora med 44 544 MI300A APU:er

El Capitan superdator: flaggskepp sänker Aurora med 44 544 MI300A APU:er

El Capitan superdator: AMD flaggskepp sänker Intel Aurora med 44 544 MI300A APU:er

Bild:

Superdatorn El Capitan utrustad med AMD Instinct MI300A erbjuder 72 % mer prestanda än Intels Aurora, men förbrukar 9 MW mindre. Resultatet är ett system som är mer än dubbelt så effektivt (GFLOP/watt), producerat av totalt 11 039 616 ”kärnor”, varav endast cirka en miljon CPU-kärnor.

Innehållsförteckning AMD:s flaggskepp slår ut Intel Aurora med 44 544 APU:er MI300A direkt ur lådan 1:a plats El Capitan har tre utlöpare Datorspel på samma sätt som miljoner Inte bara snabbt, utan också effektivt. Vi optimerar nu ytterligare

1:a plats direkt

Från början till slut är det återigen en mästerlig framgång som partnerna i detta projekt har uppnått. Och nästan som väntat, som de inblandade skämtade under söndagens pressträff. I slutändan var de största hindren godkännanden, inte hårdvara. I slutändan är alla synligt stolta, inklusive AMD:s vd Lisa Su.

HPE-skåp utrustade med den redan allmänt använda HPE Slingshot superdatornätverkslösningen (version 11) var de första som levererades för några månader sedan, vilket innebar att hela nätverket kunde konfigureras innan installationen av de första datornoderna (servrar utrustade med datorkraft) ). . levererades. HPE är också på gång på sistone: alla de tre bästa superdatorerna tillverkas av denna tillverkare i en mycket liknande konfiguration.

El Capitan för Top500 avslöjades i november 2024 El Capitan för Top500 avtäckande i november 2024 (Bild: HPE)

El Capitan har tre filialer

Ändå är El Capitan unik. Men unik betyder inte helt ensam, eftersom platserna 10, 20 och 49 av den nya Top500 superdatorn från november 2024 är så att säga små utlöpare av det stora systemet med identisk hårdvara, men i lägre skala.

Place 10 Tuolumne är till exempel ett öppet system som även ska användas för fri forskning, medan El Capitan försvinner bakom stängda dörrar om några månader för att helt ägna sig åt det amerikanska kärnvapenavskräckningsmedlet. Systemet var uttryckligen specialbyggt och värd vid Lawrence Livermore National Laboratory (LLNL) under ledning av National Nuclear Security Administration (NNSA).

Matematikspel i miljon dollar stil

11 136 noder används nu, med totalt 44 544 AMD Instinct MI300A-serien APU (detaljer) installerade – fyra APU per nod. Klockhastigheten för processorkärnorna är jämförelsevis mycket låg, på 1,8 GHz.

Av de totalt 11 039 616 kärnorna rankade i Top500-listan är 9 988 224 GPU:er. Baserat på de 228 CDNA3 CUs per APU som specificeras av AMD, resulterar detta i 43 808 aktiva APU:er i systemet, som erbjuder 1 051 392 CPU-kärnor, vilket matematiskt matchar GPU-kärnorna och det totala antalet listade exakt. Totalt har systemet också över 5,4 petabyte huvudminne. Som vi vet erbjuder en APU 128 GB HBM3, per dubbelnodblad är det 1 024 GB – detta är också fallet för 43 808 aktiva APU:er.

Fullständig information om AMD Instinct MI300A & MI300XAMD MI300A & MI300X: Den nya Instinct-serien är en milstolpe på många områden.

I slutändan har El Capitan 1,742 ExaFLOPs (Rmax) av möjliga 2,746 ExaFLOPS, vilket definieras som det maximala värdet (Rpeak). Detta representerar redan 63 procent av den maximala effekten, som ändå knappast är tillgänglig. Den tidigare nummer 1 Frontier, även utrustad med AMD-hårdvara, har nått 66% av sitt toppvärde, det finns nu 1 353 ExaFLOPs – vid starten 2022 var det 1,1 ExaFLOPS.

Bara när det gäller specifikationer ligger Frontier nu på cirka 70 % av sin beräknade topp, El Capitan på cirka 62 % när den debuterade. Detta placerar dem båda långt före nummer 3, Intels Aurora. Detta uppgår alltid till 1,012 ExaFLOP, maxvärdet är 1,98 ExaFLOP. Gapet mellan maximal prestanda och praktiskt användbar prestanda är fortfarande betydligt större hos Intel. Hittills har Intels ursprungliga plan att återigen leverera världens snabbaste superdator helt övergivits.

El Capitan för Top500 avslöjades i november 2024 El Capitan för Top500 avtäckande i november 2024 (Bild: HPE)

Inte bara snabbt, utan också effektivt

Effektiviteten hos AMD-system lämnas inte åt sidan, snarare tvärtom. Systemet får också poäng med en relativt ”låg” strömförbrukning på 29,58 megawatt. Det betyder att systemet förbrukar 5 MW mer än Frontier, men är också något mer effektivt, så att GFLOP/Watt effektivitetsvärdet i slutändan är 58,89 för El Capitan och 54,98 för Frontier . Båda är mycket välpositionerade, men de kommer inte riktigt i närheten av att matcha effektiviteten hos de mindre Instinct-systemen och Grace Hopper-lösningarna över 60-strecket. De två bästa AMD-systemen är mer än dubbelt så effektiva än Intel Aurora. Denna använder 38,69 megawatt för ungefär en ExaFLOP och uppnår därmed bara ett effektivitetsvärde på 26,15. Operatören förklarar att El Capitan hamnade ganska högt i pris/prestanda, trots en hög tresiffrig prislapp.

LLNL planerar också att fortsätta använda superdatorer av högsta klass i framtiden. Nästa system blir förmodligen en exascale-lösning, att prata direkt om zettascale är inte till hjälp och är förmodligen fortfarande för långt borta. Men även mindre system övervägs; För många applikationer är dessa helt enkelt bättre lämpade än en enorm superdator.

Nu fortsätter vi att optimera

El Capitan kommer att optimeras ytterligare under de kommande veckorna och månaderna, och det kommer sannolikt också att finnas ett Linpack-riktmärke som också kan inkluderas i Top500-rankingen. Detta skulle kunna resultera i ännu högre prestanda, varefter systemet skulle placeras bakom stängda dörrar och uppfylla sina nationella säkerhetsuppgifter.

Techconseil fick information om denna artikel från HPE och Top500 under NDA. Det enda kravet var tidigast möjliga publiceringsdatum.

Ämnen: AMD HPE Instinct- SC24 superdatorer Ekonomi

Lämna en kommentar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *

Rulla till toppen