Supercomputer El Capitan: l’ammiraglia AMD affonda Intel Aurora con 44.544 APU MI300A

Supercomputer El Capitan: l’ammiraglia affonda Intel Aurora con 44.544 APU MI300A

Supercomputer El Capitan: l'ammiraglia AMD affonda Intel Aurora con 44.544 APU MI300A

Immagine:

Il supercomputer El Capitan dotato di AMD Instinct MI300A offre il 72% di prestazioni in più rispetto all’Aurora di Intel, ma consuma 9 MW in meno. Il risultato è un sistema più del doppio dell’efficienza (GFLOP/watt), prodotto da un totale di 11.039.616 “core”, di cui solo circa un milione sono core della CPU.

Sommario Il fiore all’occhiello di AMD supera Intel Aurora con 44.544 APU MI300A Appena pronto all’uso Il 1° posto El Capitan ha tre derivati ​​Giochi informatici a milioni Non solo veloce, ma anche efficiente Ora stiamo ottimizzando ulteriormente

1° posto subito

Dall’inizio alla fine, è ancora una volta un successo magistrale quello ottenuto dai partner di questo progetto. E quasi come previsto, come hanno scherzato gli interessati durante la conferenza stampa di domenica. Alla fine, gli ostacoli più grandi sono state le approvazioni, non l’hardware. Alla fine, tutti sono visibilmente orgogliosi, incluso il CEO di AMD Lisa Su.

Gli armadi HPE equipaggiati con la già ampiamente utilizzata soluzione di rete per supercomputer HPE Slingshot (versione 11) sono stati i primi ad essere consegnati pochi mesi fa, il che significa che è stato possibile configurare l’intera rete prima dell’installazione dei primi nodi informatici (server dotati di potenza di calcolo ). . sono stati consegnati. Anche HPE ultimamente è in grande crescita: tutti e tre i principali supercomputer sono prodotti da questo produttore in una configurazione molto simile.

El Capitan per la Top500 rivelato nel novembre 2024 El Capitan per Top500 verrà presentato nel novembre 2024 (Immagine: HPE)

El Capitan ha tre rami

Tuttavia, El Capitan è unico. Ma unico non significa completamente solo, perché i posti 10, 20 e 49 del nuovo supercomputer Top500 di novembre 2024 sono, per così dire, piccole propaggini del grande sistema con hardware identico, ma su scala inferiore.

Place 10 Tuolumne, ad esempio, è un sistema aperto che servirà anche per la ricerca gratuita, mentre El Capitan scomparirà tra pochi mesi a porte chiuse per dedicarsi interamente al deterrente nucleare americano. Il sistema è stato appositamente costruito e ospitato presso il Lawrence Livermore National Laboratory (LLNL) sotto la direzione della National Nuclear Security Administration (NNSA).

Giochi di matematica in stile milioni di dollari

Attualmente sono in uso 11.136 nodi, con un totale di 44.544 APU AMD Instinct serie MI300A installate (dettagli), quattro APU per nodo. La velocità clock dei cores del processore è relativamente molto bassa, a 1,8 GHz.

Dei 11.039.616 core totali classificati nell’elenco Top500, 9.988.224 sono GPU. Sulla base delle 228 CU CDNA3 per APU specificate da AMD, ciò si traduce in 43.808 APU attive nel sistema, che offrono 1.051.392 core CPU, che matematicamente corrispondono esattamente ai core GPU e al numero totale elencato esattamente. In totale il sistema dispone anche di oltre 5,4 petabyte di memoria principale. Come sappiamo, una APU offre 128 GB di HBM3, per blade dual node sono 1.024 GB – questo è anche il caso per 43.808 APU attive.

Dettagli completi su AMD Instinct MI300A & MI300XAMD MI300A & MI300X: La nuova serie Instinct è una pietra miliare in molti settori.

In definitiva, El Capitan ha 1.742 ExaFLOP (Rmax) su un possibile 2.746 ExaFLOPS, che è definito come il valore massimo (Rpeak). Ciò rappresenta già il 63% della potenza massima, che comunque è difficilmente accessibile. L’ex numero 1 Frontier, anch’esso dotato di hardware AMD, ha raggiunto il 66% del suo valore di picco, ora ci sono 1.353 ExaFLOP – all’inizio nel 2022 erano 1,1 ExaFLOPS.

Solo in termini di specifiche, Frontier si trova ora a circa il 70% del suo picco calcolato, El Capitan a circa il 62% quando ha debuttato. Ciò li pone entrambi ben al di sopra del numero 3, Aurora di Intel. Questo equivale sempre a 1.012 ExaFLOP, il valore massimo è 1.98 ExaFLOP. Il divario tra prestazioni massime e prestazioni praticamente utilizzabili rimane significativamente più ampio in Intel. Ad oggi, il piano originale di Intel di fornire ancora una volta il supercomputer più veloce del mondo è stato completamente abbandonato.

El Capitan per la Top500 rivelato nel novembre 2024 El Capitan per Top500 verrà presentato nel novembre 2024 (Immagine: HPE)

Non solo veloce, ma anche efficiente

L’efficienza dei sistemi AMD non viene lasciata da parte, anzi. Il sistema guadagna punti anche con un consumo energetico relativamente “basso” di 29,58 megawatt. Ciò significa che il sistema consuma 5 MW in più rispetto a Frontier, ma è anche leggermente più efficiente, tanto che alla fine il valore di efficienza GFLOP/Watt è 58,89 per El Capitan e 54,98 per Frontier. Entrambi sono molto ben posizionati, ma non si avvicinano del tutto all’efficienza dei sistemi Instinct più piccoli e delle soluzioni Grace Hopper oltre la soglia dei 60. I due principali sistemi AMD sono più del doppio più efficienti di Intel Aurora. Questo consuma 38,69 megawatt per circa un ExaFLOP e raggiunge quindi solo un valore di efficienza di 26,15. L’operatore spiega che El Capitan ha finito per posizionarsi piuttosto in alto in termini di rapporto prezzo/prestazioni, nonostante un prezzo elevato a tre cifre.

LLNL prevede inoltre di continuare a utilizzare supercomputer di prim’ordine in futuro. Il prossimo sistema sarà probabilmente una soluzione exascale, parlare direttamente di zettascale non aiuta e probabilmente è ancora troppo lontano. Ma vengono presi in considerazione anche sistemi più piccoli; Per molte , questi sono semplicemente più adatti di un enorme supercomputer.

Ora continuiamo a ottimizzare

El Capitan sarà ulteriormente ottimizzato nelle prossime settimane e mesi e probabilmente ci sarà anche un benchmark Linpack che potrebbe essere incluso anche nella classifica Top500. Ciò potrebbe comportare prestazioni ancora più elevate, dopodiché il sistema verrebbe messo a porte chiuse e adempirebbe ai suoi compiti di sicurezza nazionale.

Techconseil ha ricevuto informazioni su questo da HPE e Top500 con NDA. L’unico requisito era la prima data di pubblicazione possibile.

Argomenti: AMD Processori HPE Instinct Supercomputer SC24 Economia

Lascia un commento

Your email address will not be published. Required fields are marked *

Torna in alto