Fujitsu Monaka: Uutisia Japanin 144-ytimen supersirusta 28 kommenttia
Kuva: Satoshi Matsuoka (X)
Japanissa kehitetään uutta supertietokonepiiriä. Tämä on nimeltään Monaka, ja siinä on 144 ydintä, jotka on jaettu piirisarjoihin, ja se on Fujitsun seuraava Arm-prosessori korkean suorituskyvyn laskennan (HPC) segmentille A64FX:n jälkeen. Jälkimmäinen toimii entisessä maailman nopeimmassa supertietokoneessa nimeltä Fugaku.
Uusia yksityiskohtia Fujitsu Monakasta
Professori Satoshi Matsuoka, joka johtaa RIKEN Center for Computational Science (R-CCS) -keskusta Kobessa, Japanissa, jossa Fugaku-supertietokone toimii, jakoi kuvan uudesta Fujitsu Monaka -sirusta ”mekaanisena näytteenä”, jossa siru koostuu useista sirujen mukaan kootut muotit näkyvät selvästi oheisessa kaaviossa.
Keskellä on siis 5nm:ssä valmistettu iso I/O-siru, joka tarjoaa liitännät, joihin kuuluu myös PCIe 6.0 tai siihen perustuva Compute Express Link (CXL) versio 3.0.
Fujitsu Monaka (Kuva: Fujitsu)
SRAM-siruja (myös 5nm) on jaettu ympäriinsä neljä, jotka sisältävät viimeisen tason välimuistin. Yläpuolella ovat itse CPU-ytimet, jotka on valmistettava vielä ohuemmalla 2 nm:n prosessilla. Jokainen näistä neljästä suulakkeesta sisältää 36 ydintä, sillä Monakan odotetaan tarjoavan yhteensä 144 ydintä. Se ei ole aivan se 150 ydintä, mitä odotimme, mutta se on iso askel eteenpäin Fujitsu A64FX:n 48 ytimestä.
Fujitsu Monaka (Kuva: Fujitsu)
Monakan on ennen kaikkea oltava tehokas
Tavoitteena on tietysti lisätä laskentatehoa uudella prosessorilla. Ennakkoon ilmoitettiin, että sovelluksen suorituskyky olisi julkaisuvuonna 1,7 kertaa parempi kuin kilpailevilla tuotteilla. Monakan sanotaan nyt olevan kaksi kertaa nopeampi kuin kilpailijansa vuonna 2027. Mistä tiedämme sen nyt, on kuitenkin toinen asia. Tämä on vain karkea arvio.
Energiatehokkuus teholla wattia kohden olisi myös kaksinkertainen kilpailijoihin verrattuna. Fujitsu puhuu ”Ultra Low Voltage”, kun taas A64FX sanoo vain ”Low Voltage”. Lisäksi puhtaan ilmajäähdytyksen pitäisi riittää tällä kertaa ilma- ja vesijäähdytyksen yhdistelmän sijaan. Energiatehokkuus on japanilaisten kohdalla listan kärjessä.
HBM ei ole enää käytössä
Vaikka A64FX on edelleen varustettu nopealla HBM2-muistilla, Monakan seuraajalla on vain DDR5 RAM. Jaettu 12 kanavalle, kuten AMD:n ja Intelin HPC-prosessoreille, tämä tarkoittaa silti vain noin puolta suorituskyvystä, mutta tekee alustasta lopulta halvemman.
Edeltäjä A64FX
Kesäkuussa 2020 japanilainen supertietokone Fugaku nousi 500 parhaan järjestelmän valtaistuimelle yli 400 PetaFLOPS:lla, mikä oli tuolloin suuri etumatka (toinen sija ei saavuttanut edes 150 PetaFLOPSia). Fugaku pysyi huipulla kaksi vuotta ja korvattiin vasta kesäkuussa 2022 American Frontier -järjestelmällä, jossa oli yli 1 000 PetaFLOPSia. Viimeisimmässä maailmanlistauksessa marraskuusta 2024 Fugaku sijoittuu edelleen kuudenneksi, mikä on erittäin vaikuttavaa 4,5 vuoteen siitä, kun se oli listalla.
”Fugaku”-supertietokoneen A64FX-prosessori (Kuva: Fujitsu)
Fugaku ei saavuttanut tuolloin vertaansa vailla olevaa laskentatehoaan GPU-pohjaisten tietokonekiihdyttimien avulla, kuten Frontierin ja suurimman osan 10 parhaan joukosta. Sen sijaan käytetään 48-ytimen prosessorien armadaa. Jokainen 158 976 laskentasolmusta sisältää 48-ytimisen A64FX-prosessorin. Fujitsun yhteistyössä Armin kanssa kehittämässä sirussa käytettiin ensimmäistä kertaa ARMv8.2-A SVE (Scalable Vector Extension) -käskysarjalaajennusta. Seuraajalla on ARMv9 ja SVE2.
Top 10 nopeinta supertietokonetta Top500.org-sijoituksen mukaan (edellinen) Järjestelmän sijainnin laskentateho (Rmax) Prosessorit Top500 Record 1 (-) El Capitan USA 1 742,00 PetaFLOPS AMD Epyc 4th Gen (24C, 1,8 GHz)
AMD Instinct MI300A marraskuu 2024 2 (1) Frontier USA 1 353,00 PetaFLOPS AMD Epyc 3rd Gen (64C, 2,0 GHz)
AMD Instinct MI250X kesäkuu 2022 3 (2) Aurora USA 1 012,00 PetaFLOPS Intel Xeon Max 9470 (52C, 2,4 GHz)
Intel GPU Max 1550 (?) Marraskuu 2023 4 (3) Eagle USA 561.20 PetaFLOPS Intel Xeon Platinum 8480C (48C, 2,0 GHz)
Nvidia H100 marraskuu 2023 5 (-) HPC6 Italian 477.90 PetaFLOPS AMD Epyc 3. sukupolvi (64C, 2.0 GHz)
AMD Instinct MI250X marraskuu 2024 6 (4) Fugaku Japan 442.01 PetaFLOPS Fujitsu A64FX (48C, 2.2 GHz) Kesäkuu 2020 7 (6) Alps Sveitsi 434.90 PetaFLOPS Nvidia Grace, 3.
Nvidia GH200 kesäkuu 2024 8 (5) LUMI Finland 379.70 PetaFLOPS AMD Epyc 3rd Gen (64C, 2.0 GHz)
AMD Instinct MI250X kesäkuu 2022 9 (6) Leonardo Italian 241.20 PetaFLOPS Intel Xeon Platinum 8358 (32C, 2,6 GHz)
Nvidia A100 marraskuu 2022 10 (-) Tuolumne USA 208.10 PetaFLOPS AMD Epyc 4. sukupolvi (24C, 1,8 GHz)
AMD Instinct MI300A marraskuu 2024 Muutokset edellisestä listauksesta lihavoituna
Marc analysoi prosessoreita testaamalla niiden suorituskykyä pelaamiseen, sisällöntuotantoon ja tekoälyyn.