Fujitsu Monaka: Nyheder om Japans 144-core superchip 28 kommentarer
Billede: Satoshi Matsuoka (X)
En ny supercomputer-chip er under udvikling i Japan. Denne hedder Monaka, har 144 kerner fordelt på chipset og bliver Fujitsus næste Arm-processor til high-performance computing (HPC) segmentet efter A64FX. Sidstnævnte tjener i det, der engang var verdens hurtigste supercomputer kaldet Fugaku.
Nye detaljer om Fujitsu Monaka
Professor Satoshi Matsuoka, der leder RIKEN Center for Computational Science (R-CCS) i Kobe, Japan, hvor Fugaku-supercomputeren opererer, delte et billede af den nye Fujitsu Monaka-chip som en „mekanisk prøve‟ på, at chippen består af flere matricer, der er blevet samlet, da chiplets er tydeligt synlige i det vedhæftede skema.
Så i midten er den store I/O-chip fremstillet i 5nm, som vil levere interfaces, som også inkluderer PCIe 6.0 eller Compute Express Link (CXL) version 3.0 baseret på den.
Fujitsu Monaka (Billede: Fujitsu)
Der er fire SRAM-chips (også 5nm) fordelt rundt omkring, som indeholder det sidste niveau cache. Selve CPU-kernerne, som skal fremstilles i en endnu tyndere 2nm-proces, sidder ovenover. Hver af disse fire dies indeholder 36 kerner, da Monaka forventes at tilbyde i alt 144 kerner. Det er ikke helt de 150 kerner, vi havde forventet, men det er et stort skridt op i forhold til Fujitsu A64FX’s 48 kerner.
Fujitsu Monaka (Billede: Fujitsu)
Monaka skal frem for alt være effektiv
Målet er selvfølgelig at øge computerkraften med den nye processor. Det blev annonceret på forhånd, at applikationens ydeevne ville være 1,7 gange højere end konkurrerende produkters ydeevne i det år, de blev udgivet. Monaka siges nu at være dobbelt så hurtig som sine konkurrenter i 2027. Hvordan vi ved det nu, er dog en anden sag. Dette er kun et groft skøn.
Energieffektiviteten i form af effekt pr. watt ville også være det dobbelte af konkurrenternes. Fujitsu taler om „Ultra Low Voltage‟, mens A64FX kun siger „Low Voltage‟. Derudover skulle ren luftkøling være tilstrækkelig denne gang i stedet for en kombination af luft- og vandkøling. Spørgsmålet om energieffektivitet er øverst på listen for japanerne.
HBM bruges ikke længere
Mens A64FX stadig er udstyret med hurtig HBM2-hukommelse, vil Monaka-efterfølgeren kun have DDR5 RAM. Fordelt på 12 kanaler som AMD og Intels HPC-processorer vil dette stadig kun betyde omkring halvdelen af gennemløbet, men vil i sidste ende gøre platformen billigere.
Forgængeren A64FX
I juni 2020 stormede den japanske supercomputer Fugaku tronen over de 500 bedste systemer med mere end 400 PetaFLOPS, en stor føring på det tidspunkt (andenpladsen nåede ikke engang 150 PetaFLOPS). Fugaku forblev i toppen i to år og blev først erstattet i juni 2022 af det amerikanske grænsesystem med over 1.000 PetaFLOPS. På den seneste verdensrangliste fra november 2024 ligger Fugaku stadig på en 6. plads, hvilket er meget imponerende på 4,5 år, siden det blev optaget på listen.
A64FX processor af „Fugaku‟ supercomputeren (Billede: Fujitsu)
Fugaku opnåede ikke sin dengang uovertrufne computerkraft ved hjælp af GPU-baserede computeracceleratorer, som det er tilfældet med Frontier og det meste af top 10. I stedet bruges en armada af 48-core processorer. Hver af de 158.976 computernoder indeholder en 48-core A64FX-processor. Chippen, udviklet af Fujitsu i samarbejde med Arm, brugte ARMv8.2-A SVE (Scalable Vector Extension) instruktionssætudvidelsen for første gang. Efterfølgeren vil have ARMv9 og SVE2.
Top 10 hurtigste supercomputere ifølge Top500.org-rangering (Tidligere) Systemplacering Computerkraft (Rmax) Processorer Top500 Rekord 1 (-) El Capitan USA 1.742,00 PetaFLOPS AMD Epyc 4. generation (24C, 1,8 GHz)
AMD Instinct MI300A november 2024 2 (1) Frontier USA 1.353,00 PetaFLOPS AMD Epyc 3rd Gen (64C, 2,0 GHz)
AMD Instinct MI250X juni 2022 3 (2) Aurora USA 1.012,00 PetaFLOPS Intel Xeon Max 9470 (52C, 2,4 GHz)
Intel GPU Max 1550 (?) november 2023 4 (3) Eagle USA 561.20 PetaFLOPS Intel Xeon Platinum 8480C (48C, 2,0 GHz)
Nvidia H100 november 2023 5 (-) HPC6 Italiensk 477,90 PetaFLOPS AMD Epyc 3. generation (64C, 2,0 GHz)
AMD Instinct MI250X november 2024 6 (4) Fugaku Japan 442.01 PetaFLOPS Fujitsu A64FX (48C, 2.2 GHz) juni 2020 7 (6) Alperne Schweiz 434.90 PetaFLOPS Nvidia Grace (72C), 3.1 GHz, 3.1 GHz)
Nvidia GH200 juni 2024 8 (5) LUMI Finland 379,70 PetaFLOPS AMD Epyc 3rd Gen (64C, 2,0 GHz)
AMD Instinct MI250X juni 2022 9 (6) Leonardo Italian 241.20 PetaFLOPS Intel Xeon Platinum 8358 (32C, 2,6 GHz)
Nvidia A100 november 2022 10 (-) Tuolumne USA 208.10 PetaFLOPS AMD Epyc 4. generation (24C, 1,8 GHz)
AMD Instinct MI300A november 2024 Ændringer fra sidste notering fremhævet med fed

Marc afdækker processorer ved at teste deres ydeevne til gaming, indholdsproduktion og kunstig intelligens.