Fujitsu Monaka: Notícias sobre o superchip de 144 núcleos do Japão

Fujitsu Monaka: Notícias do superchip de 144 núcleos do Japão 28 comentários

Imagem: Satoshi Matsuoka (X)

Um novo chip de supercomputador está sendo desenvolvido no Japão. Este se chama Monaka, tem 144 núcleos distribuídos em chipsets e será o próximo processador Arm da Fujitsu para o segmento de computação de alto desempenho (HPC) depois do A64FX. Este último serve no que já foi o supercomputador mais rápido do mundo, chamado Fugaku.

Sumário :

Novos detalhes sobre o Fujitsu Monaka

O professor Satoshi Matsuoka, que dirige o Centro RIKEN de Ciência Computacional (R-CCS) em Kobe, Japão, onde opera o supercomputador Fugaku, compartilhou uma foto do novo chip Fujitsu Monaka como uma “amostra mecânica” em que o chip consiste em vários as matrizes que foram montadas como chips são claramente visíveis no esquema anexo.

Assim, no centro está o grande chip de E/S fabricado em 5nm, que fornecerá as interfaces, que também incluem PCIe 6.0 ou o Compute Express Link (CXL) versão 3.0 baseado nele.

Fujitsu Monaka (Imagem: Fujitsu)

Existem quatro chips SRAM (também de 5 nm) distribuídos ao redor, que contêm o cache de último nível. Os próprios núcleos da CPU, que devem ser fabricados em um processo ainda mais fino de 2 nm, ficam acima. Cada uma dessas quatro matrizes contém 36 núcleos, já que se espera que Monaka ofereça um total de 144 núcleos. Não são exatamente os 150 núcleos que esperávamos, mas é um grande avanço em relação aos 48 núcleos do Fujitsu A64FX.

Fujitsu Monaka (Imagem: Fujitsu)

Monaka deve acima de tudo ser eficaz

Claro, o objetivo é aumentar o poder computacional com o novo processador. Foi anunciado antecipadamente que o desempenho do aplicativo seria 1,7 vezes superior ao dos produtos concorrentes no ano de seu lançamento. Diz-se agora que Monaka será duas vezes mais rápido que seus concorrentes em 2027. Como sabemos disso agora, porém, é outra questão. Esta é apenas uma estimativa aproximada.

A eficiência energética em termos de potência por watt também seria o dobro da concorrência. A Fujitsu fala em “Ultra Baixa Tensão”, enquanto a A64FX diz apenas “Baixa Tensão”. Além disso, desta vez o resfriamento com ar puro deve ser suficiente, em vez de uma combinação de resfriamento com ar e água. A questão da eficiência energética está no topo da lista dos japoneses.

HBM não é mais usado

Embora o A64FX ainda esteja equipado com memória HBM2 rápida, o sucessor do Monaka terá apenas RAM DDR5. Distribuído em 12 canais, como os processadores HPC da AMD e da Intel, isso ainda significará apenas cerca de metade do rendimento, mas acabará por tornar a plataforma mais barata.

O antecessor A64FX

Em junho de 2020, o supercomputador japonês Fugaku invadiu o trono dos 500 principais sistemas com mais de 400 PetaFLOPS, uma grande vantagem na época (o segundo lugar nem chegava a 150 PetaFLOPS). Fugaku permaneceu no topo por dois anos e só foi substituído em junho de 2022 pelo sistema American Frontier com mais de 1.000 PetaFLOPS. No último ranking mundial de novembro de 2024, Fugaku ainda ocupa a 6ª posição, o que é impressionante em 4,5 anos desde que foi incluído na lista.

Processador A64FX do supercomputador “Fugaku” (Imagem: Fujitsu)

Fugaku não alcançou seu poder de computação incomparável com a ajuda de aceleradores de computador baseados em GPU, como é o caso do Frontier e da maioria dos 10 primeiros. Em vez disso, é usada uma armada de processadores de 48 núcleos. Cada um dos 158.976 nós de computação contém um processador A64FX de 48 núcleos. O chip, desenvolvido pela Fujitsu em cooperação com a Arm, usou pela primeira vez a extensão do conjunto de instruções ARMv8.2-A SVE (Scalable Vector Extension). O sucessor terá ARMv9 e SVE2.

Os 10 supercomputadores mais rápidos de acordo com a classificação Top500.org (anterior) Localização do sistema Potência de computação (Rmax) Processadores Top500 Record 1 (-) El Capitan EUA 1.742,00 PetaFLOPS AMD Epyc 4ª geração (24C, 1,8 GHz)
AMD Instinct MI300A novembro de 2024 2 (1) Frontier USA 1.353,00 PetaFLOPS AMD Epyc 3ª geração (64C, 2,0 GHz)
AMD Instinct MI250X junho de 2022 3 (2) Aurora EUA 1.012,00 PetaFLOPS Intel Xeon Max 9470 (52C, 2,4 GHz)
Intel GPU Max 1550 (?) Novembro de 2023 4 (3) Eagle EUA 561,20 PetaFLOPS Intel Xeon Platinum 8480C (48C, 2,0 GHz)
Nvidia H100 novembro de 2023 5 (-) HPC6 italiano 477,90 PetaFLOPS AMD Epyc 3ª geração (64C, 2,0 GHz)
AMD Instinct MI250X novembro de 2024 6 (4) Fugaku Japão 442,01 PetaFLOPS Fujitsu A64FX (48C, 2,2 GHz) junho de 2020 7 (6) Alpes Suíça 434,90 PetaFLOPS Nvidia Grace (72C, 3,1 GHz)
Nvidia GH200 junho de 2024 8 (5) LUMI Finlândia 379,70 PetaFLOPS AMD Epyc 3ª geração (64C, 2,0 GHz)
AMD Instinct MI250X junho de 2022 9 (6) Leonardo Italiano 241,20 PetaFLOPS Intel Xeon Platinum 8358 (32C, 2,6 GHz)
Nvidia A100 novembro de 2022 10 (-) Tuolumne EUA 208.10 PetaFLOPS AMD Epyc 4ª geração (24C, 1,8 GHz)
AMD Instinct MI300A novembro de 2024 Alterações da última listagem destacadas em negrito