Blackwell Ultra: Nvidia GB300 tem 288 GB HBM3e e 1,4 kW por GPU

Blackwell Ultra: Nvidia GB300 tem 288 GB HBM3e e 1,4 kW por GPU 46 comentários

Blackwell Ultra: Nvidia GB300 tem 288 GB HBM3e e 1,4 kW por GPU

Imagem: Nvidia

Os dados técnicos para a atualização para o Blackwell Ultra vêm da cadeia de fornecimento de Taiwan. A Nvidia já havia anunciado a atualização intermediária da arquitetura Blackwell na Computex em junho, e agora são revelados detalhes do GB300 como a quantidade de HBM3e instalada (288 GB) ou o consumo por GPU (1.400 watts).

A anunciou aos investidores há cerca de um ano que a Nvidia aceleraria o ritmo de introdução de novas soluções para supercomputação de IA. Durante a palestra da Computex em junho deste ano, o CEO Jensen Huang foi surpreendentemente e deu ao público um vislumbre dos sucessores da Blackwell, Blackwell Ultra, Rubin e Rubin Ultra para os próximos anos.

Blackwell Ultra com 288 GB HBM3e

Como resultado, a atualização intermediária do Blackwell Ultra está planejada para o próximo ano. A Nvidia já havia anunciado oficialmente o recurso “8S HBM3e 12H” para esse fim. Isso significa: são usadas 8 pilhas HBM3e, cada uma com 12 camadas. Espera-se que a expansão da memória por GPU aumente dos atuais 192 GB para 288 GB, relata o Economic Daily de Taiwan com referência à cadeia de abastecimento.

No entanto, o número de 288 GB não é surpreendente, já que a Blackwell (sem Ultra) usa atualmente 8 pilhas de HBM3e, cada uma com 8 camadas, elevando para 192 GB mais camadas com Blackwell Ultra significa 50% mais memória e, portanto, 288 GB. .

TDP aumenta moderadamente

O relatório do Economic Daily concentra-se principalmente no GB300, o sucessor do superchip GB200. É assim que a Nvidia chama a placa com duas GPUs B200 e uma CPU Grace. 36 dessas placas compõem o GB200 NVL72, um rack denso refrigerado a água com 72 GPUs Blackwell, 36 CPUs Grace, 13,5 TB HBM3e e até 1.440 PetaFLOPS de desempenho (FP4 Tensor Core Sparse). Cada placa Superchip possui um TDP configurável de 2.700 watts. Isso é importante quando se trata do Blackwell Ultra.

O artigo lista um TDP de 1.400 watts para a GPU B300. Parece muito, mas não é muito mais do que B200. Duas GPUs Blackwell Ultra atingiriam no máximo 2.800 watts, sendo então necessário adicionar a CPU Grace e outros componentes da placa para poder comparar o consumo com o Superchip GB200 anterior. É previsível que o consumo por placa seja superior, mas a diferença não será dramática se compararmos com o aumento de desempenho. O desempenho do FP4 aumentaria 50% para 2.160 PetaFLOPS com Blackwell Ultra ao usar aceleração esparsa.

LPCAMM para o processador Grace

Além do HBM3e das GPUs, 480 GB de LPDDR5X para o processador Grace também são soldados em cada Superchip GB200. A próxima geração apresentará o LPCAMM modular, destinado desde o início a laptops, desktops e servidores.

Mudanças no resfriamento e armazenamento de energia

Para novos servidores de IA equipados com Blackwell Ultra, espera-se que o número de desconexões rápidas universais (UQD) para a água aumente, tornando o sistema mais modular. Nos novos racks, também será criado espaço para unidades de backup de bateria (BBUs) e supercapacitores para utilizar essa energia para amortecer interrupções.

Espera-se que a rede dobre para 1,6 Tbps

Além disso, a Nvidia planeja dobrar a próxima velocidade da rede para 1,6 Tbps. O Economic Daily coloca em prática uma atualização do antigo adaptador ConnectX-7 InfiniBand para o ConnectX-8. De acordo com o roteiro da Computex de junho, 1,6 Tbit/s foi planejado apenas para a plataforma Rubin e seu ConnectX-9, esperado para o próximo ano. O ConnectX-8 também já é usado nas soluções atuais da Blackwell e oferece largura de banda de 800 Gbps.

Tópicos: Nvidia Nvidia Blackwell Fonte: Economic Daily

Leave a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *

Scroll to Top