Sucessor de Blackwell: Nvidia oferece uma visão de Rubin (Ultra) e Feynman 15 comentários
A Nvidia saiu abertamente para o cálculo em junho passado e permitiu que Rubin (Ultra) visse o roteiro. Para a palestra do GTC 2025, o CEO da Nvidia, Jensen Huang, deu os primeiros detalhes técnicos para Rubin e Rubin Ultra antes que houvesse também uma visão sobre a arquitetura Feynman posteriormente. Os números são gigantescos.
Depois que o Blackwell Ultra ainda estava no roteiro indicado para a Computex há um ano, a nova solução de data center para inferência mais rápida foi apresentada oficialmente hoje pelos modelos de redução de IA e está prevista para começar no segundo semestre do ano. Semelhante à The Computex, a Nvidia não a impediu de dar uma visão para os próximos três anos.
Rubin GPU e Vera-CPU seguem 2026
No segundo semestre de 2026 será apresentado o Rubin ou Dupla Solução Vera Rubin. O homônimo é a astrônoma Vera Cooper Rubin, falecida em 2016, cujos netos estavam hoje sentados na plateia do GTC Keynote. Rubin já estava no roteiro da Computex, mas o produto só foi descrito na época. Hoje, Jensen Huang foi surpreendentemente aberto com os detalhes técnicos.
Novo esquema de nomenclatura com número de GPUs
Primeiro, Huang teve que admitir que a designação anterior do produto havia cometido um erro. Na Blackwell, cada chip é composto por duas GPUs, mas, por exemplo, com o GB300 NVL72 existem apenas 72 GPUs, embora na verdade existam 72 pacotes de chips com 144 GPUs.
Vera Rubin NVL1
144 GPUs com 20 TB HBM4 no novo rack Oberon
Na Rubin, a Nvidia está interessada em um novo esquema de nomenclatura que se refira ao número de GPUs e não mais ao número de pacotes de chips. Rubin, por outro lado, é a nova GPU, Vera, por outro lado, é a nova CPU Nvidia com núcleos ARM. O nome Vera Rubin NVL144 é uma solução completa no novo “Oberon Rack”.
Os números são gigantescos, mas estão cada vez maiores
Rubin é análogo ao Blackwell, uma GPU de 2 retículos com uma rápida interconexão direta (10 TB/s na Blackwell). Rubin oferece desempenho HBM4 de 288 GB e FP4 de 50 Petaflops, o que representa um aumento de 3,3x em relação ao Blackwell Ultra. O Vera-CPU oferece 88 núcleos ARM personalizados com SMT para 176 threads e é conectado à GPU com 1,8 TB/s usando Nvlink-C2C-InterConnect. Vera Rubin NVL144 como rack finalizado atinge 3,6 exaflops para inferência FP4, 1,2 EXAFLOPS para treinamento FP8 e oferece 20,7 TB HBM4 com uma largura de banda total de 13 TB/s. O Nvlink 6 reúne tudo isso com largura de banda de 260 TB/s.
Vera Rubin NVL1
Rubin Ultra dobra o número de GPUs em 2027
Porém, Rubin está longe da conclusão, no segundo semestre de 2027 a maior solução Rubin Ultra com GPU de 4 arrays, ou seja, com quatro GPUs para cada pacote de chip. 16 pilhas HBM4E com um total de 1 TB por pacote fornecem Nvidia para Rubin Ultra, mas o Vera-CPU deve permanecer o mesmo do Ruby.
Nenhum rack foi embalado com tanta antecedência
Como um “rack Kyber” completo, a solução é Rubin Ultra NVL576, já que 576 GPUs são agora usadas em 144 pacotes. Isso representa o dobro de pacotes e quatro vezes mais GPUs do que atualmente com o Blackwell Ultra que a Nvidia deseja colocar em um único rack. O rack com 90 graus, fabricado pela NVIDIA, é novamente consideravelmente mais denso que os racks atuais com 90 graus. De acordo com Jensen Huang, a torre resfriada a água exige energia de 600 quilowatts.
Rubin Ultra NVL576 Imagem 1 de 3
15 exaflops para inferência FP4
Em troca, Rubin Ultra NVL576 oferece 15 exaflops para inferência FP4, 5 exaflops para treinamento FP8, 1 TB HBM4E por pacote distribuído em 16 pilhas de 64 GB cada e um total de 144 TB HBM4E com uma largura de banda total de 4,6 Pb/s.
Feynman Folgt 2028
Feynman é finalmente uma nova arquitetura para o segundo semestre de 2028, dedicada ao físico Richard Phillips Feynman. Feynman ainda não foi visto em um roteiro público, e a Nvidia também foi mais abordada no GTC.
Roteiro com Feynman para 2028 Imagem 1 de 2
Feynman deve, portanto, continuar a confiar no Vera-CPU no HBM “Next-Gen” e ao selecionar a solução dupla. O NVSwitch de 8ª geração para “NVL-Next” e as novas soluções de rede Spectrum7 e ConnectX 10 andam de mãos dadas com a geração.
A Techtip recebeu informações sobre este artigo da Nvidia como parte de um evento da fabricante em San Jose, Califórnia. Os custos de chegada, saída e cinco hospedagens em hotel foram arcados pela empresa. Não houve influência do fabricante nem obrigação de reportar.
Tópicos: Placas Gráficas Inteligência Artificial Nvidia Nvidia GTC 2025 Fonte: Nvidia

Engenheiro de formação, Alexandre compartilha seu conhecimento sobre o desempenho de GPUs para jogos e criação.