Sucesor de Blackwell: Nvidia ofrece una visión de Rubin (Ultra) y Feynman

Sucesor de Blackwell: Nvidia ofrece una visión de Rubin (Ultra) y Feynman 15 comentarios

Nvidia salió abiertamente a hacer cálculos en junio pasado y permitió a Rubin (Ultra) ver la hoja de ruta. Para el discurso de apertura de GTC 2025, el CEO de Nvidia, Jensen Huang, dio los primeros detalles técnicos de Rubin y Rubin Ultra antes de que luego también hubiera una perspectiva sobre la arquitectura Feynman. Los números son gigantescos.

Después de que Blackwell Ultra todavía estuviera en la hoja de ruta indicada para Computex hace un año, hoy se presentó oficialmente la nueva solución de centro de datos para una inferencia más rápida mediante modelos de reducción de IA y se espera que comience en la segunda mitad del año. Al igual que The Computex, Nvidia no le impidió dar una perspectiva de los próximos tres años.

Resumen :

Rubin GPU y Vera-CPU siguen 2026

En el segundo semestre de 2026 se presentará Rubin o Double Solution Vera Rubin. El homónimo es la astrónoma Vera Cooper Rubin, quien murió en 2016, cuyos nietos estaban sentados hoy entre la audiencia en la Keynote del GTC. Rubin ya estaba en la hoja de ruta de Computex, pero el producto sólo se describió en ese momento. Hoy, Jensen Huang fue sorprendentemente abierto con los detalles técnicos.

Nuevo esquema de nombres con cantidad de GPU

Primero, Huang tuvo que admitir que la designación anterior del producto había cometido un error. En Blackwell, cada chip se compone de dos GPU, pero por ejemplo en el GB300 NVL72 sólo hay 72 GPU, aunque en realidad hay 72 paquetes de chips con 144 GPU.

Vera Rubin NVL1

144 GPU con 20 TB HBM4 en el nuevo rack Oberon

En Rubin, Nvidia está interesada en un nuevo esquema de nombres que se refiera a la cantidad de GPU y ya no a la cantidad de paquetes de chips. Rubin, por otro lado, es la nueva GPU, Vera, por otro lado, es la nueva CPU Nvidia con núcleos ARM. El nombre Vera Rubin NVL144 es una solución completa en el nuevo “Oberon Rack”.

Los números son gigantescos, pero cada vez son más grandes.

Rubin es análogo a Blackwell, una GPU de 2 retículas con una rápida interconexión directa (10 TB/s en Blackwell). Rubin ofrece 288 GB HBM4 y un rendimiento FP4 de 50 petaflops, lo que supone un aumento de 3,3 veces respecto al Blackwell Ultra. La CPU Vera ofrece 88 núcleos ARM personalizados con SMT para 176 subprocesos y está conectada a la GPU con 1,8 TB/s mediante Nvlink-C2C-InterConnect. Vera Rubin NVL144 como bastidor terminado alcanza 3,6 exaflops para la inferencia del FP4, 1,2 EXAFLOPS para el entrenamiento del FP8 y ofrece 20,7 TB HBM4 con un ancho de banda total de 13 TB/s. Nvlink 6 lo reúne todo con un ancho de banda de 260 TB/s.

Vera Rubin NVL1

Rubin Ultra duplica el número de GPU en 2027

Sin embargo, Rubin está lejos de la conclusión: en la segunda mitad de 2027, la solución más grande Rubin Ultra con una GPU de 4 matrices, es decir, con cuatro GPU para cada paquete de chips. Nvidia proporciona 16 pilas HBM4E con un total de 1 TB por paquete para Rubin Ultra, pero la CPU Vera debería seguir siendo la misma que con Ruby.

Ningún estante estaba tan apretado de antemano

Como un “bastidor Kyber” completo, la solución es Rubin Ultra NVL576, ya que ahora se utilizan 576 GPU en 144 paquetes. Eso es el doble de paquetes y cuatro veces más GPU que actualmente con Blackwell Ultra que Nvidia quiere colocar en un solo rack. El bastidor de 90 grados fabricado por NVIDIA vuelve a ser considerablemente más denso que los bastidores de 90 grados actuales. Según Jensen Huang, la torre refrigerada por agua necesita una energía de 600 kilovatios.

Rubin Ultra NVL576 Imagen 1 de 3

15 exaflops para la inferencia del 4PM

A cambio, Rubin Ultra NVL576 ofrece 15 exaflops para inferencia FP4, 5 exaflops para entrenamiento FP8, 1 TB HBM4E por paquete distribuido en 16 pilas de 64 GB cada una y un total de 144 TB HBM4E con un ancho de banda total de 4,6 Pb/s.

Feynman Folgt 2028

Feynman es finalmente una nueva arquitectura para la segunda mitad de 2028, dedicada al físico Richard Phillips Feynman. Feynman aún no ha aparecido en una hoja de ruta pública, y Nvidia también estuvo más cubierta en GTC.

Hoja de ruta con Feynman para 2028 Imagen 1 de 2

Por lo tanto, Feynman debería seguir confiando en la CPU Vera en HBM “Next-Gen” y al seleccionar la solución dual. El NVSwitch de octava generación para “NVL-Next” y las nuevas soluciones de red Spectrum7 y ConnectX 10 van de la mano con la generación.

Techtip recibió información sobre este artículo de Nvidia como parte de un evento del fabricante en San José, California. Los gastos de llegada, salida y cinco alojamientos en hotel corrieron a cargo de la empresa. No hubo influencia del fabricante ni obligación de informar.