GeForce RTX 50: Nvidia publica un documento técnico para Blackwell 51 comentarios
Imagen: nvidia
Nvidia ha publicado el documento técnico para la arquitectura Blackwell detrás de GeForce RTX 50. Con este documento, Nvidia aborda los cambios relevantes entre las arquitecturas y explica las nuevas características.
Una mirada más profunda a la arquitectura
Después de que se publicaron las pruebas de GeForce RTX 5080 y la semana pasada las pruebas de GeForce RTX 5090, ahora se puede consultar el documento técnico de Blackwell en el sitio web de Nvidia.
Aunque la presentación de la arquitectura de Blackwell se trabajó principalmente con palabras clave y los gráficos mostrados mostraron cambios arquitectónicos relativamente pequeños entre ADA Lovelace y Blackwell, el documento técnico va más allá. El tamaño del documento técnico de 57 páginas demuestra que hay mucho más detrás de Blackwell y, sobre todo, mucho futuro.
Blackwell de un vistazo
Al comienzo del documento técnico, la propia Nvidia escribió que Blackwell fue desarrollado para la próxima generación de medios y aplicaciones de inteligencia artificial. Nvidia nombra los siguientes puntos:
SM para funciones de sombreado neural-Q para mejorar la eficiencia energética4. Generación de RT-Kerne5. Generación de tensor Kernenvidia DLSS 4RTX Procesador de gestión Neural Shaderai (AMP) Geometría GDDR7-Steicherga
El documento técnico presenta estos puntos con mayor precisión basándose en los cambios entre ADA Lovelace y Blackwell y describe las posibilidades.
Por ejemplo, se describe más detalladamente el cambio en los multiprocesadores de streaming entre Blackwell y Ada Lovelace. En los gráficos de la presentación de Blackwell, podemos ver para el SM que 32 sombreadores están realizando ahora los cálculos o FP. En ADA Lovelace y Ampere, solo 16 sombreadores pudieron manejar la cantidad de ganzers de 32 bits y números de combinación de líquidos, los otros 16 alusos por partición de sombreado no pudieron realizar cálculos de FP.
Sin embargo, con este cambio, Blackwell pierde una capacidad en Ada Lovelace, que Nvidia introdujo con Turing: los cálculos de Int y FP ya no se pueden realizar en un ciclo de barras en una partición de sombreado.
Blackwell Neural Shader (Foto: Nvidia)
Mega geometría y estanterías.
Nvidia pone especial énfasis en la megageometría en el documento técnico y sus efectos en los núcleos de radios. Con la megageometría, ya no debería ser necesario utilizar proxies de baja resolución para efectos de trazado de rayos. Esto tiene como objetivo permitir que los sistemas LOD (nivel de detalle) modernos, como Nanite en Unreal Engine 5, calculen los efectos de trazado de rayos con todo detalle.
NVIDIA describe dos grandes obstáculos que impiden que los efectos del trazado de rayos se calculen en los sistemas LOD modernos con detalles geométricos completos: las “actualizaciones de LOD basadas en clústeres” y la gran cantidad de objetos diferentes en los juegos modernos. NVIDIA presenta PTLAS (Estructura de aceleración de nivel superior particionada) y así amplía la clásica TLAS (Estructura de aceleración de nivel superior).
La función Mega Geometry está disponible para todas las tarjetas gráficas RTX desde Turing. Bajo DirectX 12, los desarrolladores pueden usar NVAPI en funciones. Hay una extensión del fabricante para Vulkan y Optix de Nvidia está recibiendo soporte nativo para la versión 9.0.
y mucho mas
Además de los cambios de Blackwell a Ada Lovelace y la nueva megageometría, que se presentan brevemente aquí, hay otros cambios que irían más allá del alcance en este momento. Si desea obtener más información sobre Blackwell y Neural Shader, ahora tiene los documentos necesarios con el documento técnico.
NVIDIA GEFORCE RTX 5090 en la prueba: DLSS 4 SCORES MFG 575 Watts en formatonvidia Geforce RTX 5080 en la prueba: DLSS 4 MFG y un pequeño FPS-Boostnvidia Geforce “Blackwell”: Detalles técnicos sobre RTX 5090, 5080 y 5070 (Blackwell “: Detalles técnicos sobre RTX 5090, 5080 & 5070 (Blackwell”: Detalles técnicos sobre RTX 5090, 5080 & 5070 Ti) Nvidia DLSS 4: Generación de multi-frame y una nueva red neuronal Nvidia Reflex 2 en detalle: Por ejemplo, Frame Warp reduce la latencia en todas las nvidia geforce Escenarios RTX 5000 – Especificaciones RTX 5080 RTX 5070 Arquitectura Blackwell GPU GB203 GB205 GB205 Transistores 92,2 mil millones 45,6 mil millones 45,6 mil millones 31,1 mil millones tamaño 750 mm² 378 mm² 263 mm² SM 170 84 70 48 FP32-ALUS 21760 6,960 6,144 RT NÚCLEOS 170, 4.ª generación 84, 4.ª generación 70, 4.ª generación 48, 4.ª generación Núcleos 680, 5.ª generación 336, 5.ª generación 280, 5.ª generación 192, 5.ª generación Reloj de refuerzo 2,407 MHz 2,452 MHz 2512 MHz Rendimiento de FP32 104,8 Tflops 56, 3 Tflops 43,9 Tflops 30,9 Tflops Rendimiento FP16 104,8 Tflops 56,3 Tflops 43,9 Tflops 30,9 Tflops Rendimiento FP16 vía tensor 419 TFlops 175,8 TFlops 123,5 Unidades de textura Tflops 680 336 280 192 ROPS 176 112 96 80 L2 -CACH 98,304 KB 65,536 KB 49,152 KB Memoria 32 GB GDDR7 16 GB GDDR7 12 GB GDDR7-THROULHPUT 28 GBP 960 GB/s 896 GB/s 672 GB/s Ranura PCIe Motor de vídeo 5.0 × 16 3 × NVEC (novena generación)
2 × NVDEC (sexta generación) 2 × NVENC (novena generación)
2 × NVDEC (sexta generación) 2 × NVENC (novena generación)
1 × NVDEC (sexta generación) 1 × NVENC (novena generación)
1 × NVDDC (6.a generación) TDP 575 WATT 300 Reloj 250 Reloj: Dangerdi-Dirtiart Raida nvidia nvidia nvidia Black
Ingeniero de formación, Alexandre comparte sus conocimientos sobre el rendimiento de las GPUs para gaming y creación.