GeForce RTX 50: Nvidia publica white paper técnico da Blackwell

GeForce RTX 50: Nvidia publica white paper técnico para comentários do Blackwell 51

GeForce RTX 50: Nvidia publica white paper técnico da Blackwell

Imagem: nvidia

A Nvidia publicou o white paper da arquitetura Blackwell por trás da GeForce RTX 50. Com este documento, a Nvidia aborda mudanças relevantes entre as arquiteturas e explica novos recursos.

Um olhar mais aprofundado sobre a arquitetura

Depois que os testes da e da semana passada os testes da foram publicados, o white paper da Blackwell no site da Nvidia agora pode ser acessado.

Embora a apresentação da arquitetura Blackwell tenha sido trabalhada principalmente com palavras-chave e os gráficos mostrados mostrassem mudanças arquitetônicas relativamente pequenas entre ADA Lovelace e Blackwell, o white paper vai além. O tamanho do white paper de 57 páginas mostra que há muito mais por trás da Blackwell e, acima de tudo, muito futuro.

Blackwell em resumo

No início do white paper, a própria Nvidia escreveu que o Blackwell foi desenvolvido para a próxima geração de mídias e de IA. A Nvidia nomeia os seguintes pontos:

SM para funções de sombreamento neural-Q para melhoria da eficiência energética4. Geração de RT-Kerne5. Geração de tensor Kernenvidia 4RTX Neural Shaderai Management Processor (AMP) Geometria GDDR7-Steicherga

O white paper apresenta esses pontos com mais precisão com base nas mudanças entre ADA Lovelace e Blackwell e descreve as possibilidades.

Por exemplo, a mudança nos multiprocessadores de streaming entre Blackwell e Ada Lovelace é descrita mais detalhadamente. Nos gráficos da apresentação da Blackwell, podemos ver para o SM que 32 shaders estão agora realizando os cálculos ou FP. Na ADA Lovelace e Ampere, apenas 16 shaders foram capazes de lidar com o número de ganzers e números de combinação de líquidos de 32 bits, os outros 16 aluses por partição de shader não foram capazes de realizar cálculos de FP.

Com esta mudança, no entanto, Blackwell perde uma capacidade em Ada Lovelace, que a Nvidia introduziu com Turing: cálculos Int e FP não podem mais ser realizados em um ciclo de barra em uma partição de shader.

Sombreador Neural Preto Blackwell Neural Shader (Imagem: Nvidia)

Mega geometria e estantes

A Nvidia dá ênfase especial à megageometria no white paper e seus efeitos nos núcleos falados. Com a megageometria, não deverá mais haver necessidade de usar proxies de baixa resolução para efeitos de traçado de raio. O objetivo é permitir que sistemas modernos de LOD (nível de detalhe), como nanite no Unreal Engine 5, calculem efeitos de traçado de raio com todos os detalhes.

A NVIDIA descreve dois grandes obstáculos que impedem que os efeitos do ray tracing sejam calculados em sistemas LOD modernos com detalhes geométricos completos: “atualizações de LOD baseadas em cluster” e o grande número de objetos diferentes em jogos modernos. NVIDIA apresenta PTLAS (Estrutura de Aceleração de Nível Superior Particionada) e assim expande o clássico TLAS (Estrutura de Aceleração de Nível Superior).

O recurso Mega Geometry está disponível para todas as RTX desde Turing. No DirectX 12, os desenvolvedores podem usar NVAPI em funções. Existe uma extensão do fabricante para Vulkan e o Optix da Nvidia está recebendo suporte nativo para a versão 9.0.

E muito mais

Além das mudanças de Blackwell para Ada Lovelace e da nova megageometria, que são brevemente apresentadas aqui, há outras mudanças, que iriam além do escopo neste momento. Se quiser saber mais sobre Blackwell e Neural Shader, agora você tem os documentos necessários com o white paper.

NVIDIA GEFORCE RTX 5090 No teste: DLSS 4 SCORES MFG 575 Watts no formatonvidia Geforce RTX 5080 no teste: DLSS 4 MFG e um pequeno FPS-Boostnvidia Geforce “Blackwell”: Detalhes técnicos sobre RTX 5090, 5080 e 5070 (Blackwell “: Detalhes técnicos sobre RTX 5090, 5080 e 5070 (Blackwell”: detalhes técnicos sobre RTX 5090, 5080 e 5070 Ti) Nvidia DLSS 4: geração de vários quadros e uma nova rede neural Nvidia Reflex 2 em detalhes: por exemplo, Frame Warp reduz a latência em todos os nvidia geforce Cenários RTX 5000 – especificações RTX 5080 RTX Arquitetura 5070 GPU Blackwell GB203 GB205 GB205 Transistores 92,2 bilhões 45,6 bilhões 45,6 bilhões 31,1 bilhões tamanho 750 mm² 378 mm² 263 mm² SM 170 84 70 48 FP32-ALUS 21760 6,960 6,144 RT CORES 170, 4ª geração 84, 4ª geração 70, 4ª geração 48, 4ª geração Kernels 680, 5ª geração 336, 5ª geração 280, 5ª geração 192, 5ª geração boost clock 2,407 MHz 2,452 MHz 2.512 MHz Desempenho FP32 104,8 Tflops 56, 3 Tflops 43,9 Tflops 30,9 Tflops Desempenho FP16 104,8 Tflops 56,3 Tflops 43,9 Tflops 30,9 Tflops Desempenho FP16 via tensor 419 TFlops 175,8 TFlops 123,5 Unidades de textura Tflops 680 336 280 192 ROPS 176 112 96 80 L2 -CACH 98,304 KB 65,536 KB 49,152 KB Memória 32 GB GDDR7 16 GB GDDR7 12 GB GDDR7-THROULHPUT 28 GBP 960 GB/s 896 GB/s 672 GB/s Slot PCIe Mecanismo de vídeo 5.0 × 16 3 × NVEC (9ª geração)
2 × NVDEC (6ª geração) 2 × NVENC (9ª geração)
2 × NVDEC (6ª geração) 2 × NVENC (9ª geração)
1 × NVDEC (6ª geração) 1 × NVENC (9ª geração)
1 × NVDDC (6ª geração) TDP 575 WATT 300 Relógio 250 Relógio: Dangerdi-Dirtiart Raida nvidia nvidia nvidia Preto

Leave a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *

Scroll to Top