Tensorrt para RTX: inferência de IA otimizada para cada GPU Nvidia automaticamente 0 comentários
Imagem: nvidia
É fácil em jogos: com APIs 3D como DirectX ou Vulkan, o novo hardware é suportado diretamente e geralmente roda mais rápido sem ajustes adicionais. No caso do software de IA, no entanto, isso não acontece da maneira como os testes com software de IA de consumidor em bases de computador mostraram nas placas de vídeo Blackwell da NVIDIA.
Atualmente existem problemas sem otimização separada
A API DirectML, que funciona em qualquer lugar, não parece ser muito afetada por esse problema, mas a Nvidia, que é especializada e otimiza para placas GeForce, parece ser ainda mais. Sem uma única adaptação, provavelmente notada no melhor dos casos para cada GPU, o desempenho com o novo hardware não aumenta – e o programa nem funciona tão raramente.
Agora isso deve mudar, como a Nvidia anunciou no evento para desenvolvedores Build Von da Microsoft. Sob o nome “Tensorrt for RTX”, a Nvidia está disponibilizando uma versão revisada de suas próprias ferramentas de software, com as quais no futuro não será mais necessário que os desenvolvedores otimizem seus programas para cada GPU, às vezes para cada modelo de placa de vídeo.
A régua é otimizada automaticamente para sua própria GPU
Isso será feito automaticamente pelo Tensorrt para RTX no futuro. No futuro, a otimização do Tensorrt ocorrerá em tempo real no seu PC e deverá levar alguns segundos. Se o processo for concluído, o desempenho do Tensorrt deverá ser o mesmo que seria se o desenvolvedor tivesse executado o programa manualmente em sua própria placa gráfica. Além disso, espera-se que a nova versão do Tensorrt seja apenas um oitavo do tamanho da antiga — provavelmente porque otimizações para todas as GPUs não precisam mais ser incluídas.
A nova versão do Tensorrt, assim como as variantes mais antigas, funcionará em todas as placas de vídeo GeForce-RTX.
O Tensorrt para RTX estará disponível para download no site de desenvolvedores da Nvidia durante junho e poderá ser integrado ao seu próprio software a partir daí. Alguns desenvolvedores também têm acesso antecipado ao recurso, com a Nvidia esperando as primeiras versões do programa aqui em junho.
O Techastuce recebeu as informações da NVIDIA com antecedência. Elas foram disponibilizadas mediante NDA. O único requisito era que a publicação fosse feita o mais cedo possível. O fabricante não teve influência no relatório, não havia obrigação de publicá-lo.
Tópicos: Calcutex 2025 Placas de vídeo GeForce nvidia

Engenheiro de formação, Alexandre compartilha seu conhecimento sobre o desempenho de GPUs para jogos e criação.