Nvidia Broadcast 2.0 em teste: experimentei a nova linguagem Studio AI

Broadcast 2.0 em teste: a nova linguagem do estúdio AI tentou 40 comentários

Nvidia Broadcast 2.0 em teste: experimentei a nova linguagem Studio AI

Junto com o RTX 50 e novos drivers gráficos, o NVIDIA Broadcast foi lançado na versão 2.0. A linguagem do Beta Feature Studio com o usuário deve ser capaz de aumentar a qualidade do seu microfone ao nível de um estúdio de tons de alta qualidade. Techconseil experimentou a nova função.

Índice Nova linguagem AI Studio testada Nvidia Broadcast 2.0 Studio Language em testes A linguagem Studio pode mudar a voz De quanto desempenho de GPU a linguagem Studio precisa? Linguagem nativa e de estúdio em testes de comparação direta com outra configuração de microfone, um microfone menor diferente e RTX-30-GPU uma primeira conclusão sobre o beta

Nvidia Transmissão 2.0

Junto com o lançamento no mercado da RTX 5090 (teste) e RTX 5080 (teste), a NVIDIA lançou novos drivers gráficos, que, entre outras coisas, oferecem uma contrapartida ao AMDS AFMF no driver com movimento suave. Mas algo também aconteceu no resto do ecossistema RTX, por exemplo na Nvidia Broadcast. Desde então, o aplicativo lançado como RTX Voice oferece principalmente supressão de ruído e ambiente com suporte de IA para gravações de voz e reprodução de idioma. Com o Broadcast 2.0, a NVIDIA não quer apenas poder limpar as gravações, mas também aumentar significativamente a qualidade da gravação em estúdio, explica o desenvolvedor.

Não é de surpreender que para isso seja utilizado um modelo de IA, que exige muito desempenho: a NVIDIA só recomenda a linguagem de estúdio de uma , depois que a RTX 4080 também foi mencionada. Na verdade, o recurso também pode ser habilitado em placas gráficas GEForce-RTX mais antigas ou mais fracas; A equipe editorial conseguiu descobrir isso com um RTX 3080.

Nvidia Broadcast 2.0 com linguagem de estúdio

Nvidia Broadcast 2.0 com linguagem de estúdio imagem 1 de 2

A linguagem do estúdio está atualmente disponível em beta. O fabricante fala de maneira geral que o recurso pode aumentar a qualidade do microfone dos usuários ao nível de um dispositivo de gravação de última geração e, assim, simular um estúdio de gravação profissional. Devido à necessidade de energia, a função não é adequada para bate-papo de idiomas em nem em paralelo com outros aplicativos com altos requisitos de GPU, mas principalmente para fluxos de bate-papo ou gravações de podcast. Para outros cenários, as funções clássicas de streaming RTX para cancelamento de ruído e eco ambiente ainda estão disponíveis.

Linguagem de estúdio no teste

Então, como soa o novo recurso, de quanto desempenho ele realmente precisa e a Nvidia pode realmente oferecer a qualidade prometida – mesmo em microfones baratos? A Techconseil experimentou a versão beta da linguagem do estúdio. Foi usado pela primeira vez um sistema AM4 com GeForce RTX 4080, ao qual um Røde Nt-USB está conectado como microfone. O ouvinte do podcast da Rádio CB da base de TI conhece muito bem o perfil sonoro das gravações resultantes: Nativa faz o som dele, Fabian também toca no podcast.

A linguagem do estúdio pode mudar a voz

Portanto, a próxima gravação de teste também começa nativamente, pois o perfil de voz muda visivelmente com o idioma do estúdio. Com a primeira mudança no novo recurso beta após cerca de 40 segundos, Fabian de repente parece muito diferente. Ainda não se sabe se isso é melhor ou pior, mas um efeito não pode ser descartado. Por um lado, a voz torna-se mais profunda e calorosa, mas por outro lado parece um pouco genética e – grande surpresa – parcialmente gerada à medida que gera. Ele também notou que o volume é geralmente mais alto e sibilante, os tons agudos são suavizados.

O volume mais alto pode ser parcialmente explicado pelo fato do Broadcast 2.0 substituir o nível do microfone configurado no Windows quando o idioma do estúdio é iniciado. Se a função for concluída, o nível também volta ao nível previamente definido. Porém, qualquer problema de nível de microfone muito alto não foi percebido quando o idioma do estúdio foi ativado; A função é imune de forma confiável a overshoot ou ruído.

Deve-se notar que os dois recursos conhecidos de streaming da NVIDIA não podem mais ser ativados manualmente ao usar a linguagem do estúdio. Pode-se presumir que ambos, neste caso, estão ativos em segundo plano de qualquer maneira ou que o novo modelo de IA será assumido imediatamente, porque a função de ambos os efeitos é dada.

De quanto desempenho de GPU o estúdio precisa?

E tudo isso certamente custa muito desempenho, onde o ideal é que a Nvidia recomende uma GeForce RTX 5080? Sim e não: a GPU é realmente desafiada, mas não precisa ser uma RTX 5080. Depois de ligar a linguagem de estúdio, que, aliás, dura alguns segundos e a entrada de áudio ficou muito distorcida, o boost clock da GeForce RTX 4080 imediatamente: do clock “inativo” de 210 MHz no desktop, em torno de 2,8 GHz. Durante a gravação, o clock geralmente oscilou entre 1.200 e 1.800 MHz.

A causa é um uso não muito desprezível da GPU, que segundo o gerenciador de tarefas gira em torno de 60% e cerca de 40% segundo o GPU-Z. Em comparação com a inatividade no desktop, o requisito de VRAM aumentou de cerca de 1 GB para cerca de 2,5 GB com as janelas abertas. Como resultado, o consumo de desempenho da placa gráfica também aumenta. Com duas telas UHD, uma vez de 144 Hz e outra de 60 Hz, costuma ser de 10 a 20 watts, dependendo da telemetria, com o idioma do estúdio ligado, passou de 70 a 90 watts, embora nada seja dito. Passivo, esse desperdício só pode ser removido para coolers de GPU suficientemente dimensionados.

Língua nativa e estúdio em comparação direta

Para uma comparação direta entre a edição nativa de voz ou microfone e a trilha sonora manipulada pela linguagem de estúdio da Nvidia, as mesmas falas foram tocadas duas vezes, novamente com o Røde Nt-USB.

O efeito da preparação da IA ​​não é surpreendente.

Testando com outros microfones

Mas como é quando outros microfones e vozes são testados? O Røde NT-USB tem um preço sugerido de cerca de 150 euros, mas a Nvidia não exige qualidade de microfone específica, então que tal microfones mais baratos?

Mesma configuração, microfone menor

A equipe editorial testou isso primeiro com um microfone Lavalier muito menor em uma configuração inalterada e com o mesmo alto-falante. Neste momento já não se encontram detalhes sobre o microfone, trata-se de um modelo de um fabricante chinês que já não estava disponível, que foi adquirido na Amazon por menos de 20 euros há alguns anos. Ainda mais interessante é a questão de como a fala em estúdio pode lidar com essa qualidade de entrada.

Em outras palavras, dependendo da resposta restrita. O efeito do modelo de IA na voz e nas características é significativamente mais fraco. Em alguns lugares, a gravação manipulada soa monótona e reduzida em altura, mas às vezes também é mais claramente compreensível. Porém, o resultado sugere que a linguagem de estúdio precisa de alguma margem de entrada para poder modelar uma trilha sonora de saída que pode não se destacar em termos de qualidade.

Outra voz e RTX-30-GPU

Em um teste final, todas as configurações foram alteradas: como placa de vídeo, assume a GeForce RTX 3080, que, segundo recomendação da Nvidia, tem desempenho muito baixo para linguagem de estúdio. O mesmo texto foi anunciado com uma voz diferente no XSTRM endgame Gear. Segundo o RRP, o microfone analógico Røde NT-USB custa cerca de 150 euros, mas não consegue manter esse preço lá fora. Na verdade, o XSTRM está disponível há muito tempo por cerca de 90 euros e atualmente está disponível a partir de cerca de 45 euros, então esse é o preço entre os dois modelos testados até agora.

Assim, também cabe na imagem que o resultado com a linguagem de estúdio esteja entre os dois microfones anteriores, mas muito mais próximo do microfone Lavalier barato. O novo recurso suaviza tons nítidos e especialmente agudos. Tão notável que a trilha sonora resultante parece um pouco monótona. Além disso, a reverberação foi reduzida e os vocais soaram mais quentes e alterados como no Røde Nt-USB, embora não tão claros.

Uma primeira conclusão para a versão beta

A versão beta da nova linguagem de estúdio no Nvidia Broadcast 2.0 faz alguma coisa – também em placas gráficas RTX GeForce RTX 40 e mais antigas, sem substituí-las completamente. No entanto, os resultados de múltiplas gravações de teste com diferentes microfones e alto-falantes são misturados; As alterações na qualidade do som às vezes são subjetivas e não são um ganho. Ficou claro que a linguagem de estúdio não tem o mesmo efeito com cada microfone, tende a oferecer modelos melhores e, portanto, acima de tudo mais caros, com maior alcance.

Em princípio, a linguagem do estúdio depende, portanto, dos requisitos e objetivos dos respectivos usuários. Devido à carga da GPU, a função não é adequada para chat de idiomas em jogos e streaming de gameplay ao vivo, conforme ajuste da NVIDIA. Em outros cenários, pode ser irritante que a voz do locutor mude drasticamente dependendo do microfone e da voz. Esta é uma desvantagem potencial, se um público existente já estiver habituado à sua própria voz, mas, claro, não se aplica a todos os cenários.

Em suma, fica claro onde a Nvidia quer chegar com a linguagem de estúdio: graças ao aprendizado de máquina, as gravações de som devem soar completas, completas e superiores a todas se gravadas em condições ambientais controladas com um microfone condensador com membrana grande e um espaço otimizado de forma ideal . No entanto, a linguagem de estúdio tende a fazer com que os vocais funcionem de forma genérica e diferente. Às vezes pode parecer não apenas um microfone, mas também um alto-falante. Uma maior proximidade com recursos nativos de trilha sonora e voz está na lista de desejos para o desenvolvimento de recursos beta.

Este artigo foi interessante, útil ou ambos? A equipe editorial agradece qualquer suporte do Techoutil Pro e bloqueadores de anúncios desativados. Saiba mais sobre o assunto de telas baseadas em computador.

Tópicos: Aplicativos Placas Gráficas GeForce Microfone Nvidia

Leave a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *

Scroll to Top