Nvidia Broadcast 2.0 i testet: provade det nya Studio AI-språket

Nvidia Broadcast 2.0 i testet: det nya AI-studiospråket provade 40 kommentarer

Tillsammans med RTX 50 och nya grafikdrivrutiner släpptes NVIDIA Broadcast i version 2.0. Beta Feature Studio-språket med användaren ska kunna höja kvaliteten på din mikrofon till nivån för en high-end tonstudio. Techconseil testade den nya funktionen.

Innehållsförteckning Nytt AI-studiospråk Provat Nvidia Broadcast 2.0 Studiospråk i teststudiospråk kan ändra röst Hur mycket GPU-prestanda behöver studiospråk? Modersmål och studiospråk i direkta jämförelsetester med en annan mikrofonkonfiguration, en annan mindre mikrofon och RTX-30-GPU en första slutsats på betan

Innehållsförteckning :

Nvidia Broadcast 2.0

Tillsammans med en marknadslansering av GeForce RTX 5090 (test) och RTX 5080 (test) släppte NVIDIA nya grafikdrivrutiner, som bland annat erbjuder en motsvarighet till AMDS AFMF i drivrutinen med mjuk rörelse . Men något hände också i resten av RTX-ekosystemet, till exempel på Nvidia Broadcast. Sedan dess har appen som släppts som RTX Voice i första hand erbjudit AI-stödd brus och rumsdämpning för röstinspelningar och språkåtergivning. Med Broadcast 2.0 vill NVIDIA inte bara kunna städa upp inspelningar, utan också kunna höja studioinspelningskvaliteten avsevärt, förklarar utvecklaren.

Inte överraskande används en AI-modell för detta, vilket kräver mycket prestanda: NVIDIA rekommenderar endast studiospråket från en GeForce RTX 5080, efter att även RTX 4080 nämndes. Faktum är att funktionen även kan aktiveras på äldre eller svagare GEForce-RTX-grafikkort; Redaktionen kunde ta reda på detta med en RTX 3080.

Nvidia Broadcast 2.0 med studiospråkbild 1 av 2

Studiospråket är för närvarande tillgängligt i beta. Tillverkaren talar över hela linjen om att funktionen kan öka användarnas mikrofonkvalitet till nivån för en avancerad inspelningsenhet och därmed simuleras en professionell inspelningsstudio. På grund av strömbehovet lämpar sig funktionen varken för språkchatt i spel eller parallellt med andra applikationer med höga GPU-krav, utan främst för chattströmmar eller podcastinspelningar. För andra scenarier är de klassiska RTX-strömningsfunktionerna för brus och rumeko-dämpning fortfarande tillgängliga.

Studiospråk i testet

Så hur låter den nya funktionen, hur mycket prestanda behöver den egentligen och kan Nvidia verkligen leverera den utlovade kvaliteten – även på billiga mikrofoner? Techconseil provade betaversionen av studions språk. Först användes ett AM4-system med GeForce RTX 4080, till vilket en Røde Nt-USB kopplas som mikrofon. Lyssnaren till CB Radio-podden från IT-basen känner till ljudprofilen för de resulterande inspelningarna mycket väl: Nativa låter sitt ljud, Fabian låter också i podden.

Studiospråket kan ändra rösten

Därför startar även nästa första testinspelning native, eftersom röstprofilen ändras märkbart med studiospråket. Med den första ändringen i den nya betafunktionen efter cirka 40 sekunder ser Fabian plötsligt väldigt annorlunda ut. Om detta är bättre eller sämre återstår att se, men en effekt kan inte avfärdas. Å ena sidan blir rösten djupare och varmare, men å andra sidan verkar den lite genetisk och – stor överraskning – delvis genererad när den genererar. Han märkte också att volymen generellt är högre och att sibilanta, skarpa tonhöjder jämnas ut.

Den högre volymen kan delvis förklaras av att Broadcast 2.0 skriver över mikrofonnivån som konfigurerats i Windows när studiospråket startar. Om funktionen är avslutad faller nivån också tillbaka till den tidigare inställda nivån. Eventuella problem med för hög mikrofonnivå märktes dock inte när studiospråket slogs på; Funktionen är tillförlitligt immun mot överskott eller brus.

Det bör noteras att de två kända NVIDIA-streamingfunktionerna inte längre kan aktiveras manuellt när man använder studions språk. Man kan anta att båda i det här fallet är aktiva i bakgrunden ändå eller att den nya AI-modellen kommer att tas över omedelbart, eftersom båda effekternas funktion är given.

Hur mycket GPU-prestanda behöver studion?

Och allt detta kostar säkert mycket prestanda, där Nvidia helst rekommenderar en GeForce RTX 5080? Ja och nej: GPU:n är faktiskt utmanad, men det behöver inte vara en RTX 5080. Efter att ha slagit på studiospråket, som för övrigt varar i några sekunder och ljudingången var kraftigt förvrängd, kom boostklockan av GeForce RTX 4080 omedelbart: från den ”lediga” klockan på 210 MHz på skrivbordet, runt 2,8 GHz. Under inspelningen fluktuerade klockan i allmänhet mellan 1200 och 1800 MHz.

Orsaken är en inte alltför försumbar GPU-användning, som enligt uppgiftshanteraren är runt 60% och runt 40% enligt GPU-Z. Jämfört med tomgång på skrivbordet ökade VRAM-kravet från cirka 1 GB till cirka 2,5 GB med öppna fönster. Som ett resultat ökar också prestandaförbrukningen för grafikkortet. Med två UHD-skärmar, en gång 144 Hz och en gång 60 Hz, är det vanligtvis 10 till 20 watt, beroende på telemetri, med studiospråket påslaget, blev 70 till 90 watt, även om inget sägs . Passivt, detta avfall kan endast tas bort för tillräckligt dimensionella GPU-kylare.

Modersmål och studio i direkt jämförelse

För en direkt jämförelse av den inhemska röst- eller mikrofonredigeringen och ljudspåret som manipulerats av Nvidias studiospråk, spelades samma rader två gånger, igen med Røde Nt-USB.

Effekten av AI-preparat är inte förvånande.

Testar med andra mikrofoner

Men hur ser det ut när andra mikrofoner och röster provas? Røde NT-USB har en RRP på runt 150 euro, men Nvidia kräver ingen specifik mikrofonkvalitet, så hur är det med billigare mikrofoner?

Samma inställning, mindre mikrofon

Redaktionen testade först detta med en mycket mindre Lavalier-mikrofon på en i övrigt oförändrad uppställning och med samma högtalare. Detaljer om mikrofonen går inte längre att hitta i nuläget, det är en modell från en kinesisk tillverkare som inte längre fanns tillgänglig, som köptes på Amazon för mindre än 20 euro för några år sedan. Desto mer intressant är frågan om hur studiotal kan hantera denna ingångskvalitet.

Med andra ord, beroende på det snäva svaret. Effekten av AI-modellen på röst och egenskaper är betydligt svagare. På sina ställen låter den manipulerade inspelningen matt och reducerad på höjden, men ibland också mer tydligt begriplig. Resultatet tyder dock på att studiospråket behöver lite utrymme för input för att kunna modellera ett utgående ljudspår som kanske inte sticker ut kvalitetsmässigt.

Annan röst och RTX-30-GPU

I ett sista test ändrades alla inställningar: Som grafikkort tar GeForce RTX 3080 över, som enligt Nvidias rekommendation har för lite prestanda för studiospråk. Samma text tillkännagavs med en annan röst på XSTRM-slutspelet Gear. Enligt RRP kostar den analoga mikrofonen Røde NT-USB runt 150 euro, men kan inte hålla detta pris utanför. Faktum är att XSTRM länge har funnits för cirka 90 euro och finns för närvarande från cirka 45 euro, så det är priset mellan de två modeller som testats hittills.

Följaktligen passar det också in i bilden att resultatet med studiospråket ligger mellan de två tidigare mikrofonerna, men mycket närmare den billiga Lavalier-mikrofonen. Den nya funktionen jämnar ut skarpa toner och särskilt höga toner. Så anmärkningsvärt att det resulterande soundtracket verkar lite tråkigt. Dessutom reducerades efterklangen och sången lät varmare och förändrad som med Røde Nt-USB, om än inte lika tydlig.

En första slutsats av betaversionen

Betaversionen av det nya studiospråket i Nvidia Broadcast 2.0 gör något – även på RTX GeForce RTX 40 och äldre grafikkort utan att helt skriva över dem. Resultaten av flera testinspelningar med olika mikrofoner och högtalare är dock blandade; Förändringar i ljudkvalitet är ibland subjektiva och inte en vinst. Det blev tydligt att studiospråket inte har samma effekt med varje mikrofon, tenderar att erbjuda bättre och därför framför allt dyrare modeller mer räckvidd.

I princip beror studiospråket därför på respektive användares krav och mål. På grund av GPU-belastningen är funktionen inte lämplig för språkchatt i spel och strömmande livespel, eftersom NVIDIA anpassar sig. I andra scenarier kan det vara irriterande att talarens röst kan förändras kraftigt beroende på mikrofon och röst. Detta är en potentiell nackdel, om en befintlig publik redan är van vid sin egen röst, men det gäller naturligtvis inte alla scenarier.

Sammantaget blir det tydligt vart Nvidia vill gå med studiospråket: tack vare maskininlärning ska ljudinspelningar låta fulla, fylliga och överlägsna alla om de spelas in under kontrollerade miljöförhållanden med en kondensatormikrofon med stort membran ett optimalt optimerat utrymme . Studiospråket tenderar dock att få sång att fungera generiskt och annorlunda. Ibland kan det se ut som inte bara mikrofonen, utan även högtalaren. Starkare närhet till inbyggda soundtrack-funktioner och röst är långt på önskelistan för vidare utveckling av betafunktioner.

Var den här artikeln intressant, användbar eller både och? Redaktionen välkomnar all support från Techoutil Pro och funktionshindrade annonsblockerare. Lär dig mer om ämnet datorbaserade skärmar.

Ämnen: Applikationer Ljud/Video/Foto GeForce grafikkort Mikrofon Nvidia