Nvidia Broadcast 2.0 i testen: prøvede det nye Studio AI-sprog

Nvidia Broadcast 2.0 i testen: det nye AI-studiesprog prøvede 40 kommentarer

Sammen med RTX 50 og nye grafikdrivere blev NVIDIA Broadcast udgivet i version 2.0. Beta Feature Studio-sproget med brugeren skulle være i stand til at øge kvaliteten af din mikrofon til niveauet for et avanceret tonestudie. Techconseil prøvede den nye funktion.

Indholdsfortegnelse Nyt AI-studiesprog Prøvet Nvidia Broadcast 2.0-studiesprog i teststudiesprog kan ændre stemme Hvor meget GPU-ydelse har studiesproget brug for? Modersmål og studiesprog i direkte sammenligningstest med en anden mikrofonkonfiguration, en anden mindre mikrofon og RTX-30-GPU en første konklusion på betaen

Indholdsfortegnelse :

Nvidia Broadcast 2.0

Sammen med en markedslancering af GeForce RTX 5090 (test) og RTX 5080 (test) udgav NVIDIA nye grafikdrivere, som blandt andet tilbyder en pendant til AMDS AFMF i driveren med jævn bevægelse . Men der skete også noget i resten af RTX-økosystemet, for eksempel hos Nvidia Broadcast. Siden da har appen udgivet som RTX Voice primært tilbudt AI-understøttet støj og rumundertrykkelse til stemmeoptagelser og sproggengivelse. Med Broadcast 2.0 ønsker NVIDIA ikke kun at kunne rydde op i optagelser, men også at kunne øge studieoptagelseskvaliteten markant, forklarer udvikleren.

Ikke overraskende bruges en AI-model til dette, hvilket kræver en del ydeevne: NVIDIA anbefaler kun studiesproget fra en GeForce RTX 5080, efter at RTX 4080 også blev nævnt. Faktisk kan funktionen også aktiveres på ældre eller svagere GEForce-RTX-grafikkort; Det var redaktionen i stand til at finde ud af med en RTX 3080.

Nvidia Broadcast 2.0 med studiesprogbillede 1 af 2

Studiesproget er i øjeblikket tilgængeligt i beta. Producenten taler over hele linjen om, at funktionen kan øge brugernes mikrofonkvalitet til niveauet af en high-end optageenhed og dermed simuleres et professionelt optagestudie. På grund af strømkravet er funktionen hverken egnet til sprogchat i spil eller parallelt med andre applikationer med høje GPU-krav, men primært til chatstreams eller podcast-optagelser. For andre scenarier er de klassiske RTX-streamingfunktioner til støj- og rumekko-annullering stadig tilgængelige.

Studiesprog i testen

Så hvordan lyder den nye funktion, hvor meget ydeevne har den egentlig brug for og kan Nvidia virkelig levere den lovede kvalitet – selv på billige mikrofoner? Techconseil prøvede betaversionen af studiets sprog. Der blev først brugt et AM4-system med GeForce RTX 4080, hvortil der er tilsluttet en Røde Nt-USB som mikrofon. Lytteren af CB Radio-podcasten fra IT-basen kender lydprofilen af de resulterende optagelser meget godt: Nativa lyder sin lyd, Fabian lyder også i podcasten.

Studiesproget kan ændre stemmen

Derfor starter den næste første testoptagelse også native, fordi stemmeprofilen ændrer sig mærkbart med studiesproget. Med den første ændring i den nye beta-funktion efter cirka 40 sekunder, ser Fabian pludselig meget anderledes ud. Hvorvidt dette er bedre eller værre, skal vise sig, men en effekt kan ikke afvises. På den ene side bliver stemmen dybere og varmere, men på den anden side virker den lidt genetisk og – stor overraskelse – til dels genereret efterhånden som den genererer. Han lagde også mærke til, at lydstyrken generelt er højere, og støjsvage, skarpe tonehøjder udjævnes.

Den højere lydstyrke kan delvist forklares med, at Broadcast 2.0 overskriver mikrofonniveauet, der er konfigureret i Windows, når studiesproget starter. Hvis funktionen er fuldført, falder niveauet også tilbage til det tidligere indstillede niveau. Ethvert problem med for højt mikrofonniveau blev dog ikke bemærket, da studiesproget blev slået til; Funktionen er pålideligt immun over for overskridelse eller støj.

Det skal bemærkes, at de to kendte NVIDIA-streamingfunktioner ikke længere kan aktiveres manuelt ved brug af studiets sprog. Det kan antages, at begge i dette tilfælde alligevel er aktive i baggrunden, eller at den nye AI-model vil blive overtaget med det samme, fordi funktionen af begge effekter er givet.

Hvor meget GPU-ydelse har studiet brug for?

Og alt dette koster bestemt en del ydelse, hvor Nvidia ideelt set anbefaler en GeForce RTX 5080? Ja og nej: GPU’en er faktisk udfordret, men det behøver ikke at være en RTX 5080. Efter at have tændt for studiesproget, som i øvrigt varer et par sekunder, og lydindgangen var kraftigt forvrænget, blev boost-uret slået til. af GeForce RTX 4080 med det samme: fra det “ledige” ur på 210 MHz på skrivebordet, omkring 2,8 GHz. Under optagelse svingede uret generelt mellem 1200 og 1800 MHz.

Årsagen er et ikke alt for ubetydeligt GPU-forbrug, som ifølge task manager er omkring 60% og omkring 40% ifølge GPU-Z. Sammenlignet med tomgang på skrivebordet steg VRAM-kravet fra omkring 1 GB til omkring 2,5 GB med åbne vinduer. Som følge heraf stiger grafikkortets ydelsesforbrug også. Med to UHD-skærme, én gang 144 Hz og én gang 60 Hz, er det normalt 10 til 20 watt, afhængigt af telemetrien, med studiesproget slået til, blev 70 til 90 watt, selvom der ikke er sagt noget. Passivt, dette affald kan kun fjernes for tilstrækkeligt dimensionerede GPU-kølere.

Modersmål og studie i direkte sammenligning

For en direkte sammenligning af den oprindelige stemme- eller mikrofonredigering og lydsporet manipuleret af Nvidias studiesprog, blev de samme linjer spillet to gange, igen med Røde Nt-USB.

Effekten af AI-forberedelse er ikke overraskende.

Test med andre mikrofoner

Men hvordan ser det ud, når andre mikrofoner og stemmer prøves? Røde NT-USB har en vejledende pris på omkring 150 euro, men Nvidia kræver ikke specifik mikrofonkvalitet, så hvad med billigere mikrofoner?

Samme opsætning, mindre mikrofon

Dette testede redaktionen først med en meget mindre Lavalier-mikrofon på et ellers uændret setup og med samme højttaler. Detaljer om mikrofonen kan ikke længere findes på nuværende tidspunkt, det er en model fra en kinesisk producent, der ikke længere var tilgængelig, som blev købt på Amazon for under 20 euro for et par år siden. Så meget desto mere interessant er spørgsmålet om, hvordan studietale kan klare denne inputkvalitet.

Med andre ord afhængig af det snævre svar. Effekten af AI-modellen på stemme og karakteristika er væsentligt svagere. Nogle steder lyder den manipulerede optagelse mat og reduceret i højden, men nogle gange også mere tydeligt forståelig. Resultatet tyder dog på, at studiesproget har brug for noget spillerum for input for at kunne modellere et output-lydspor, der måske ikke skiller sig ud kvalitetsmæssigt.

Anden stemme og RTX-30-GPU

I en afsluttende test blev alle indstillinger ændret: Som grafikkort tager GeForce RTX 3080 over, som ifølge Nvidias anbefaling har for lidt ydeevne til studiesprog. Den samme tekst blev annonceret med en anden stemme på XSTRM-slutspillet Gear. Ifølge RRP koster Røde NT-USB analog mikrofon omkring 150 euro, men kan ikke opretholde denne pris udenfor. Faktisk har XSTRM længe været tilgængelig for omkring 90 euro og fås lige nu fra omkring 45 euro, så det er prisen mellem de to testede modeller indtil videre.

Følgelig passer det også ind i billedet, at resultatet med studiesproget ligger mellem de to tidligere mikrofoner, men meget tættere på den billige Lavalier-mikrofon. Den nye funktion udglatter skarpe toner og især høje toner. Så bemærkelsesværdigt, at det resulterende soundtrack virker lidt kedeligt. Derudover blev rumklangen reduceret og vokalen lød varmere og ændret som med Røde Nt-USB, dog ikke så tydelig.

En første konklusion på betaversionen

Betaversionen af det nye studiesprog i Nvidia Broadcast 2.0 gør noget – også på RTX GeForce RTX 40 og ældre grafikkort uden helt at overskrive dem. Resultaterne af flere testoptagelser med forskellige mikrofoner og højttalere er dog blandet; Ændringer i lydkvaliteten er nogle gange subjektive og ikke en gevinst. Det blev klart, at studiesproget ikke har den samme effekt med hver mikrofon, har en tendens til at tilbyde bedre og derfor frem for alt dyrere modeller mere rækkevidde.

I princippet afhænger studiesproget derfor af de respektive brugeres krav og mål. På grund af GPU-belastningen er funktionen ikke egnet til sprogchat i spil og streaming live gameplay, da NVIDIA justerer. I andre scenarier kan det være irriterende, at talerens stemme kan ændre sig alvorligt afhængigt af mikrofonen og stemmen. Dette er en potentiel ulempe, hvis et eksisterende publikum allerede er vant til deres egen stemme, men det gælder naturligvis ikke for alle scenarier.

Alt i alt bliver det klart, hvor Nvidia vil hen med studiesproget: takket være maskinlæring skal lydoptagelser lyde fuld, fyldig og overlegen i forhold til alle, hvis de optages under kontrollerede miljøforhold med en kondensatormikrofon med stor membran og optimalt optimeret rum . Studiesprog har dog en tendens til at få vokal til at fungere generisk og anderledes. Nogle gange kan det ligne ikke kun mikrofonen, men også højttaleren. Stærkere nærhed til native soundtrack-funktioner og stemme er langt på ønskesedlen for yderligere beta-funktionsudvikling.

Var denne artikel interessant, nyttig eller begge dele? Redaktionen hilser enhver støtte fra Techoutil Pro og deaktiverede annonceblokkere velkommen. Lær mere om emnet computerbaserede skærme.

Emner: Applikationer Lyd/Video/Foto GeForce grafikkort Mikrofon Nvidia