Nvidia Broadcast 2.0 testissä: uusi AI-studiokieli kokeili 40 kommenttia
RTX 50:n ja uusien näytönohjainten ohella NVIDIA Broadcast julkaistiin versiossa 2.0. Beta Feature Studio -kielen käyttäjän kanssa pitäisi pystyä parantamaan mikrofonisi laatua huippuluokan äänistudion tasolle. Techconseil kokeili uutta toimintoa.
Sisällysluettelo Uusi AI Studion kieli kokeiltu Nvidia Broadcast 2.0 Studio Language Testing Studio Language voi muuttaa ääntä Kuinka paljon GPU-suorituskykyä Studio Language tarvitsee? Natiivi- ja studiokieli suorissa vertailutesteissä toisella mikrofonikokoonpanolla, erilaisella pienemmällä mikrofonilla ja RTX-30-GPU:lla ensimmäinen päätelmä beetaversiosta
Nvidia Broadcast 2.0
GeForce RTX 5090 (testi) ja RTX 5080 (testi) markkinoille lanseerauksen ohella NVIDIA julkaisi uudet näytönohjaimet, jotka muun muassa tarjoavat vastineen AMDS AFMF:lle ohjaimissa sujuvasti liikkuvalla liikkeellä. Mutta jotain tapahtui myös muussa RTX-ekosysteemissä, esimerkiksi Nvidia Broadcastissa. Siitä lähtien RTX Voice -nimellä julkaistu sovellus on tarjonnut ensisijaisesti tekoälyn tukemaa melua ja huoneen vaimennusta äänitallenteisiin ja kielten toistoon. Broadcast 2.0:lla NVIDIA ei vain halua pystyä puhdistamaan tallenteita, vaan myös pystyä parantamaan merkittävästi studiotallennuslaatua, kehittäjä selittää.
Ei ole yllättävää, että tähän käytetään AI-mallia, joka vaatii paljon suorituskykyä: NVIDIA suosittelee studiokieltä vain GeForce RTX 5080:sta, sen jälkeen kun myös RTX 4080 mainittiin. Itse asiassa ominaisuus voidaan ottaa käyttöön myös vanhemmissa tai heikommissa GEForce-RTX-näytönohjainkorteissa; Toimitusryhmä pystyi selvittämään tämän RTX 3080:lla.
Nvidia Broadcast 2.0 studiokielisellä kuvalla 1/2
Studiokieli on tällä hetkellä saatavilla betaversiona. Valmistaja puhuu kautta linjan, että ominaisuus voi nostaa käyttäjien mikrofonin laadun huippuluokan äänityslaitteen tasolle ja siten simuloida ammattitallennusstudiota. Tehontarpeesta johtuen toiminto ei sovellu kielelliseen chattiin peleissä eikä rinnakkain muiden sovellusten kanssa, joilla on korkeat GPU-vaatimukset, vaan lähinnä chat-streameihin tai podcast-tallenteisiin. Muissa skenaarioissa klassiset RTX-suoratoistotoiminnot melun ja huoneen kaiun poistamiseksi ovat edelleen käytettävissä.
Studion kieli kokeessa
Joten miltä uusi ominaisuus kuulostaa, kuinka paljon suorituskykyä se todella tarvitsee ja voiko Nvidia todella tarjota luvatun laadun – jopa halvoilla mikrofoneilla? Techconseil kokeili studion kielen beta-versiota. Aluksi käytettiin AM4-järjestelmää GeForce RTX 4080:lla, johon Røde Nt-USB on kytketty mikrofoniksi. CB Radion podcastin kuuntelija IT-kannasta tietää syntyneiden äänitteiden ääniprofiilin erittäin hyvin: Nativa soi hänen soundinsa, Fabian myös soi podcastissa.
Studion kieli voi muuttaa ääntä
Siksi myös seuraava ensimmäinen testiäänitys alkaa natiivina, koska ääniprofiili muuttuu huomattavasti studiokielen mukana. Kun ensimmäinen muutos uuteen beta-ominaisuuteen noin 40 sekunnin jälkeen, Fabian näyttää yhtäkkiä hyvin erilaiselta. Onko tämä parempi vai huonompi, jää nähtäväksi, mutta vaikutusta ei voida sivuuttaa. Toisaalta ääni syvenee ja lämpenee, mutta toisaalta se vaikuttaa hieman geneettiseltä ja – iso yllätys – osittain generoituessaan. Hän huomasi myös, että äänenvoimakkuus on yleensä korkeampi ja sihisevät, terävät sävelet tasoittuvat.
Suurempi äänenvoimakkuus selittyy osittain sillä, että Broadcast 2.0 korvaa Windowsissa määritetyn mikrofonin tason, kun studiokieli alkaa. Jos toiminto on suoritettu loppuun, taso laskee myös takaisin aiemmin asetetulle tasolle. Liian korkean mikrofonin tason ongelmaa ei kuitenkaan havaittu, kun studiokieli laitettiin päälle; Toiminto on luotettavasti immuuni ylityksille tai melulle.
On huomattava, että kahta tunnettua NVIDIA-suoratoistoominaisuutta ei voi enää aktivoida manuaalisesti studion kieltä käytettäessä. Voidaan olettaa, että molemmat ovat tässä tapauksessa joka tapauksessa aktiivisia taustalla tai että uusi AI-malli otetaan heti haltuun, koska molempien efektien funktio on annettu.
Kuinka paljon GPU-suorituskykyä studio tarvitsee?
Ja kaikki tämä varmasti maksaa paljon suorituskykyä, kun Nvidia suosittelee ihanteellisesti GeForce RTX 5080:tä? Kyllä ja ei: GPU on itse asiassa haastettu, mutta sen ei tarvitse olla RTX 5080. Kun studiokieli on kytketty päälle, joka muuten kestää muutaman sekunnin ja äänitulo oli pahasti vääristynyt, boost-kello GeForce RTX 4080 -näytönohjain heti: 210 MHz:n tyhjäkäynnillä työpöydällä, noin 2,8 GHz. Tallennuksen aikana kello vaihteli yleensä 1200 ja 1800 MHz välillä.
Syynä on ei liian vähäinen GPU:n käyttö, joka on tehtävähallinnan mukaan noin 60 % ja GPU-Z:n mukaan noin 40 %. Verrattuna pöytäkoneen tyhjäkäyntiin VRAM-tarve kasvoi noin 1 Gt:sta noin 2,5 Gt:iin ikkunoiden ollessa auki. Tämän seurauksena myös näytönohjaimen suorituskyvyn kulutus kasvaa. Kahdella UHD-näytöllä, kerran 144 Hz ja kerran 60 Hz, se on yleensä 10-20 wattia telemetriasta riippuen, studiokieli päällä, 70-90 wattia tuli, vaikka mitään ei sanota . Passiivinen, tämä hukka voidaan poistaa vain riittävän kokoisille GPU-jäähdyttimille.
Äidinkieli ja studio suorassa vertailussa
Natiiviäänen tai mikrofonin editoinnin ja Nvidian studiokielellä manipuloidun ääniraidan suoraa vertailua varten samat rivit toistettiin kahdesti, jälleen Røde Nt-USB:llä.
Tekoälyvalmisteen vaikutus ei ole yllättävä.
Testaus muilla mikrofoneilla
Mutta miltä näyttää, kun kokeillaan muita mikrofoneja ja ääniä? Røde NT-USB:n RRP on noin 150 euroa, mutta Nvidia ei vaadi erityistä mikrofonin laatua, joten entä halvemmat mikrofonit?
Sama asetus, pienempi mikrofoni
Toimitusryhmä testasi tätä ensin paljon pienemmällä Lavalier-mikrofonilla muuten ennallaan ja samalla kaiuttimella. Mikrofonista ei tässä vaiheessa enää löydy yksityiskohtia, kyseessä on kiinalaisen valmistajan malli, jota ei enää ollut saatavilla ja joka ostettiin Amazonista muutama vuosi sitten alle 20 eurolla. Sitäkin mielenkiintoisempi on kysymys siitä, kuinka studiopuhe voi selviytyä tämän tulolaadun kanssa.
Toisin sanoen kapeasta vastauksesta riippuen. AI-mallin vaikutus ääneen ja ominaisuuksiin on huomattavasti heikompi. Paikoin manipuloitu nauhoitus kuulostaa tylsältä ja alennetulta, mutta joskus myös selkeämmin ymmärrettävältä. Tulos kuitenkin viittaa siihen, että studiokieli tarvitsee jonkin verran tilaa syötteelle, jotta voidaan mallintaa ulostuloääniraita, joka ei välttämättä erotu laadultaan.
Muu ääni ja RTX-30-GPU
Viimeisessä testissä kaikki asetukset muutettiin: Grafiikkakorttina ottaa vallan GeForce RTX 3080, jolla on Nvidian suosituksen mukaan liian vähän suorituskykyä studiokielelle. Sama teksti ilmoitettiin eri äänellä XSTRM-päätepeli Gearissa. RRP:n mukaan analoginen Røde NT-USB –mikrofoni maksaa noin 150 euroa, mutta ei voi ylläpitää tätä hintaa ulkona. Itse asiassa XSTRM on ollut pitkään saatavilla noin 90 eurolla ja tällä hetkellä noin 45 eurosta, joten tämä on hinta kahden tähän mennessä testatun mallin välillä.
Näin ollen kuvaan sopii myös se, että tulos studiokielellä on kahden edellisen mikrofonin välissä, mutta paljon lähempänä edullista Lavalier-mikrofonia. Uusi ominaisuus tasoittaa teräviä sävyjä ja erityisen korkeita sävyjä. Niin huomattava, että tuloksena oleva ääniraita näyttää hieman tylsältä. Lisäksi kaikua vähennettiin ja laulu kuulosti lämpimämmältä ja muuttui kuin Røde Nt-USB:n kohdalla, vaikkakaan ei niin selkeästi.
Ensimmäinen johtopäätös beta-versiosta
Nvidia Broadcast 2.0:n uuden studiokielen beta-versio tekee jotain – myös RTX GeForce RTX 40:llä ja vanhemmilla näytönohjaimilla ilman, että niitä korvataan kokonaan. Useiden testitallenteiden tulokset eri mikrofoneilla ja kaiuttimilla ovat kuitenkin ristiriitaisia; Äänenlaadun muutokset ovat joskus subjektiivisia eivätkä hyödy. Kävi selväksi, että studiokielellä ei ole samaa vaikutusta jokaisella mikrofonilla, sillä on taipumus tarjota parempia ja siksi ennen kaikkea kalliimmille malleille enemmän valikoimaa.
Periaatteessa studion kieli riippuu siis käyttäjien vaatimuksista ja tavoitteista. GPU-kuorman vuoksi toiminto ei sovellu kielikeskusteluun peleissä ja suoratoiston suoratoistoon NVIDIAn mukautuessa. Muissa tilanteissa voi olla ärsyttävää, että puhujan ääni voi muuttua voimakkaasti mikrofonin ja äänen mukaan. Tämä on mahdollinen haitta, jos olemassa oleva yleisö on jo tottunut omaan ääneensä, mutta ei tietenkään koske kaikkia skenaarioita.
Kaiken kaikkiaan käy selväksi, mihin Nvidia haluaa mennä studiokielellä: koneoppimisen ansiosta äänitallenteiden tulee kuulostaa täyteläisiltä, täyteläisiltä ja ylivoimaisilta, jos ne tallennetaan kontrolloiduissa ympäristöolosuhteissa suurella kalvolla varustetulla kondensaattorimikrofonilla ja optimaalisesti optimoidulla tilassa. . Studiokielellä on kuitenkin taipumus saada laulu toimimaan yleisesti ja eri tavalla. Joskus se voi näyttää paitsi mikrofonilta myös kaiuttimelta. Vahvempi läheisyys alkuperäisiin ääniraitaominaisuuksiin ja ääneen on kaukana toivelistalla beta-ominaisuuksien lisäkehityksessä.
Oliko tämä artikkeli mielenkiintoinen, hyödyllinen vai molemmat? Toimitustiimi toivottaa tervetulleeksi kaiken tuen Techoutil Prolta ja käytöstä poistetuilta mainosten estäjiltä. Lue lisää tietokonepohjaisista näytöistä.
Aiheet: Sovellukset Audio/Video/Photo GeForce Graphics Cards Mikrofoni Nvidia
Koulutukseltaan insinööri Alexandre jakaa tietämystään näytönohjaimien suorituskyvystä pelaamiseen ja luovaan työhön.