GeForce RTX 50: Nvidia julkaisee tekniset tiedot Blackwell 51 -kommenteista
Kuva: nvidia
Nvidia on julkaissut valkoisen kirjan GeForce RTX 50:n takana olevasta Blackwell-arkkitehtuurista. Tässä asiakirjassa Nvidia käsittelee arkkitehtuurien välisiä olennaisia muutoksia ja selittää uusia ominaisuuksia.
Syvällisempi katsaus arkkitehtuuriin
GeForce RTX 5080 -testien ja viime viikolla GeForce RTX 5090 -testien julkaisun jälkeen Nvidian verkkosivuilla oleva Blackwellin valkoinen kirja voidaan nyt avata.
Vaikka Blackwell-arkkitehtuurin esittely tehtiin pääosin avainsanoilla ja esitetyt kaaviot osoittivat suhteellisen pieniä arkkitehtonisia muutoksia ADA Lovelacen ja Blackwellin välillä, valkoinen kirja menee pidemmälle. 57-sivuisen valkoisen paperin koko osoittaa, että Blackwellin takana on paljon muuta ja ennen kaikkea paljon tulevaisuutta.
Blackwell yhdellä silmäyksellä
Valkoisen kirjan alussa Nvidia itse kirjoitti, että Blackwell on kehitetty seuraavan sukupolven tekoälymediaa ja -sovelluksia varten. Nvidia nimeää seuraavat kohdat:
SM hermo-Q-varjostustoiminnoille energiatehokkuuden parantamiseksi4. RT-Kerne5:n sukupolvi. Tensorin sukupolvi Kernenvidia DLSS 4RTX Neural Shaderai Management Processor (AMP) GDDR7-Steikherga Geometry
Valkoisessa kirjassa esitellään nämä kohdat tarkemmin ADA Lovelacen ja Blackwellin välisten muutosten perusteella ja kuvataan mahdollisuuksia.
Esimerkiksi Blackwellin ja Ada Lovelacen välisten streaming-moniprosessorien muutosta kuvataan tarkemmin. Blackwellin esityksen grafiikassa voimme nähdä SM:n osalta, että 32 varjostajaa suorittaa nyt laskelmia tai FP:tä. ADA Lovelacessa ja Amperessa vain 16 varjostajaa pystyi käsittelemään 32-bittistä ganzerien ja nestemäisten yhdistelmänumeroiden määrää, muut 16 aluet per shader-osio eivät pystyneet suorittamaan FP-laskelmia.
Tämän muutoksen myötä Blackwell kuitenkin menettää Ada Lovelacen kyvyn, jonka Nvidia esitteli Turingin kanssa: Int- ja FP-laskelmia ei voida enää suorittaa varjostusosion palkkisyklissä.
Blackwell Neural Shader (kuva: Nvidia)
Mega geometria ja hyllyt
Nvidia korostaa erityisesti valkoisen paperin megageometriaa ja sen vaikutuksia pinnan ytimiin. Megageometrian ansiosta ei pitäisi enää olla tarvetta käyttää matalaresoluutioisia välityspalvelimia säteenseurantatehosteille. Tämän tarkoituksena on mahdollistaa nykyaikaisten LOD-järjestelmien, kuten Unreal Engine 5:n naniittien, laskea säteenseurantatehosteet täydellä tarkkuudella.
NVIDIA kuvaa kaksi suurta estettä, jotka estävät säteenseurantatehosteiden laskemisen nykyaikaisissa LOD-järjestelmissä täydellisillä geometriayksityiskohtilla: ”klusteripohjaiset LOD-päivitykset” ja suuri määrä erilaisia kohteita nykyaikaisissa peleissä. NVIDIA esittelee PTLAS:n (Partitioned Higher Level Acceleration Structure) ja laajentaa siten klassista TLAS-rakennetta (Higher Level Acceleration Structure).
Mega Geometry -ominaisuus on saatavilla kaikille RTX-näytönohjainkorteille Turingista lähtien. DirectX 12:ssa kehittäjät voivat käyttää NVAPI:tä funktioissa. Vulkanille on valmistajan laajennus ja Nvidian Optix saa alkuperäisen tuen versiolle 9.0.
Ja paljon muuta
Tässä lyhyesti esiteltyjen Blackwellistä Ada Lovelaceen ja uuden megageometrian lisäksi on muitakin muutoksia, jotka ylittäisivät tässä vaiheessa. Jos haluat oppia lisää Blackwellistä ja Neural Shaderista, sinulla on nyt tarvittavat asiakirjat valkoisen paperin mukana.
NVIDIA GEFORCE RTX 5090 Testissä: DLSS 4 SCORES MFG 575 Watts muodossanvidia Geforce RTX 5080 testissä: DLSS 4 MFG ja pieni FPS-Boostnvidia Geforce ”Blackwell”: Tekniset tiedot RTX 5080,5070 &lack RTX:n tekniset tiedot 5090, 5080 & 5070 (Blackwell”: RTX 5090, 5080 ja 5070 Ti tekniset tiedot) Nvidia DLSS 4: Multi-frame-sukupolvi ja uusi hermoverkko Nvidia Reflex 2 yksityiskohtaisesti: Esimerkiksi Frame Warp vähentää latenssia kaikissa nvidioissa RTX 5000 -skenaariot – RTX 5080 RTX -määritykset 5070 Arkkitehtuuri Blackwell GPU GB203 GB205 GB205 Transistorit 92,2 miljardia 45,6 miljardia 45,6 miljardia 31,1 miljardia kokoa 750 mm² 378 mm² 263 mm² SM 170 84 70 48 FP32-ALUS CO.617400 170, 4. sukupolvi 84, 4. sukupolvi 70, 4. sukupolvi 48, 4. sukupolvi ytimet 680, 5. sukupolvi 336, 5. sukupolvi 280, 5. geeni 192, 5. sukupolvi 192, 5. sukupolvi tehostettu kello 2,407 MHz MHz 2,452 MHz 2,452 MHz 3 FP 452 MHz 2,522 MHz Tflops 43.9 Tflops 30.9 Tflops FP16 suorituskyky 104.8 Tflops 56.3 Tflops 43.9 Tflops 30.9 Tflops FP16 suorituskyky tensorin kautta 419 TFlops 175.8 TFlops 123.5 Tekstuuri 3608 yksikköä 3608 176 112 96 80 L2 -CACH 98,304 KB 65,536 KB 49,152 KB Muisti 32 Gt GDDR7 16 Gt GDDR7 12 Gt GDDR7-THROULHPUT 28 GBP 960 Gt/s 862 Gt/s 862 Gt/s 5,0 × 16 videomoottori 3 × NVEC (9. sukupolvi)
2 × NVDEC (6. sukupolvi) 2 × NVENC (9. sukupolvi)
2 × NVDEC (6. sukupolvi) 2 × NVENC (9. sukupolvi)
1 × NVDEC (6. sukupolvi) 1 × NVENC (9. sukupolvi)
1 × NVDDC (6th Genp) TDP 575 WATT 300 Watch 250 Watch: Dangerdi-Dirtiart Raida nvidia nvidia nvidia musta
Koulutukseltaan insinööri Alexandre jakaa tietämystään näytönohjaimien suorituskyvystä pelaamiseen ja luovaan työhön.