GeForce RTX 50: Nvidia publicerar teknisk vitbok för Blackwell

RTX 50: Nvidia publicerar teknisk vitbok för Blackwell 51-kommentarer

GeForce RTX 50: Nvidia publicerar teknisk vitbok för Blackwell

Bild: nvidia

Nvidia har publicerat vitboken för Blackwell-arkitekturen bakom GeForce RTX 50. Med detta dokument tar Nvidia upp relevanta förändringar mellan arkitekturerna och förklarar nya funktioner.

En djupare titt på arkitektur

Efter att -testerna och förra veckan GeForce RTX 5090-testerna publicerades kan Blackwell-vitboken på Nvidias hemsida nu tas fram.

Även om presentationen av Blackwell-arkitekturen huvudsakligen arbetades med nyckelord och de visade graferna visade relativt små arkitektoniska förändringar mellan ADA Lovelace och Blackwell, går vitboken längre. Storleken på vitboken på 57 sidor visar att det ligger mycket mer bakom Blackwell och framför allt mycket framtid.

Blackwell i en blick

I början av vitboken skrev Nvidia själv att Blackwell utvecklades för nästa generations AI-media och applikationer. Nvidia namnger följande punkter:

SM för neural-Q-skuggningsfunktioner för förbättring av energieffektiviteten4. Generering av RT-Kerne5. Tensor generation Kernenvidia 4RTX Neural Shaderai Management Processor (AMP) GDDR7-Steicherga Geometry

Vitboken presenterar punkter mer exakt utifrån förändringarna mellan ADA Lovelace och Blackwell och beskriver möjligheterna.

Till exempel beskrivs förändringen av strömmande multiprocessorer mellan Blackwell och Ada Lovelace närmare. I grafiken från Blackwells presentation kan vi se för SM:n att 32 shaders nu utför beräkningarna eller FP. Hos ADA Lovelace och Ampere kunde endast 16 shaders hantera 32-bitars antalet ganzers och flytande kombinationsnummer, de andra 16 aluses per shader-partition kunde inte utföra FP-beräkningar.

Med denna förändring förlorar dock Blackwell en förmåga i Ada Lovelace, som Nvidia introducerade med Turing: Int- och FP-beräkningar kan inte längre utföras i en barcykel i en shader-partition.

Svart Neural Shader Blackwell Neural Shader (Bild: Nvidia)

Mega geometri och hyllor

Nvidia lägger särskild vikt vid megageometri i vitboken och dess effekter på ekerkärnor. Med megageometri borde det inte längre finnas ett behov av att använda lågupplösta proxyer för strålspårningseffekter. Detta är avsett att tillåta moderna LOD-system (detaljnivå), såsom nanite i Unreal Engine 5, att beräkna strålspårningseffekter i full detalj.

NVIDIA beskriver två stora hinder som hindrar strålspårningseffekter från att beräknas i moderna LOD-system med fullständiga geometridetaljer: ”klusterbaserade LOD-uppdateringar” och det stora antalet olika objekt i moderna spel. NVIDIA introducerar PTLAS (Partitioned Higher Level Acceleration Structure) och utökar därmed den klassiska TLAS (Higher Level Acceleration Structure).

Mega Geometry-funktionen är tillgänglig för alla RTX-grafikkort sedan Turing. Under 12 kan utvecklare använda NVAPI på funktioner. Det finns en tillverkartillägg för Vulkan och Nvidias Optix får inbyggt stöd för version 9.0.

Och mycket mer

Förutom ändringarna från Blackwell till Ada Lovelace och den nya megageometrin, som presenteras kort här, finns det andra förändringar som skulle gå utöver räckvidden vid denna tidpunkt. Om du vill lära dig mer om Blackwell och Neural Shader har du nu de nödvändiga dokumenten med det vita papperet.

NVIDIA GEFORCE RTX 5090 I testet: DLSS 4 PENGAR MFG 575 Watt i formatnvidia Geforce RTX 5080 i testet: DLSS 4 MFG och en liten FPS-Boostnvidia Geforce ”Blackwell”: Tekniska detaljer om RTX 50090 &B5090 & B5090, 5090, 5090 Tekniska detaljer om RTX 5090, 5080 & 5070 (Blackwell”: Tekniska detaljer om RTX 5090, 5080 & 5070 Ti) Nvidia DLSS 4: Multi-frame generation och ett nytt neuralt nätverk Nvidia Reflex 2 i detalj: Till exempel, Frame Warp minskar latensen i alla nvidia geforce RTX 5000-scenarier – RTX 5080 RTX-specifikationer 5070 Arkitektur Blackwell GPU GB203 GB205 GB205 Transistorer 92,2 miljarder 45,6 miljarder 45,6 miljarder 31,1 miljarder storlek 750 mm² 378 mm² 263 mm² SM 170 84 70 48 FP32-ALUS 6146600 CORES. 170, 4:e gen 84, 4:e gen 70, 4:e gen 48, 4:e genkärnor 680, 5:e gen 336, 5:e gen 280, 5:e gen 192, 5:e genen boostklocka 2,407 MHz 2,452 MHz 2,512 MHz 4 MHz 0,512 Tfps prestanda 4 MHz Tflops 43,9 Tflops 30,9 Tflops FP16 prestanda 104,8 Tflops 56,3 Tflops 43,9 Tflops 30,9 Tflops FP16 prestanda via tensor 419 TFlops 175,8 TFlops 123,5 Textur enheter 0 RO 09 8 RO 2PS 176 112 96 80 L2 -CACH 98.304 KB 65.536 KB 49.152 KB Minne 32 GB GDDR7 16 GB GDDR7 12 GB GDDR7-THROULHPUT 28 GBP 960 GB/s 896 GB/s PCIe-kortplats 672 5.0 × 16 videomotor 3 × NVEC (nionde generationen)
2 × NVDEC (6:e generationen) 2 × NVENC (9:e generationen)
2 × NVDEC (6:e generationen) 2 × NVENC (9:e generationen)
1 × NVDEC (6:e generationen) 1 × NVENC (9:e generationen)
1 × NVDDC (6:e Genp) TDP 575 WATT 300 Klocka 250 Klocka: Dangerdi-Dirtiart Raida nvidia nvidia nvidia svart

Lämna en kommentar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *

Rulla till toppen