TEST

Deutliches Leistungsplus und künstliche Frames

GeForce RTX 4090 in der Founders Edition im Test

Portrait des Authors


Seite 1: Deutliches Leistungsplus und künstliche Frames: GeForce RTX 4090 in der Founders Edition im Test
571

Werbung

Mit der GeForce RTX 4090 gehen wir heute in die nächste Runde des heißen Herbst 2022. Die Ryzen-7000-Prozessoren machten den Anfang, danach folgten die ARC-Grafikkarten von Intel. Heute NVIDIA legt nach und darauf folgen werden noch Raptor Lake von Intel und die RDNA-3-Karten wiederum von AMD. NVIDIA legt mit der GeForce RTX 4090 im High-End-Segment los – im Grunde wie auch schon bei der Vorgänger-Generation. Um mehrere Faktoren schneller sollen die neuen Karten sein. Raytracing, DLSS und viele kleine Neurungen im Design werden die Themen der folgenden Seiten sein.

NVIDIA wählt für den Start der GeForce-RTX-40-Serie eine leicht abgeänderte Strategie. Den Anfang macht die GeForce RTX 4090, die recht nahe am Vollausbau der verwendeten AD102-GPU operiert. Mit 24 GB an Grafikspeicher und einem Power-Limit von 450 W zieht NVIDIA die Produktpalette von oben auf. Vermutlich will man sich bzw. dem Markt somit auch noch etwas Luft lassen die restlichen Modelle der GeForce-RTX-30-Serie verkaufen zu können. 

Ab November sollen dann auch die weiteren beiden Modelle erhältlich sein. Die GeForce RTX 4080 16 GB und eine weitere GeForce RTX 4080 mit 12 GB, die ehrlicherweise wohl besser den Modellnahmen GeForce RTX 4070 getragen hätte. Aber zu diesem Thema kommen wir noch.

Ohne größere Umschweife zu den technischen Daten.

Gegenüberstellung der Karten
  GeForce RTX 4080 12 GB GeForce RTX 4080 16 GBGeForce RTX 4090
GPU AD104
AD103AD102
Transistoren - -76 Milliarden
Fertigung 4 nm 4 nm4 nm
Chipgröße - -608,3 mm²
FP32-ALUs 7.680 9.72816.384
INT32-ALUs - --
SMs 60 76128
Tensor Cores 240 304512
RT Cores 60 76128
Basis-Takt 2.310 MHz 2.210 MHz2.230 MHz
Boost-Takt 2.610 MHz 2.505 MHz2.520 MHz
Speicherkapazität 12 GB 16 GB24 GB
Speichertyp GDDR6X GDDR6XGDDR6X
Speicherinterface 192 Bit 256 Bit384 Bit
Speichertakt - --
Speicherbandbreite 504 GB/s 720 GB/s1.008 GB/s
TDP 285 W 325 W450 W
Preis 1.099 Euro1.469 Euro1.949 Euro

Das Spitzenmodell und im Fokus des heutigen Tests ist die GeForce RTX 4090. Sie basiert auf der Ada102-GPU und bringt es auf 128 SMs, was gleichbedeutend mit 16.384 FP32-Recheneinheiten ist. Ebenfalls Bestandteil der GPU sind 512 Tensor Cores der 4. Generation sowie 128 RT Cores der 3. Generation. Die Tensor und RT Cores wurden weiter verbessert und sollen schneller sowie effizienter sein.

Den Basis-Takt der GeForce RTX 4090 gibt NVIDIA mit 2.230 MHz an. Per Boost soll sie 2.520 MHz erreichen können – vermutlich wird der Takt in der Praxis noch einmal deutlich darüber liegen – aber auch dazu später mehr. Die 24 GB an GDDR6X-Speicher sind über ein 384 Bit breites Speicherinterface angebunden und kommen auf eine Speicherbandbreite von 1.008 GB/s. Die TDP liegt bei 450 W. Für die Founders-Edition ruft NVIDIA einen Preis von 1.949 Euro auf.

Die beiden Varianten der GeForce RTX 4080 beleuchten wir heute nicht weiter. Dazu dann im November mehr.

Gegenüberstellung der Karten
  GeForce Titan RTXGeForce RTX 3090GeForce RTX 4090
GPU TU102GA102AD102
Transistoren 18,6 Milliarden28,3 Milliarden76 Milliarden
Fertigung 12 nm8 nm4 nm
Chipgröße 754 mm²628 mm²608,3 mm²
FP32-ALUs 4.60810.49616.384
INT32-ALUs -5.248-
SMs 7282128
Tensor Cores 576328512
RT Cores 7282128
Basis-Takt 1.350 MHz1.410 MHz2.230 MHz
Boost-Takt 1.770 MHz1.695 MHz2.520 MHz
Speicherkapazität 24 GB24 GB24 GB
Speichertyp GDDR6GDDR6XGDDR6X
Speicherinterface 384 Bit384 Bit384 Bit
Speichertakt 1.750 MHz1.219 MHz1.313 MHz
Speicherbandbreite 672 GB/s936 GB/s1.008 GB/s
TDP 280 W350 W450 W
Preis 2.699 Euro1.599 Euro1.949 Euro

In der direkten Gegenüberstellung zeigt sich die Entwicklung der XX90-Serie recht deutlich. Wir haben hier die Titan RTX als Vertreter oberhalb der RTX-2080-Ti in der Turing-Generation herangezogen. Der Speicherausbau ist über die drei Generationen mit 24 GB identisch, allerdings erhöht sich dessen Bandbreite stetig. Die Anzahl der Recheneinheiten hat sich im gleichen Zuge verdreifacht, wenngleich dies mit Ampere und Ada Lovelace und 128 FP32-Recheneinheiten pro SM auch ein anderer Aufbau ist.

Von der GeForce RTX 3090 ausgehend, legt die GeForce RTX 4090 im Ausbau der GPU eine ordentliche Schippe drauf. Wir sprechen hier von 60 % mehr FP32- und INT32-Recheneinheiten. Hinzu kommt eine Steigerung der vorhandenen RT und Tensor Cores im gleichen Maße. NVIDIA kann sich für Ada Lovelace auch auf TSMC verlassen und hat gemeinsam mit dem Auftragsfertiger einen optimierten 5-nm-Prozess namens 4N für NVIDIA entwickelt. 76 Milliarden Transistoren werden auf eine Fläche von 608,3 mm² gepackt. Die Fertigung ermöglicht es NVIDIA auch den Takt auf 2.500 MHz und mehr zu steigern.

Wer an der Fertigung und den weiteren Kenngrößen der neuen GPUs interessiert ist, für den haben wir folgende Tabelle zusammengestellt:

Gegenüberstellung der Ada-Lovelace-GPUs

AD102 AD103AD104
Die-Größe 608,3 mm² 378,6 mm²294,5 mm²
Anzahl der Transistoren 76 Milliarden 45,9 Milliarden35,8 Milliarden
Transistordichte 124,9 MTr/mm² 121,2 MTr/mm²121,6 MTr/mm²
SMs 144 8060
FP32-Recheneinheiten 18.432 10.2407.680
RT Cores 144 8060
Tensor Cores 576 320240
L2-Cache 96 MB 64 MB48 MB
ROPs 192 11280
Speicherinterface 384 Bit 256 Bit192 Bit

Die Abstufungen für die einzelnen Ada-Lovelace-GPUs und deren Ausbaustufen folgen einem fast linearen Verlauf. Wir sprechen hier immer vom Vollausbau, der auf den GeForce-Karten so aber nicht vorkommt. Einzig die AD104-GPU wird 1:1 so auf der GeForce RTX 4080 mit 12 GB verwendet. Als kleinster Chip scheint die Ausbeute hier gut genug zu sein. Die Transistordichte liegt bei knapp über 120 Millionen Transistoren pro Quadratmillimeter.