Deutliches Leistungsplus und künstliche Frames

GeForce RTX 4090 in der Founders Edition im Test

Von Andreas Schilling
Dienstag, 11.10.2022 um 15:00 Uhr

Seite 1: Deutliches Leistungsplus und künstliche Frames: GeForce RTX 4090 in der Founders Edition im Test

571

Mit der GeForce RTX 4090 gehen wir heute in die nächste Runde des heißen Herbst 2022. Die Ryzen-7000-Prozessoren machten den Anfang, danach folgten die ARC-Grafikkarten von Intel. Heute NVIDIA legt nach und darauf folgen werden noch Raptor Lake von Intel und die RDNA-3-Karten wiederum von AMD. NVIDIA legt mit der GeForce RTX 4090 im High-End-Segment los – im Grunde wie auch schon bei der Vorgänger-Generation. Um mehrere Faktoren schneller sollen die neuen Karten sein. Raytracing, DLSS und viele kleine Neurungen im Design werden die Themen der folgenden Seiten sein.

NVIDIA wählt für den Start der GeForce-RTX-40-Serie eine leicht abgeänderte Strategie. Den Anfang macht die GeForce RTX 4090, die recht nahe am Vollausbau der verwendeten AD102-GPU operiert. Mit 24 GB an Grafikspeicher und einem Power-Limit von 450 W zieht NVIDIA die Produktpalette von oben auf. Vermutlich will man sich bzw. dem Markt somit auch noch etwas Luft lassen die restlichen Modelle der GeForce-RTX-30-Serie verkaufen zu können.

Ab November sollen dann auch die weiteren beiden Modelle erhältlich sein. Die GeForce RTX 4080 16 GB und eine weitere GeForce RTX 4080 mit 12 GB, die ehrlicherweise wohl besser den Modellnahmen GeForce RTX 4070 getragen hätte. Aber zu diesem Thema kommen wir noch.

NVIDIA, GeForce RTX 4090 Founders Edition, GeForce RTX 4090, GeForce, GeForce RTX, Ada Lovelace

Ohne größere Umschweife zu den technischen Daten.

Gegenüberstellung der Karten
	GeForce RTX 4080 12 GB	GeForce RTX 4080 16 GB	GeForce RTX 4090
GPU	AD104	AD103	AD102
Transistoren	-	-	76 Milliarden
Fertigung	4 nm	4 nm	4 nm
Chipgröße	-	-	608,3 mm²
FP32-ALUs	7.680	9.728	16.384
INT32-ALUs	-	-	-
SMs	60	76	128
Tensor Cores	240	304	512
RT Cores	60	76	128
Basis-Takt	2.310 MHz	2.210 MHz	2.230 MHz
Boost-Takt	2.610 MHz	2.505 MHz	2.520 MHz
Speicherkapazität	12 GB	16 GB	24 GB
Speichertyp	GDDR6X	GDDR6X	GDDR6X
Speicherinterface	192 Bit	256 Bit	384 Bit
Speichertakt	-	-	-
Speicherbandbreite	504 GB/s	720 GB/s	1.008 GB/s
TDP	285 W	325 W	450 W
Preis	1.099 Euro	1.469 Euro	1.949 Euro

Das Spitzenmodell und im Fokus des heutigen Tests ist die GeForce RTX 4090. Sie basiert auf der Ada102-GPU und bringt es auf 128 SMs, was gleichbedeutend mit 16.384 FP32-Recheneinheiten ist. Ebenfalls Bestandteil der GPU sind 512 Tensor Cores der 4. Generation sowie 128 RT Cores der 3. Generation. Die Tensor und RT Cores wurden weiter verbessert und sollen schneller sowie effizienter sein.

Den Basis-Takt der GeForce RTX 4090 gibt NVIDIA mit 2.230 MHz an. Per Boost soll sie 2.520 MHz erreichen können – vermutlich wird der Takt in der Praxis noch einmal deutlich darüber liegen – aber auch dazu später mehr. Die 24 GB an GDDR6X-Speicher sind über ein 384 Bit breites Speicherinterface angebunden und kommen auf eine Speicherbandbreite von 1.008 GB/s. Die TDP liegt bei 450 W. Für die Founders-Edition ruft NVIDIA einen Preis von 1.949 Euro auf.

Die beiden Varianten der GeForce RTX 4080 beleuchten wir heute nicht weiter. Dazu dann im November mehr.

Gegenüberstellung der Karten
	GeForce Titan RTX	GeForce RTX 3090	GeForce RTX 4090
GPU	TU102	GA102	AD102
Transistoren	18,6 Milliarden	28,3 Milliarden	76 Milliarden
Fertigung	12 nm	8 nm	4 nm
Chipgröße	754 mm²	628 mm²	608,3 mm²
FP32-ALUs	4.608	10.496	16.384
INT32-ALUs	-	5.248	-
SMs	72	82	128
Tensor Cores	576	328	512
RT Cores	72	82	128
Basis-Takt	1.350 MHz	1.410 MHz	2.230 MHz
Boost-Takt	1.770 MHz	1.695 MHz	2.520 MHz
Speicherkapazität	24 GB	24 GB	24 GB
Speichertyp	GDDR6	GDDR6X	GDDR6X
Speicherinterface	384 Bit	384 Bit	384 Bit
Speichertakt	1.750 MHz	1.219 MHz	1.313 MHz
Speicherbandbreite	672 GB/s	936 GB/s	1.008 GB/s
TDP	280 W	350 W	450 W
Preis	2.699 Euro	1.599 Euro	1.949 Euro

In der direkten Gegenüberstellung zeigt sich die Entwicklung der XX90-Serie recht deutlich. Wir haben hier die Titan RTX als Vertreter oberhalb der RTX-2080-Ti in der Turing-Generation herangezogen. Der Speicherausbau ist über die drei Generationen mit 24 GB identisch, allerdings erhöht sich dessen Bandbreite stetig. Die Anzahl der Recheneinheiten hat sich im gleichen Zuge verdreifacht, wenngleich dies mit Ampere und Ada Lovelace und 128 FP32-Recheneinheiten pro SM auch ein anderer Aufbau ist.

Von der GeForce RTX 3090 ausgehend, legt die GeForce RTX 4090 im Ausbau der GPU eine ordentliche Schippe drauf. Wir sprechen hier von 60 % mehr FP32- und INT32-Recheneinheiten. Hinzu kommt eine Steigerung der vorhandenen RT und Tensor Cores im gleichen Maße. NVIDIA kann sich für Ada Lovelace auch auf TSMC verlassen und hat gemeinsam mit dem Auftragsfertiger einen optimierten 5-nm-Prozess namens 4N für NVIDIA entwickelt. 76 Milliarden Transistoren werden auf eine Fläche von 608,3 mm² gepackt. Die Fertigung ermöglicht es NVIDIA auch den Takt auf 2.500 MHz und mehr zu steigern.

Wer an der Fertigung und den weiteren Kenngrößen der neuen GPUs interessiert ist, für den haben wir folgende Tabelle zusammengestellt:

Gegenüberstellung der Ada-Lovelace-GPUs
	AD102	AD103	AD104
Die-Größe	608,3 mm²	378,6 mm²	294,5 mm²
Anzahl der Transistoren	76 Milliarden	45,9 Milliarden	35,8 Milliarden
Transistordichte	124,9 MTr/mm²	121,2 MTr/mm²	121,6 MTr/mm²
SMs	144	80	60
FP32-Recheneinheiten	18.432	10.240	7.680
RT Cores	144	80	60
Tensor Cores	576	320	240
L2-Cache	96 MB	64 MB	48 MB
ROPs	192	112	80
Speicherinterface	384 Bit	256 Bit	192 Bit

Die Abstufungen für die einzelnen Ada-Lovelace-GPUs und deren Ausbaustufen folgen einem fast linearen Verlauf. Wir sprechen hier immer vom Vollausbau, der auf den GeForce-Karten so aber nicht vorkommt. Einzig die AD104-GPU wird 1:1 so auf der GeForce RTX 4080 mit 12 GB verwendet. Als kleinster Chip scheint die Ausbeute hier gut genug zu sein. Die Transistordichte liegt bei knapp über 120 Millionen Transistoren pro Quadratmillimeter.

Seite 1: Deutliches Leistungsplus und künstliche Frames: GeForce RTX 4090 in der Founders Edition im Test

Seite 2: Die Ada-Lovelace-Architektur

Quellen und weitere Links

Unterforum: Grafikkarten

KOMMENTARE (571)

{{{_source.title}}} {{#_source.showPrice}} {{{_source.displayPrice}}} {{/_source.showPrice}}

Deutliches Leistungsplus und künstliche Frames GeForce RTX 4090 in der Founders Edition im Test

Deutliches Leistungsplus und künstliche Frames

GeForce RTX 4090 in der Founders Edition im Test