Werbung
Mit der GeForce RTX 4090 gehen wir heute in die nächste Runde des heißen Herbst 2022. Die Ryzen-7000-Prozessoren machten den Anfang, danach folgten die ARC-Grafikkarten von Intel. Heute NVIDIA legt nach und darauf folgen werden noch Raptor Lake von Intel und die RDNA-3-Karten wiederum von AMD. NVIDIA legt mit der GeForce RTX 4090 im High-End-Segment los – im Grunde wie auch schon bei der Vorgänger-Generation. Um mehrere Faktoren schneller sollen die neuen Karten sein. Raytracing, DLSS und viele kleine Neurungen im Design werden die Themen der folgenden Seiten sein.
NVIDIA wählt für den Start der GeForce-RTX-40-Serie eine leicht abgeänderte Strategie. Den Anfang macht die GeForce RTX 4090, die recht nahe am Vollausbau der verwendeten AD102-GPU operiert. Mit 24 GB an Grafikspeicher und einem Power-Limit von 450 W zieht NVIDIA die Produktpalette von oben auf. Vermutlich will man sich bzw. dem Markt somit auch noch etwas Luft lassen die restlichen Modelle der GeForce-RTX-30-Serie verkaufen zu können.
Ab November sollen dann auch die weiteren beiden Modelle erhältlich sein. Die GeForce RTX 4080 16 GB und eine weitere GeForce RTX 4080 mit 12 GB, die ehrlicherweise wohl besser den Modellnahmen GeForce RTX 4070 getragen hätte. Aber zu diesem Thema kommen wir noch.
Ohne größere Umschweife zu den technischen Daten.
GeForce RTX 4080 12 GB | GeForce RTX 4080 16 GB | GeForce RTX 4090 | |
GPU | AD104 | AD103 | AD102 |
Transistoren | - | - | 76 Milliarden |
Fertigung | 4 nm | 4 nm | 4 nm |
Chipgröße | - | - | 608,3 mm² |
FP32-ALUs | 7.680 | 9.728 | 16.384 |
INT32-ALUs | - | - | - |
SMs | 60 | 76 | 128 |
Tensor Cores | 240 | 304 | 512 |
RT Cores | 60 | 76 | 128 |
Basis-Takt | 2.310 MHz | 2.210 MHz | 2.230 MHz |
Boost-Takt | 2.610 MHz | 2.505 MHz | 2.520 MHz |
Speicherkapazität | 12 GB | 16 GB | 24 GB |
Speichertyp | GDDR6X | GDDR6X | GDDR6X |
Speicherinterface | 192 Bit | 256 Bit | 384 Bit |
Speichertakt | - | - | - |
Speicherbandbreite | 504 GB/s | 720 GB/s | 1.008 GB/s |
TDP | 285 W | 325 W | 450 W |
Preis | 1.099 Euro | 1.469 Euro | 1.949 Euro |
Das Spitzenmodell und im Fokus des heutigen Tests ist die GeForce RTX 4090. Sie basiert auf der Ada102-GPU und bringt es auf 128 SMs, was gleichbedeutend mit 16.384 FP32-Recheneinheiten ist. Ebenfalls Bestandteil der GPU sind 512 Tensor Cores der 4. Generation sowie 128 RT Cores der 3. Generation. Die Tensor und RT Cores wurden weiter verbessert und sollen schneller sowie effizienter sein.
Den Basis-Takt der GeForce RTX 4090 gibt NVIDIA mit 2.230 MHz an. Per Boost soll sie 2.520 MHz erreichen können – vermutlich wird der Takt in der Praxis noch einmal deutlich darüber liegen – aber auch dazu später mehr. Die 24 GB an GDDR6X-Speicher sind über ein 384 Bit breites Speicherinterface angebunden und kommen auf eine Speicherbandbreite von 1.008 GB/s. Die TDP liegt bei 450 W. Für die Founders-Edition ruft NVIDIA einen Preis von 1.949 Euro auf.
Die beiden Varianten der GeForce RTX 4080 beleuchten wir heute nicht weiter. Dazu dann im November mehr.
GeForce Titan RTX | GeForce RTX 3090 | GeForce RTX 4090 | |
GPU | TU102 | GA102 | AD102 |
Transistoren | 18,6 Milliarden | 28,3 Milliarden | 76 Milliarden |
Fertigung | 12 nm | 8 nm | 4 nm |
Chipgröße | 754 mm² | 628 mm² | 608,3 mm² |
FP32-ALUs | 4.608 | 10.496 | 16.384 |
INT32-ALUs | - | 5.248 | - |
SMs | 72 | 82 | 128 |
Tensor Cores | 576 | 328 | 512 |
RT Cores | 72 | 82 | 128 |
Basis-Takt | 1.350 MHz | 1.410 MHz | 2.230 MHz |
Boost-Takt | 1.770 MHz | 1.695 MHz | 2.520 MHz |
Speicherkapazität | 24 GB | 24 GB | 24 GB |
Speichertyp | GDDR6 | GDDR6X | GDDR6X |
Speicherinterface | 384 Bit | 384 Bit | 384 Bit |
Speichertakt | 1.750 MHz | 1.219 MHz | 1.313 MHz |
Speicherbandbreite | 672 GB/s | 936 GB/s | 1.008 GB/s |
TDP | 280 W | 350 W | 450 W |
Preis | 2.699 Euro | 1.599 Euro | 1.949 Euro |
In der direkten Gegenüberstellung zeigt sich die Entwicklung der XX90-Serie recht deutlich. Wir haben hier die Titan RTX als Vertreter oberhalb der RTX-2080-Ti in der Turing-Generation herangezogen. Der Speicherausbau ist über die drei Generationen mit 24 GB identisch, allerdings erhöht sich dessen Bandbreite stetig. Die Anzahl der Recheneinheiten hat sich im gleichen Zuge verdreifacht, wenngleich dies mit Ampere und Ada Lovelace und 128 FP32-Recheneinheiten pro SM auch ein anderer Aufbau ist.
Von der GeForce RTX 3090 ausgehend, legt die GeForce RTX 4090 im Ausbau der GPU eine ordentliche Schippe drauf. Wir sprechen hier von 60 % mehr FP32- und INT32-Recheneinheiten. Hinzu kommt eine Steigerung der vorhandenen RT und Tensor Cores im gleichen Maße. NVIDIA kann sich für Ada Lovelace auch auf TSMC verlassen und hat gemeinsam mit dem Auftragsfertiger einen optimierten 5-nm-Prozess namens 4N für NVIDIA entwickelt. 76 Milliarden Transistoren werden auf eine Fläche von 608,3 mm² gepackt. Die Fertigung ermöglicht es NVIDIA auch den Takt auf 2.500 MHz und mehr zu steigern.
Wer an der Fertigung und den weiteren Kenngrößen der neuen GPUs interessiert ist, für den haben wir folgende Tabelle zusammengestellt:
AD102 | AD103 | AD104 | |
Die-Größe | 608,3 mm² | 378,6 mm² | 294,5 mm² |
Anzahl der Transistoren | 76 Milliarden | 45,9 Milliarden | 35,8 Milliarden |
Transistordichte | 124,9 MTr/mm² | 121,2 MTr/mm² | 121,6 MTr/mm² |
SMs | 144 | 80 | 60 |
FP32-Recheneinheiten | 18.432 | 10.240 | 7.680 |
RT Cores | 144 | 80 | 60 |
Tensor Cores | 576 | 320 | 240 |
L2-Cache | 96 MB | 64 MB | 48 MB |
ROPs | 192 | 112 | 80 |
Speicherinterface | 384 Bit | 256 Bit | 192 Bit |
Die Abstufungen für die einzelnen Ada-Lovelace-GPUs und deren Ausbaustufen folgen einem fast linearen Verlauf. Wir sprechen hier immer vom Vollausbau, der auf den GeForce-Karten so aber nicht vorkommt. Einzig die AD104-GPU wird 1:1 so auf der GeForce RTX 4080 mit 12 GB verwendet. Als kleinster Chip scheint die Ausbeute hier gut genug zu sein. Die Transistordichte liegt bei knapp über 120 Millionen Transistoren pro Quadratmillimeter.