Werbung
Nachdem NVIDIA mit der GeForce RTX 4090 den Anfang gemacht hat, folgt heute die GeForce RTX 4080. Zum heutigen Tag schauen wir uns die Founders Edition an, in wenigen Tagen werden dann die ersten Custom-Modelle folgen. Wie sich die GeForce RTX 4080 gegenüber der Vor- und Vorvorgänger-Generation positioniert, ist sicherlich eine der spannenden Fragen, die wir heute versuchen zu beantworten. Den Blick in Richtung AMD können wir aber noch nicht vollumfänglich wagen, da die Radeon-RX-7000-Serie wohl erst Mitte Dezember folgend wird. Nun aber zum Test der GeForce RTX 4080.
Die wichtigsten Eckdaten rund um den Start der GeForce-RTX-40-Serie präsentieren wir im Test zur GeForce RTX 4090 Founders Edition. Einen Tag später folgte das erste Roundup mit den vier ersten Custom-Modellen. Auch eine INNO3D GeForce RTX 4090 iCHILL Black mit AiO-Kühler hatten wir bereits im Test. Der Preis von fast 2.000 Euro dürfte für die meisten bei der GeForce RTX 4090 abschreckend sein und insofern ist das Interesse groß, was eine Klasse darunter passiert.
Aber passiert sind zunächst einmal andere Dinge: Es zeichneten sich Probleme mit dem verwendeten 12VHPWR-Anschluss bzw. dem mitgelieferten Adaptern ab. Bei inzwischen mehr als einem Dutzend Fälle (die Dunkelziffer ist wie immer schwer abzuschätzen) schmorte es zwischen Adapter-Stecker und der Buchse an der Grafikkarte. NVIDIA untersucht die Fälle Stand heute noch immer und es ist trotz vieler "Expertenmeinungen" noch immer nicht ganz klar, wo der Fehler nun zu suchen ist. Die nächste Negativpresse handelte sich NVIDIA ein, weil die angesagte Modellunterscheidung zwischen einer GeForce RTX 4080 mit 12 und einer GeForce RTX 4080 mit 16 GB Grafikspeicher nun auch beim Hersteller selbst als wenig sinnvoll erachtet wurde – und man sich letztendlich dafür entschieden hat, eine GeForce RTX 4080 mit 12 GB nicht auf den Markt zu bringen. Stattdessen dürften wir diese als GeForce RTX 4070 (Ti) wiedersehen. Eigentlich kann man dies als positive Wendung verbuchen. Den Versuch seitens NVIDIA, eine GeForce RTX 4080 mit 12 GB an Grafikspeicher auf den Markt zu bringen, macht dies aber nicht besser.
Nun aber wollen wir uns auf die GeForce RTX 4080 konzentrieren. Heute wie gesagt zunächst einmal in der Founders Edition.
Werfen wir zunächst einen Blick auf die technischen Daten sowie den Ausbau der Architektur:
GeForce RTX 4080 | GeForce RTX 4090 | |
GPU | AD103 | AD102 |
Transistoren | 45,9 Milliarden | 76 Milliarden |
Fertigung | 4 nm | 4 nm |
Chipgröße | 378,6 mm² | 608,3 mm² |
FP32-ALUs | 9.728 | 16.384 |
INT32-ALUs | 4.864 | 8.192 |
SMs | 76 | 128 |
Tensor Cores | 304 | 512 |
RT Cores | 76 | 128 |
Basis-Takt | 2.210 MHz | 2.230 MHz |
Boost-Takt | 2.505 MHz | 2.520 MHz |
Speicherkapazität | 16 GB | 24 GB |
Speichertyp | GDDR6X | GDDR6X |
Speicherinterface | 256 Bit | 384 Bit |
Speichertakt | 1.400 MHz | 1.313 MHz |
Speicherbandbreite | 720 GB/s | 1.008 GB/s |
TDP | 320 W | 450 W |
Preis | 1.469 Euro | 1.949 Euro |
Die GeForce RTX 4080 verwendet mit der AD103-GPU die nächst kleinste Ausbaustufe der aktuellen GPU-Designs von NVIDIA auf Basis der Ada-Lovelace-Architektur. Mit einer Chipfläche von 378,6 mm² und 45,9 Milliarden Transistoren ist die AD103-GPU deutlich kleiner als die AD102-GPU der GeForce RTX 4090. Alle Details zur Architektur und der Funktionseinheiten findet ihr im Launch-Artikel der ersten Karte.
In 76 SMs organisiert sind 9.728 FP32- und 4.864 INT32-Recheneinheiten. Hinzu kommen noch 76 Raytracing-Beschleuniger und 304 Tensor Cores. Auch diese sind in einer neuen Generation noch schneller bzw. effizienter. Damit einher gehen auch neue Funktionen wie die Frame Generation und DLSS 3. Auch dazu hatten wir zum Start einen ausführlichen Artikel. GPU- und Speichertakt bewegen sich im üblichen Bereich für diese Serie. An einem 256 Bit breiten Speicherinterface hängen bei der GeForce RTX 4080 noch 16 GB an GDDR6X-Speicher. Die Speicherbandbreite liegt bei 720 GB/s. Die bei der GeForce RTX 4090 zu recht kritisierte TDP von 450 W wird für eine GeForce RTX 4080 auf 325 W reduziert. Der Preis für die Founders Edition soll bei 1.469 Euro liegen. Ob günstige Einstiegsmodelle bereits ab 1.399 Euro vorgesehen sind, wissen wir aktuell nicht. Die High-End-Modelle dürften weit jenseits der 1.500 Euro landen.
Im Vergleich zu den beiden Vorgängern stellt sich die GeForce RTX 4080 wie folgt auf:
GeForce RTX 4080 | GeForce RTX 3080 | GeForce RTX 2080 Super | |
GPU | AD103 | GA102 | TU104 |
Transistoren | 45,9 Milliarden | 28 Milliarden | 13,6 Milliarden |
Fertigung | 4 nm | 8 nm | 12 nm |
Chipgröße | 378,6 mm² | 628,4 mm² | 545 mm² |
FP32-ALUs | 9.728 | 8.704 | 3.072 |
INT32-ALUs | 4.864 | 4.352 | - |
SMs | 76 | 68 | 48 |
Tensor Cores | 304 | 272 | 192 |
RT Cores | 76 | 68 | 48 |
Basis-Takt | 2.210 MHz | 1.440 MHz | 1.650 MHz |
Boost-Takt | 2.505 MHz | 1.710 MHz | 1.815 MHz |
Speicherkapazität | 16 GB | 10 GB | 8 GB |
Speichertyp | GDDR6X | GDDR6X | GDDR6 |
Speicherinterface | 256 Bit | 320 Bit | 256 Bit |
Speichertakt | 1.400 MHz | 1.200 MHz | 1.938 MHz |
Speicherbandbreite | 720 GB/s | 760 GB/s | 496,1 GB/s |
TDP | 320 W | 320 W | 250 W |
Preis | 1.469 Euro | 759 Euro | 739 Euro |
Die Entwicklungsschritte über die letzten beiden Generationen sind in der Tabelle recht gut zu verfolgen. Bei der GeForce RTX 3080 beziehen wir uns auf das erste vorgestellt Modell mit 10 GB großem Grafikspeicher. Die GeForce RTX 2080 Super ist bereits ein Refresh einer vorherigen GeForce RTX 2080.
Für die GeForce RTX 3080 musste NVIDIA die größte GPU und damit viel Fläche und viele Transistoren aufwenden. Die Entwicklung von 12 auf 8 zu nun 4 nm zeigt sich aber ebenfalls sehr deutlich. Dementsprechend sind auch die Anzahl der Transistoren, leider aber auch die Leistungsaufnahme immer weiter gestiegen. Mit der GeForce RTX 4080 scheint sich NVIDIA aber in einem wesentlich besseren Effizienzfenster zu bewegen, als dies für die GeForce RTX 4090 der Fall ist. Mit der neuen Fertigung machen die Taktraten einen großen Sprung. Ob ein 256 Bit breites Speicherinterface für die GeForce RTX 4080 zum Problem wird, wird sich noch zeigen müssen. An dieser Stelle zeigt sich aber, wie abstrus eine solche Karte mit nur 12 GB Grafikspeicher an einem 192 Bit breiten Speicherinterface gewesen wäre.
AD102 | AD103 | AD104 | |
Die-Größe | 608,3 mm² | 378,6 mm² | 294,5 mm² |
Anzahl der Transistoren | 76 Milliarden | 45,9 Milliarden | 35,8 Milliarden |
Transistordichte | 124,9 MTr/mm² | 121,2 MTr/mm² | 121,6 MTr/mm² |
SMs | 144 | 80 | 60 |
FP32-Recheneinheiten | 18.432 | 10.240 | 7.680 |
RT Cores | 144 | 80 | 60 |
Tensor Cores | 576 | 320 | 240 |
L2-Cache | 96 MB | 64 MB | 48 MB |
ROPs | 192 | 112 | 80 |
Speicherinterface | 384 Bit | 256 Bit | 192 Bit |
Die Abstufungen für die einzelnen Ada-Lovelace-GPUs und deren Ausbaustufen folgen einem fast linearen Verlauf. Wir sprechen hier immer vom Vollausbau, der auf den GeForce-Karten so aber nicht vorkommt. Einzig die AD104-GPU wird 1:1 so wohl einer möglichen GeForce RTX 4070 Ti verwendet. Als kleinster Chip scheint die Ausbeute hier gut genug zu sein. Die Transistordichte liegt bei knapp über 120 Millionen Transistoren pro Quadratmillimeter. Die AD104-GPU werden wir dann erstmals auf einer GeForce RTX 4070 (Ti) sehen.
NVIDIA hat ein Blockdiagramm zur AD103-GPU veröffentlicht (siehe oben links) und nennt auch die maximale Ausbaustufe. Der Vollausbau der AD103-GPU käme somit auf 80 SMs und letztendlich auf 10.240 FP32- und 5.120 INT32-Recheneinheiten, 80 RT-Cores und 320 Tensor-Cores. NVIDIA verwendet die GPU aber mit vier SMs weniger – siehe das Blockdiagramm oben rechts. Wie auch schon bei der AD102-GPU ist die Fertigung noch nicht so weit, dass viele voll funktionsfähige Chips vom Band laufen. Entsprechend verwendet NVIDIA einige SMs weniger. Dies lässt aber auch Platz für eine spätere GeForce RTX 4080 Ti, GeForce RTX 4090 Ti oder ein Comeback der Super-Modelle.