Werbung
Heute ist es endlich soweit. Mit der GeForce RTX 3080 in der Founders Edition schauen wir uns die erste Karte der neuen Ampere-Generation an. Die wichtigsten Details zur Architektur haben wir bereits behandelt und in der vergangenen Woche konnten wir euch die ersten Fotos der GeForce RTX 3080 Founders Edition zeigen. Heute geht es nun also um die Leistung, den Stromverbrauch, die Kühlung und weitere Vergleiche wie die Effizienz oder die Verbesserungen in der Raytracing- und DLSS-Leistung.
Im Zuge des Neustarts bei den Grafikkarten, neben NVIDIA und der GeForce-RTX-30-Serie werden wir in wenigen Wochen auch die nächste Radeon-RX-Generation alias Big Navi sehen, haben wir auch unser Testsystem komplett erneuert – sowohl im Hinblick auf die Hardware als auch hinsichtlich der verwendeten Spiele. Dazu aber dann später etwas mehr.
Auch wenn wir bereits viele Details der GeForce RTX 3080 Founders Edition und der GeForce-RTX-30-Serie behandelt haben, wollen wir dennoch auf ein paar weitere Kleinigkeiten eingehen.
Zunächst einmal aber schauen wir uns die drei neuen Modelle im Vergleich an:
GeForce RTX 3090 | GeForce RTX 3080 | GeForce RTX 2080 | GeForce RTX 3070 | |
GPU | Ampere (GA102) | Ampere (GA102) | Turing (TU104) | Ampere (GA104) |
Transistoren | 28 Milliarden | 28 Milliarden | 13,6 Milliarden | 17,4 Milliarden |
Fertigung | 8 nm | 8 nm | 12 nm | 8 nm |
Chipgröße | 628,4 mm² | 628,4 mm² | 545 mm² | 392,5 mm² |
FP32-ALUs | 10.496 | 8.704 | 2.944 | 5.888 |
INT32-ALUs | 5.248 | 4.352 | 2.944 | 2.944 |
SMs | 82 | 68 | 46 | 46 |
Tensor Cores | 328 | 272 | 368 | 184 |
RT Cores | 82 | 68 | 46 | 46 |
Basis-Takt | 1.400 MHz | 1.440 MHz | 1.515 MHz | 1.500 MHz |
Boost-Takt | 1.700 MHz | 1.710 MHz | 1.800 MHz | 1.730 MHz |
Speicherkapazität | 24 GB | 10 GB | 8 GB | 8 GB |
Speichertyp | GDDR6X 19,5 GBit/s | GDDR6X 19 GBit/s | GDDR6 | GDDR6 14 GBit/s |
Speicherinterface | 384 Bit | 320 Bit | 256 Bit | 256 Bit |
Speicherbandbreite | 936 GB/s | 760 GB/s | 448 GB/s | 448 GB/s |
TDP | 350 W | 320 W | 225 W | 220 W |
Preis | 1.499 Euro | 699 Euro | - | 499 Euro |
Verfügbarkeit | 24. September | 17. September | - | Oktober |
Die GeForce RTX 3080 und GeForce RTX 3090 basieren auf der GA102-GPU, allerdings in unterschiedlichen Ausbaustufen. Die GeForce RTX 3070 wird die GA104-GPU verwenden. Dazu werden wir aber zum Start der Karte weitere Details nennen können. Allesamt werden die neuen GPUs in 8 nm bei Samsung gefertigt. Laut NVIDIA hat man zusammen mit Samsung entsprechende Anpassungen am Fertigungsprozess vorgenommen, sodass dieser für die GPUs optimiert arbeiten kann. Die GA102-GPU kommt auf eine Fläche von 628,4 mm² und beinhaltet 28 Milliarden Transistoren. Die GA104-GPU bietet 17,4 Milliarden Transistoren auf einer Fläche von 392,5 mm².
Für die GeForce RTX 3080 steigt die Anzahl der FP32-Einheiten gegenüber der GeForce RTX 2080 von 2.944 auf 8.704. Für die INT32-Recheneinheiten geht es von ebenfalls 2.944 auf 4.352. Die Anzahl der Tensor Cores sinkt von 368 auf 272, aber dies hat auch einen guten Grund, zu dem wir noch kommen werden. Die Zahl der RT Cores steigt von 46 auf 68. Wir sehen hier also einen deutlichen Ausbau der Architektur. Wie sich dies in einem vermeintlichen Leistungsplus auswirken wird, werden wir später sehen. Wenig Bewegung gibt es beim Takt der GPUs. Der Boost-Takt fällt auf dem Papier sogar um 100 MHz geringer aus.
Die Breite des Speicherinterface wächst von 256 auf 320 Bit. zusammen mit dem schnelleren GDDR6X-Speicher steigt die Speicherbandbreite von 448 auf 760 GB/s. Auf dem Papier bietet der Wechsel von der GeForce RTX 2080 auf die GeForce RTX 3080 also ein deutliches Leistungsplus.
Interessant ist nun der Vergleich der Fertigung in 8 nm bei Samsung gegenüber der Fertigung in 12 nm bei TSMC für die Turing-Generation.
GA102 | TU102 | GA104 | TU104 | GA100 | |
Transistoren | 28 Milliarden | 18,6 Milliarden | 17,4 Milliarden | 13,6 Milliarden | 54 Milliarden |
Chipgröße | 628,4 mm² | 754 mm² | 392,5 mm² | 545 mm² | 826 mm² |
Fertigung | Samsung 8 nm | TSMC 12 nm | Samsung 8 nm | TSMC 12 nm | TSMC 7 nm |
Transistordichte | 44,56 MT/mm² | 24,67 MT/mm² | 44,33 MT/mm² | 24,95 MT/mm² | 65,37 MT/mm² |
Durch die Angabe der Anzahl der Transistoren plus die Chipgröße können wir die Transistordichte errechnen. Die Transistordichte der GA102-GPU liegt bei 44,6 MT/mm². Für die GA104-GPU sind es 44,3 MT/mm². Die Turing-GPUs erreichten einen Wert von 25 MT/mm², waren also nur in etwa halb so dicht gepackt. Die GA100-GPU für den A100-GPU-Beschleuniger lässt NVIDIA bei TSMC in 7 nm fertigen. Hier liegt die Transistordichte bei 65,37 MT/mm².
Für die Ampere-GPUs kann NVIDIA also deutlich mehr Transistoren auf eine kleinere Fläche packen. Mit fast 630 mm² ist die GA102-GPU nicht wirklich klein, aber kleiner als der Vorgänger. Die höhere Packdichte nutzt NVIDIA um den Ausbau der GPU-Architektur zu vergrößern. Wir sehen deutlich mehr FP32-Einheiten in den GPUs und dies soll sich entsprechend in der Leistung niederschlagen.
Auf den folgenden Seiten gehen wir nun auf die Details der Ampere-Architektur, das neue Kühldesign und die neuen Funktionen der Hardware ein.
Kein Fokus des Tests wird die Software sein. Mit Reflex möchte NVIDIA beispielsweise dem kompetitiven Spieler ein Werkzeug an die Hand geben, welches die Latenzen zwischen Eingabe über Maus und Tastatur mit einer möglichst schnellen Darstellung auf dem Monitor zusammenbringt. Eine entsprechende Schnittstelle soll es Entwicklern ermöglichen ihre Spiele entsprechend anzupassen.
NVIDIA Broadcast soll das zentrale Element für Streamer werden. Virtuelle Bildschirmhintergründe, automatisch folgende Kameraausschnitte und eine Verbesserung der Audio-Qualität mittels RTX Voice sind hier die zentralen Themen.