Werbung
Mit der Veröffentlichung der GeForce GTX 750 und GTX 750 Ti sowie der Präsentation der Maxwell-Architektur der ersten Generation war klar, dass eine zweite folgen würde und diese vermutlich den High-End-Markt bedienen wird - das passiert nun mit GeForce GTX 980 und 970. Bei gleicher Leistungsaufnahme wurde die Leistung stark verbessert - das Performance/Watt-Verhältnis machte einen deutlichen Sprung. Ähnliches ist nun auch von der GeForce GTX 980 und GTX 970 zu erwarten, die ebenfalls auf der Maxwell-Architektur aufbauen, aber noch einmal kleine Verbesserungen erhalten haben. Endresultat sollen die bisher schnellsten und sparsamsten Karten aus dem Hause NVIDIA sein. Wir haben das Referenzmodell der GeForce GTX 980 sowie eines der ersten Retail-Modelle der GeForce GTX 970 genauer unter die Lupe genommen.
An dieser Stelle geht unser Dank zunächst einmal an NVIDIA für die Teststellung der GeForce GTX 980 im Referenzdesign sowie an EVGA für die GeForce GTX 970 Superclocked. NVIDIA verspricht zusammen mit seinen Partnern eine sofortige Verfügbarkeit beider Modelle. Während die GeForce GTX 970 von Anfang an in zahlreichen Custom-Designs angeboten wird, müssen Käufer einer GeForce GTX 980 zunächst einmal wohl noch häufiger eine Referenzkarte kaufen, denn nicht jeder Hersteller hat vom Start weg sein Custom-Design fertig.
Als kleine Vorbereitung auf diesen Artikel wollen wir nicht unerwähnt lassen, dass es sich dabei nicht um ein klassisches Launch-Review handelt, sondern dass wir einen großen Teil Theorie haben mit einfließen lassen. Dazu gehört nicht nur die genaue Erläuterung der Maxwell-Architektur, sondern auch die Erklärung der neuen Render- und Filter-Technologien wie DSR, MFAA und VXGI. Ebenfalls genauer beleuchten wollen wir die DirectX-12-Features, denn mit der GeForce GTX 980 und GeForce GTX 970 sehen wir die ersten Karten mit DirectX-12-Hardwareunterstützung. Zahlreiche weitere Features spielen ebenfalls eine Rolle.
Nach dem ersten kleinen Inhaltsverzeichnis steigen wir aber nun direkt in die technischen Details der beiden Karten ein und vergleichen sie gegen die Vorgänger sowie die direkte Konkurrenz. In der Folge wird dann die Architektur die Hauptrolle spielen.
[h3]Architektonische Eckdaten[/h3]
Modell | GeForce GTX 980 | Radeon R9 290X | GeForce GTX 680 | GeForce GTX 780 Ti |
---|---|---|---|---|
Straßenpreis | etwa 539 Euro | etwa 395 Euro | etwa 379 Euro | etwa 499 Euro |
Homepage | www.nvidia.de | www.amd.com/de | www.nvidia.de | www.nvidia.de |
Technische Daten | ||||
GPU | Maxwell (GM204) | Hawaii | Kepler (GK104) | Kepler (GK110) |
Fertigung | 28 nm | 28 nm | 28 nm | 28 nm |
Transistoren | 5,2 Milliarden | 6,2 Milliarden | 3,54 Milliarden | 7,1 Milliarden |
GPU-Takt (Base Clock) | 1.126 MHz | - | 1.006 MHz | 876 MHz |
GPU-Takt (Boost Clock) | 1.216 MHz | 1.000 MHz | 1.058 MHz | 928 MHz |
Speichertakt | 1.750 MHz | 1.250 MHz | 1.500 MHz | 1.750 MHz |
Speichertyp | GDDR5 | GDDR5 | GDDR5 | GDDR5 |
Speichergröße | 4.096 MB | 4.096 MB | 2.048 MB | 3.072 MB |
Speicherinterface | 256 Bit | 512 Bit | 256 Bit | 384 Bit |
Speicherbandbreite | 224,0 GB/s | 320,0 GB/s | 192,3 GB/s | 336,0 GB/s |
Shadereinheiten | 2.048 | 2.816 | 1.536 | 2.880 |
Textur Units | 128 | 176 | 128 | 240 |
ROPs | 64 | 64 | 32 | 48 |
TDP | 165 Watt | > 250 Watt | 195 Watt | 250 Watt |
SLI/CrossFire | SLI | CrossFire | SLI | SLI |
Alle aktuellen High-End-GPUs und auch deren Vorgänger werden weiterhin in 28 nm gefertigt. Lange wurden darüber spekuliert, ob TSMC nicht doch die Fertigung in 20 nm in den Griff bekommen würde, offenbar aber waren sowohl NVIDIA wie auch AMD nicht von den Fertigkeiten bzw. der Ausbeute überzeugt und bleiben dem 28-nm-Prozess vorerst treu. Sowohl auf der GeForce GTX 980 wie auch auf der GeForce GTX 970 kommt die Maxwell-GPU mit Codenamen GM204 zum Einsatz. Diese besitzt 5,2 Milliarden Transistoren und ist damit weniger komplex als die Hawaii- oder große Kepler-GPUs. Im Vergleich zu GK104, dem eigentlichen Vorgänger, ist die Anzahl der Transistoren aber dennoch stark angewachsen.
Bisher musste NVIDIA beim Takt seiner GPUs in Abhängigkeit zur Komplexität der GPU immer konservativer agieren. Mit der GeForce GTX 980 und der darauf verbauten Maxwell-GPU kann NVIDIA offenbar wieder stärker an der Taktschraube drehen und lässt die 2.048 Shadereinheiten mit 1.126 MHz im Basis-Takt arbeiten. Unter Last und bei ausreichender Kühlung sollen mindestens 1.216 MHz möglich sein - die Karte kann aber noch deutlich höher takten als diese Boost-Vorgabe. Der GPU zur Seite stehen 4.096 MB GDDR5-Grafikspeicher, die mit einem Takt von 1.750 MHz angesprochen werden. Damit verwendet NVIDIA die aktuell schnellsten GDDR5-Speicherchips. Angebunden sind diese aber mit nur 256 Bit. Das könnte im Vergleich zu den 512 Bit der Radeon R9 290X und den zumindest 384 Bit der GeForce GTX 780 Ti zur größten Schwachstelle der GeForce GTX 980 werden. Dazu aber später mehr, wir halten an dieser Stelle nur die 224 GB pro Sekunde an Speicherbandbreite fest, was im Vergleich zur High-End-Konkurrenz sicherlich zunächst einmal recht ernüchternd klingt.
Auf die Details der Architektur kommen wir zwar später noch einmal, die 2.048 Shadereinheiten ergeben sich aber dennoch aus 16 Maxwell-Streaming-Multiprozessoren, die aus jeweils 128 ALUs bestehen. Aus dieser Zusammensetzung ergeben sich grundsätzlich auch die 128 Textureinheiten sowie die 64 ROPs - dazu aber wie gesagt später etwas mehr. Das wohl erstaunlichste technische Detail sind die 165 Watt für die Thermal Design Power (TDP). Bei gleicher Fertigung, mit einer komplexeren GPU (im Vergleich zu GK104) und einem höheren Takt will NVIDIA die Leistungsaufnahme dennoch deutlich reduziert haben. Dies dürfte auf spannende Messungen bei der Leistungsaufnahme hindeuten.
Modell | GeForce GTX 970 | Radeon R9 290 | GeForce GTX 670 | GeForce GTX 770 |
---|---|---|---|---|
Straßenpreis | etwa 319 Euro | etwa 270 Euro | etwa 329 Euro | etwa 255 Euro |
Homepage | www.nvidia.de | www.amd.com/de | www.nvidia.de | www.nvidia.de |
Technische Daten | ||||
GPU | Maxwell (GM204) | Hawaii | Kepler (GK104) | Kepler (GK104) |
Fertigung | 28 nm | 28 nm | 28 nm | 28 nm |
Transistoren | 5,2 Milliarden | 6,2 Milliarden | 3,54 Milliarden | 3,54 Milliarden |
GPU-Takt (Base Clock) | 1.050 MHz | - | 915 MHz | 1.046 MHz |
GPU-Takt (Boost Clock) | 1.178 MHz | 947 MHz | 980 MHz | 1.085 MHz |
Speichertakt | 1.750 MHz | 1.250 MHz | 1.500 MHz | 1.750 MHz |
Speichertyp | GDDR5 | GDDR5 | GDDR5 | GDDR5 |
Speichergröße | 4.096 MB | 4.096 MB | 2.048 MB | 2.048 MB |
Speicherinterface | 224 + 32 Bit | 512 Bit | 256 Bit | 256 Bit |
Speicherbandbreite | 224,0 GB/s | 320,0 GB/s | 192,3 GB/s | 224,4 GB/s |
Shadereinheiten | 1.664 | 2.560 | 1.344 | 1.536 |
Textur Units | 104 | 160 | 112 | 128 |
ROPs | 64 | 64 | 32 | 32 |
TDP | 145 Watt | 250 Watt | 170 Watt | 230 Watt |
SLI/CrossFire | SLI | CrossFire | SLI | SLI |
Auch die GeForce GTX 970 muss sich der Konkurrenz aus eigenem Hause sowie von AMD stellen. Hier kommt mit GM204 die gleiche GPU zum Einsatz. Wir sprechen also auch hier von 5,2 Milliarden Transistoren und einer Fertigung in 28 nm. Allerdings hat NVIDIA drei SMM deaktiviert, wodurch wir nur noch auf 1.664 Shadereinheiten und 104 Texturheinheiten kommen. Im Vergleich zur GeForce GTX 980 bleibt die Anzahl der ROPs mit 64 identisch. Auch beim Takt gibt es zur GeForce GTX 980 einen Unterschied, denn als Basis-Takt gibt NVIDIA 1.050 MHz an, während es unter Last mindestens 1.178 MHz sein sollen. Der GeForce GTX 970 wird also etwas mehr Taktspielraum eingeräumt und wir bewegen uns wieder etwas mehr im Bereich knapp über der 1-GHz-Marke.
Keinerlei Unterschied gibt es beim Speicherausbau, denn auch auf der GeForce GTX 970 sind 4.096 MB GDDR5-Speicher verbaut, die ebenfalls mit 1.750 MHz angesprochen werden. Allerdings bleibt es auch hier natürlich beim 256 Bit breiten Speicherinterface, sodass die Speicherbandbreite mit 224 GB/Sek. auf etwa dem Niveau der GeForce GTX 770 zu finden ist. Ob dies ein Nachteil sein muss, klären wir später. Bei der GeForce GTX 970 gibt NVIDIA eine TDP von 145 Watt an, so dass die Leistungsmessungen auch hier spannend werden dürften.
Nachtrag:
Aufgrund fehlerhafter Angaben hat NVIDIA die Breite des Speicherinterfaces auf 224 + 32 Bit korrigiert. Ebenfalls reduziert wurde die Anzahl der ROPs von 64 auf 56 und die Größe des L2-Caches von 2.048 auf 1.792 kB. Genauere Details zu den weiteren Auswirkungen findet ihr in einem ausführlichen Artikel dazu.