Werbung
Lange Zeit war nicht ganz klar, was bei NVIDIA auf die GeForce-GTX-600-Serie folgen wird bzw. wie diese aussehen wird. Wird NVIDIA damit warten, bis "Maxwell" einsatzbereit ist? Mit der GeForce GTX Titan präsentierte man keine komplett neue GPU auf Basis der "Kepler"-Architektur, sondern eine deutlich komplexere Ausbaustufe, die vorerst nur für den professionellen Einsatz vorgesehen war. Die Adaption auf den Desktop-Bereich in Form eines GeForce-Produktes lässt NVIDIA im Single-GPU-Bereich derzeit ziemlich einsam an der Spitze stehen, doch das hat ihren Preis - knapp 900 Euro werden fällig. Nun will NVIDIA offenbar eine GeForce-GTX-700-Serie auf Basis der "alten" "Kepler"-Architektur einführen und beginnt diese mit der GeForce GTX 780, die wir uns heute genauer anschauen wollen.
Bereits mit dem Erscheinen der GeForce GTX Titan war offensichtlich, dass NVIDIA zumindest die Möglichkeit haben wird, der Titan noch einen kleinen Bruder zur Seite zu stellen. Von den maximal 15 SMX-Clustern des GK110 nutzt NVIDIA nur 14 und selbst bei idealer Ausbeute der Fertigung ist es eher unwahrscheinlich, dass alle produzierten GPUs auf einer GeForce GTX Titan oder Tesla K20 und K20X eingesetzt werden können. Damit haben wir bereits ein Detail der GeForce GTX 780 vorweggenommen: Auch sie basiert auf der GK110-GPU - genaue Details sollen nun im Test folgen.
{jphoto image=37384}
Bevor wir die NVIDIA GeForce GTX 780 ausführlich vorstellen und durch unseren gewohnt breit angelegten Benchmark-Parcours jagen, werfen wir noch einen näheren Blick auf die Architektur des Grafikprozessors selbst.
Architektonische Eckdaten
Mitte Mai 2012 erwähnte NVIDIA auf der GTC 2012 erstmals eine Trennung der als "Kepler" entwickelten GPU-Architektur in GK10x für den Desktop und GK11x für Tesla- und Quadro-Produkte. Spätestens mit der Vorstellung der GeForce GTX Titan sind diese Trennlinien nun nicht mehr vorhanden und auch auf dem Desktop erleben wir das derzeitige Highlight der Fertigung einer NVIDIA-GPU: 7,1 Milliarden Transistoren, maximal 15 SMX-Cluster, 384 Bit Speicherinterface und eine dreifach höhere Double-Precision-Performance gegenüber "Fermi". Nun aber ein erster Blick auf das, was uns NVIDIA in Form der GeForce GTX 780 liefern möchte:
NVIDIA GeForce GTX 780 | |
---|---|
Straßenpreis | ab 640 Euro |
Homepage | www.nvidia.de |
Technische Daten | |
GPU | GK110 |
Fertigung | 28 nm |
Transistoren | 7,1 Milliarden |
GPU-Takt (Base Clock) | 863 MHz |
GPU-Takt (Boost Clock) | 902 MHz |
Speichertakt | 1502 MHz |
Speichertyp | GDDR5 |
Speichergröße | 3072 MB |
Speicherinterface | 384 Bit |
Speicherbandbreite | 288,4 GB/Sek. |
DirectX-Version | 11.0 |
Shadereinheiten | 2304 |
Textur Units | 192 |
ROPs | 48 |
Pixelfüllrate | 41,4 GPixel/Sek. |
TDP | 250 Watt |
SLI/CrossFire | SLI |
Mit dem GK110 fertigt NVIDIA einen der derzeit komplexesten und größten Chips. 7,1 Milliarden Transistoren sind in ihm untergebracht und selbst bei einer Fertigung in 28 nm misst der Chip etwas über 551 mm². In Sachen Größe können allenfalls der IBM zEC12 mit 597 mm² (32 nm) oder der Intel Itanium "Poulson" mit 544 mm² (32 nm) mithalten. Aber auch der GT200 der GeForce-200-Serie war mit 576 mm² keine kleine GPU, wurde allerdings noch in 55 nm gefertigt. Bei der Anzahl der Transistoren ist GK110 bei den GPUs ungeschlagen und auch modernste Prozessoren kommen allenfalls auf 5 Milliarden Transistoren (62-Kerner Intel Xeon Phi).
Die GeForce GTX 780 nutzt allerdings nicht alle zur Verfügung stehenden Transistoren. Zum einen sind hier im Vorfeld deaktivierte und auch redundante Bereiche zu suchen, zum anderen nutzt die GeForce GTX 780 nicht alle SMX-Cluster und kommt daher auch auf eine geringe Anzahl an CUDA-Kernen. Bei 12 SMX-Clustern zu jeweils 192 CUDA-Kernen kommen wir also auf eine Gesamtanzahl von 2304 CUDA-Kernen für die GeForce GTX 780. Diese arbeiten mit einem Basis-Takt von 863 MHz und erreichen via GPU-Boost mindestens 902 MHz. Der mit 3072 MB im Vergleich zur GeForce GTX Titan nur halb so große GDDR5-Speicher arbeitet mit den üblichen 1502 MHz und ist über ein 384 Bit breites Speicherinterface angebunden, was zu einer Speicherbandbreite von 288,4 GB/Sek. führt. Aufgrund der Beschneidungen bei der Architektur sehen wir weiterhin 192 Textureinheiten und 48 ROPs. NVIDIA gibt eine Thermal Design Power von 250 Watt an.
Bevor wir die NVIDIA GeForce GTX 780 durch unseren breit angelegten Benchmark-Parcours jagen, werfen wir noch einen näheren Blick auf den Testkandidaten selbst.