Werbung
Die heute erschienene GeForce GTX 780 kommt mit den erwarteten architektonischen Daten daher. 2304 CUDA-Kerne sind in 12 SMX-Cluster (zu jeweils 192 CUDA-Kerne) aufgeteilt. Der Vollausbau von GK110 sieht eine Aufteilung dieser SMX-Cluster in fünf GPCs (Graphics Processing Cluster) vor. Dies ist auch bei der GeForce GTX Titan mit 14 SMX-Clustern der Fall. Drei SMX-Cluster ergeben also ein GPC. Die GeForce GTX 780 kommt auf 12 SMX-Cluster, was allerdings nicht bedeutet, dass diese in vier GPCs angeordnet sind. Laut NVIDIA kann die GK110-300-A1-GPU mit vier oder fünf GPCs daher kommen.
[figure image=images/stories/galleries/reviews/2013/geforce-titan/GK110_Block_Diagram_FINAL2-rs.jpg link=images/stories/galleries/reviews/2013/geforce-titan/GK110_Block_Diagram_FINAL2.png alt=GK110 Blockdiagramm]GK110 Blockdiagramm der GeForce GTX Titan[/figure]
Dies könnte auch Auswirkungen auf die Performance haben. Zwar sind in den SMX-Clustern Recheneinheiten wie die Textureinheiten und Caches enthalten, die Rasterizer aber befinden sich in den GPCs (siehe Blockdiagramm der GeForce GTX Titan). Jeder dieser Rasterizer bearbeitet acht Pixel pro Takt. Bei fünf GPCs sind dies also 40 Pixel pro Takt und bei vier GPCs eben nur 32 Pixel pro Takt. Bei der GeForce GTX Titan mit fünf GPCs ergibt dies eine Pixelfüllrate von 33,48 GPixel/Sek. Bei einer GeForce GTX 780 mit fünf GPCs sind es 34,5 GPixel/Sek. und bei einer GeForce GTX 780 mit vier GPCs 27,62 GPixel/Sek. Dies entspricht einer um 25 Prozent niedrigeren Pixelfüllrate.
Welche Auswirkungen dieser Unterschied der Pixelfüllrate auf die Performance hat, können wir nicht sagen. Direkt Auslesen lässt sich die Anzahl der GPCs nicht. Einzig Messungen könnten Aufschluss darauf geben, ob vier oder fünf GPCs aktiv sind.
Doch woher kommen die unterschiedlichen GPUs auf der GeForce GTX 780? NVIDIA wird vermutlich keine vollständig funktionsfähigen GK110-GPUs verwenden, sondern wird diese für die GeForce GTX Titan und Tesla K20(X) verwenden wollen. Defekte GPUs haben ihre Defekte aber nicht in definierten Bereichen, sondern können an unterschiedlichen Stellen fehlerhaft sein. So kann es dazu kommen, dass eine GPU zwar auf insgesamt 12 SMX-Cluster kommt, diese aber manches mal in vier und manchmal in fünf GPCs angeordnet sind.
Update:
Noch immer ist unklar, welchen Einfluss die unterschiedliche Pixelfüllrate auf die allgemeine Performance hat. Dafür gibt es nun aber eine schnelle und einfache Möglichkeit zu überprüfen, ob die GPU der eigenen GeForce GTX 780 über vier oder fünf GPCs verfügt. Dazu muss mit dem Tool "NVIDIA Inspector" ein Dump via Doppelklick auf das NVIDIA-Logo gemacht werden. Dort findet ihr den Eintrag PipeCount. Lautet dieser PipeCount [000]: 5 (0x00000005), verfügt die GPU über fünf GPCs, lautet er PipeCount [000]: 4 (0x00000004), sind es nur vier.
2. Update:
Scheinbar liest der NVIDIA Inspector die Anzahl der GPCs nicht richtig aus. Wer aber dennoch an der Pixelfüllrate seiner Karte interessiert ist, kann dies über ein Tool nachmessen.