Turing ohne RTX

Die GeForce GTX 1660 Ti im Test - Eine Abschätzung des kleinen Turing

Von Andreas Schilling
Freitag, 22.02.2019 um 15:00 Uhr

Seite 24: Eine Abschätzung des kleinen Turing

205

Bevor wir zum Fazit kommen, noch eine Einschätzung zum kleinen Turing-Chip. Der TU116 ist laut NVIDIA in Form der GeForce GTX 1660 Ti als Vollausbau verbaut. Mehr als 1.536 Shadereinheiten werden wir auf Basis des TU116 nicht sehen. Doch offenbar muss NVIDIA einiges investieren, um das Produkt in dieser Form umsetzen zu können. Etwas verwundert sind wir noch über die zwei freien Lötpads auf dem PCB der GeForce GTX 1660 Ti. Eine neue GeForce-GTX-Karte auf Basis von Turing mit einem 256 Bit breiten Speicherinterface deutet sich derzeit aber nicht an und für die GeForce-RTX-Karten verwendet ASUS ein anderes PCB-Layout. Hier sind also noch einige Fragezeichen vorhanden, was es genau damit auf sich hat. Ob wir wohl bald noch einen größeren Turing-Chip (TU114?) ohne RT und Tensor Cores sehen werden? Die aktuelle Gerüchtelage spricht eher von einem weiteren, kleineren, Chip.

Im Vergleich zum nominellen Vorgänger, der GeForce GTX 1060 mit GP106-GPU, steigt die Chipgröße von 200 auf 284 mm². Die Anzahl der Transistoren steigt von 4,4 auf 6,6 Milliarden. Das Verhältnis aus Größe des Chips und Anzahl der Transistoren steigt fast linear an. Dies gilt allerdings nicht für die Anzahl der Shadereinheiten, jedoch müssen auch die FP16-Einheiten irgendwo untergebracht werden und auch die größeren Caches spielen eine Rolle.

Dennoch ist das Verhältnis aus Leistung pro Quadratmillimeter Chipfläche für die TU116-GPU nur geringfügig besser als bei der Pascal-Architektur. Eine GP104-GPU auf der GeFroce GTX 1070 kommt auf 314 mm² und ist in etwa so schnell wie eine GeForce GTX 1660 Ti mit ihrer 284 mm² großen GPU.

In den obigen beiden Bildern sind die Turing SMs der TU116-GPU (links) und der TU102-GPU (rechts) einmal im Vergleich zu sehen. Der größte Unterschied ist natürlich das Fehlen des RT Cores und der Tensor Cores in der TU116-GPU. Im Falle der letztgenannten Einheiten werden diese durch FP16-Einheiten ersetzt. In der TU102-GPU werden Fließkommaberechnungen für FP16 in den Tensor Cores vorgenommen.

Dies hat sicherlich auch Auswirkungen auf die Kosten in der Fertigung. NVIDIA ließ die Pascal-GPU in 16 nm fertigen, die neuen Turing-GPUs werden in 12 nm produziert. Mit den Volta-GPUs konnte NVIDIA gemeinsam mit seinem Partner TSMC die Fertigung in 12 nm bereits optimieren, davon dürften auch alle Turing-GPUs profitieren. 200 zu 284 mm² bedeuten aber dennoch höhere Kosten.

Die Turing SMs bieten neben den Änderungen durch dedizierte INT32-Einheiten und die Cache-Hierarchie auch Verbesserungen, die in die Software übertragen wurden. Das gehört das Variable Rate Shading (VRS), welches in erster Umsetzung als NVIDIA Adaptive Shading (NAS) implementiert wird. Als bisher einziges Spiel wird dies von Wolfenstein II: The new Colossus eingesetzt. Je nach Komplexität der Szene kann NAS einen mehr oder weniger großen Leistungsschub bieten.

Wie bei einer jeden solchen Umsetzung wird der Erfolg aber auch daran gemessen, wie schnell und weit sie eingesetzt wird. Es wird sich also in Zukunft zeigen müssen, ob mehr und mehr Spiele das NAS einsetzen werden oder nicht. Dies gilt auch für die GeForce-RTX-Karten mit den RTX- und DLSS-Funktionen.

Seite 23: Overclocking Seite 25: Fazit

Quellen und weitere Links