NEWS

Grafikkarten

Blockdiagramm und neue Cache-Hierarchie zur Turing-Architektur enthüllt

Portrait des Authors


Blockdiagramm und neue Cache-Hierarchie zur Turing-Architektur enthüllt
41

Werbung

Trotz aller NDA-Vorkehrungen und allen Maßnahmen zur Geheimhaltung ist es Videocardz gelungen, an zwei Aufnahmen der Präsentation bei NVIDIA zu gelangen, die zum aktuellen Zeitpunkt noch nicht das Licht das Öffentlichkeit sehen sollten.

Beim ersten Bild handelt es sich um die technischen Daten zur TU102-GPU inklusive Blockdiagramm. Aufgrund der schlechten Aufnahmequalität ist das Blockdiagramm kaum zu gebrauchen, die Angaben zur TU102-GPU erlauben es uns aber die Core-Konfiguration der einzelnen Modelle zurückzurechnen. Auf dem Bild zu sehen ist der Vollausbau der TU102-GPU. Diese kommt auf 4.608 Shadereinheiten, 576 Tensor Cores und 72 RT Cores. Dies entspricht der Konfiguration der Quadro RTX 8000. Weiterhin genannt werden 36 Geometrieeinheiten, 288 Textureinheiten und 96 Render Backends sprich ROPs.

Für die Karten der GeForce-RTX-20-Serie kommt diese GPU aber in anderen Ausbaustufen zum Einsatz. Die GeForce RTX 2080 Ti bietet 4.352 Shadereinheiten, die GeForce RTX 2080 und GeForce RTX 2070 kommen mit 2.944, bzw. 2.302 auf entsprechend weniger. Aufgrund der Angaben der Tensor Cores sowie der RT Cores für den Vollausbau der TU102-GPU können wir nun aber die Werte zu den Modellen der GeForce RTX 2080 Ti, GeForce RTX 2080 und GeForce RTX 2070 ausrechnen – bisher machte NVIDIA noch keine offiziellen Angaben zur Anzahl der Tensor und RT Cores.

Aufgrund der Angaben zur Anzahl der Shadereinheiten wissen wir, dass ein Shader-Cluster aus dem Mehrfachen von 32, 64 oder gar 128 Shadereinheiten bestehen kann. Ein SM-Cluster (Streaming Multiprozessor) der Pascal-Architektur besteht aus 128 Shadereinheiten, für die Volta-Architektur änderte NVIDIA den Aufbau auf 64 Shadereinheiten pro SM-Cluster. Da die Turing-Architektur sicher eher an der Volta- als an Pascal-Architektur orientieren wird, gehen wir von 64 Shadereinheiten pro SM-Cluster für Turing aus. Dies passt dann auch zur Anzahl der Tensor Cores pro SM. In der Volta-Architektur sind acht Tensor Cores pro SM-Cluster vorhanden – bei Turing ist dies offenbar ebenfalls der Fall.

Kommen wir nun zur letzten großen Unbekannten im Aufbau der Turing-Architektur – den RT Cores. Aus 72 RT Cores bei 4.608 Shadereinheiten ergeben sich jeweils ein RT Core pro SM-Cluster (4.608 Shadereinheiten / 64 = 72 SM-Cluster = 72 RT Cores). Noch einmal auf die Tensor Cores bezogen errechnen sich daraus 72 SM-Cluster x 8 Tensor Cores = 576 Tensor Cores für den Vollausbau.

Weiterhin kennen wir nun die Anzahl der Textureinheiten pro SM-Cluster – derer vier wie bei der Volta-Architektur. Für das Speicherinterface ist die Rechnung analog zur Pascal-Architektur: Das Speicherinterface in 32-Bit-Blöcke aufgeteilt. Von den 384 Bit des Vollausbaus der TU102-GPU deaktiviert NVIDIA einen dieser Blöcke und kommt auf 352 Bit der GeForce RTX 2080 Tt. Jeder dieser 32-Bit-Blöcke ist auch für die Anbindung eines Speicherchips verantwortlich. 352 Bit / 32 Bit ergibt die 11 Kanäle für die 11 GDDR6-Speicherchips. Für die GeForce RTX 2080 und GeForce RTX 2070 ergeben sich analog dazu die 256 Bit / 32 Bit in 8 Kanälen für die 8 GDDR6-Speicherchips. Pro 32-Bit-Block das Speicherinterfaces sind acht ROPs verbaut.

Die technischen Daten der GeForce RTX 2080 Ti, RTX 2080 und RTX 2070 in der Übersicht
Modell GeForce RTX 2080 Ti GeForce RTX 2080 GeForce RTX 2070
Preis 1.259 Euro 849 Euro 639 Euro
Technische Daten
Architektur Turing Turing Turing
GPU TU102 TU104 TU104
Shadereinheiten 4.352 2.944 2.304
Tensor Cores 544 368 288
RT Cores 68 46 36
Textureinheiten 272 184 144
Geometrieeinheiten 34 23 18
ROPs 88 64 64
GPU-Takt (Basis) 1.350 MHz 1.515 MHz 1.410 MHz
GPU-Takt (Boost) 1.635 MHz 1.800 MHz 1.710 MHz
RTX-OPS 78 TRTX-OPS 60 TRTX-OPS 45 TRTX-OPS
Gigarays/s 10 GRays/s 8 GRays/s 6 GRays/s

Speichertakt

1.750 MHz 1.750 MHz 1.750 MHz
Speichertyp GDDR6 GDDR6 GDDR6
Speichergröße 11 GB 8 GB 8 GB
Speicherinterface 352 Bit 256 Bit 256 Bit
Bandbreite 616 GB/s 448 GB/s 448 GB/s
TDP 260 W 225 W 185 W
Versorgung  2x 8-Pin 1x 8-Pin + 1x 6-Pin 1x 8-Pin
SLI/NVLink NVLink 2-Way NVLink 2-Way -

Damit kennen wir neben der Anzahl der Shadereinheiten nun auch die der Tensor und RT Cores sowie der weiteren architektonischen Merkmale der drei Karten. Die GeForce RTX 2080 Ti wird über 544 Tensor Cores und 68 RT Cores verfügen. Bei der GeForce RTX 2080 sind es 368 Tensor Cores und 46 RT Cores und die GeForce RTX 2070 bietet immerhin noch 288 Tensor und 36 RT Cores. Analog haben wir auch die Angaben zu den Textur- und Geometrieeinheiten sowie der ROPs berechnen können.

L1- und L2-Cache werden aufgebohrt

Ein weiteres Bild zeigt die Veränderungen in der Cache-Hierarchie. Allerdings wird auch hier auf den ersten Blick deutlich, dass NVIDIA für die Turing-Architektur Anleihen an der Volta-Architektur genommen hat.

Der L2-Cache wurde bereits mit der Volta-Architektur auf 6 MB vergrößert und findet sich in dieser Form offenbar auch in der Turing-Architektur wieder. Änderungen gibt es auch beim L1-Cache – teilweise kennen wir diese ebenfalls bereits von der Volta-Architektur. Handelte es sich bei der Pascal-Architektur noch um einen getrennten L1- und Shared-Cache, legt NVIDIA diese nun zusammen. Dies ist auch schon bei der Volta-Architektur der Fall. L1-Cache und der dazugehörige Shared Memory sind bei Volta 128 KB groß. Die Größe des Shared Memory konnte auf bis zu 96 KB frei konfiguriert werden. Für die Turing-Architektur scheint NVIDIA die Größe wieder etwas zu reduzieren und kommt auf gemeinsame 96 KB, legt diese aber konfigurierbar als 64 KB (L1-Cache) + 32 KB (Shared Memory) oder 32 KB (L1-Cache) + 64 KB (Shared Memory) an.

Somit kennen wir ein paar weitere Eckdaten der GeForce RTX 2080 Ti, GeForce RTX 2080 und GeForce RTX 2070 sowie den Aufbau der Turing-Architektur. Aufgrund der ohnehin schon zahlreichen Leaks ist davon auszugehen, dass in den kommenden Tagen und Wochen weitere Details enthüllt werden. Wer sich die Spannung erhalten und zum Start der Karten ein Gesamtbild einsehen möchte, der wird offenbar enttäuscht werden.