Werbung
Nachdem es zum Wochenende bereits eine Vorschau auf die Titan RTX gab, hat NVIDIA die Karte nun offiziell vorgestellt. Einige der technischen Daten kennen wir bereits, nun werden aber auch die letzten Fragen beantwortet. Etwas erzwungen wirkt das Branding der Karte, welches NVIDIA als "Titan RTX - genannt T-Rex" ausführt.
NVIDIA sieht die Titan RTX als "ultimative PC GPU" und beschreibt das Einsatzfeld vor allem bei KI-Forschern, Datenwissenschaftlern und Deep Learning-Entwicklern. Ob auch Spieler mit großem Geldbeutel an der Titan RTX ihren Gefallen finden werden, ist eher unwahrscheinlich. Während die Titan V mit 5.120 Shadereinheiten gegenüber der GeForce GTX 1080 Ti mit 3.584 Shadern ein deutliches Plus von mehr als 40 auffahren konnte, sprechen wir bei der Titan RTX vom Vollausbau der TU102-GPU und diese kommt damit auf 4.608 zu 4.352 Shadereinheiten der GeForce RTX 2080 Ti – ein Plus von nur 6 %.
Nun aber zu den technischen Daten:
Modell | Titan V | RTX 2080 Ti | Titan RTX |
Preis | 3.099 Euro | 1.259 Euro | 2.699 Euro |
Technische Daten | |||
---|---|---|---|
Architektur | Volta | Turing | Turing |
GPU | GV100 | TU102 | TU102 |
Fertigung | TSMC 12 nm | TSMC 12 nm | TSMC 12 nm |
Transistoren | 21,1 Milliarden | 18,6 Milliarden | 18,6 Milliarden |
Diegröße | 815 mm² | 754 mm² | 754 mm² |
Shadereinheiten | 5.120 | 4.352 | 4.608 |
Tensor Cores | 640 | 544 | 576 |
RT Cores | - | 68 | 72 |
Textureinheiten | 320 | 272 | 288 |
Geometrieeinheiten | 40 | 34 | 36 |
ROPs | 96 | 88 | 96 |
GPU-Takt (Basis) | 1.200 MHz | 1.350 MHz | 1.350 MHz |
GPU-Takt (Boost) | 1.455 MHz | 1.635 MHz | 1.770 MHz |
RTX-OPS | - | 78 TRTX-OPS | 84 TRTX-OPS |
Gigarays/s | - | 10 GRays/s | 11 GRays/s |
Speichertakt | 850 MHz | 1.750 MHz | 1.750 MHz |
Speichertyp | HBM2 | GDDR6 | GDDR6 |
Speichergröße | 12 | 11 GB | 24 GB |
Speicherinterface | 3.072 Bit | 352 Bit | 384 Bit |
Bandbreite | 652,8 GB/s | 616 GB/s | 672 GB/s |
TDP | 250 W | 260 W | 280 W |
Versorgung | 2x 8-Pin | 2x 8-Pin | 2x 8-Pin |
SLI/NVLink | - | 2x NVLink | 2x NVLink |
Die TU102-GPU besitzt im Vollausbau sechs Graphics Processing Clusters (GPCs), 36 Texture Processing Clusters (TPCs) und 72 Streaming Multiprocessors (SMs). Jedes GPC beinhaltet eine Raster Engine und sechs TPCs, jedes TPC wieder hat zwei SMs. Jeder SM bietet 64 Shadereinheiten, acht Tensor Cores, ein 256 kB großes Register, vier Textureinheiten und 96 kB an L1/Shared Memory.
Den Boost-Takt der Titan RTX gibt NVIDIA mit 1.770 MHz an und damit läge dieser höher als bei der GeForce RTX 2080 Ti. Der Basis-Takt verbleibt bei 1.350 MHz.
Wir kommen demnach für die Titan RTX auf 4.608 Shadereinheiten, 576 Tensor Cores und 96 RT Cores. Taktbereinigt dürfte eine RTX Titan in etwa 6 % schneller als eine GeForce RTX 2080 Ti sein. Durch die Verwendung des Vollausbaus ist das Speicherinterface 384 Bit breit und NVIDIA kann darüber 12 GDDR6-Speicherchips anbinden. Im Falle der Titan RTX verbaut NVIDIA solche mit einer Kapazität von jeweils 2 GB aus dem Hause Samsung und kommt damit auf 24 GB an Gesamtspeicher. Die Quadro RTX 8000 mit gleicher GPU gibt es sogar mit 48 GB an Grafikspeicher. Die Speicherbandbreite liegt aufgrund des Taktes von 1.750 MHz bei 672 GB/s.
Wie alle Karten mit TU102-GPU verwendet auch die Titan RTX zwei NVLinks und kommt somit auf eine Bandbreite zwischen zwei dieser Karten von 100 GB/s. Dieser Umstand, aber vor allem die 24 GB an GDDR6-Speicher sieht NVIDIA als wichtiges Merkmal für den Einsatz der Titan RTX.
Die NVIDIA Titan RTX besitzt eine Thermal Design Power von 280 W – 20 W mehr als die GeForce RTX 2080 Ti. Da diese bereits recht schnell am Power-Limit hängt, dürfte es der Titan RTX nicht anders ergehen. Ob und wie weit sich das Power-Limit verändern lässt, wissen wir aktuell nicht. Die Kühlung basiert auf dem Dual-Axial-Design der GeForce RTX 2080 Ti, allerdings hat NVIDIA die Karte etwas anders eingefärbt. Die Slotblende hält mit dreimal DisplayPort 1.4 und jeweils einmal HDMI 2.0b und VirtualLink bereit.
"Turing is NVIDIA’s biggest advance in a decade – fusing shaders, ray tracing, and deep learning to reinvent the GPU," sagt Jen-Hsun Huang, CEO von NVIDIA. "The introduction of T-Rex puts Turing within reach of millions of the most demanding PC users — developers, scientists and content creators."
Für NVIDIA steht also die Rechenleistung im Fokus und diese wollen wir nun einmal in ein Verhältnis zu den anderen Karten setzen:
Modell | RTX 2080 Ti | Quadro RTX 6000 | Titan V | Titan RTX | |
GPU | TU102 | TU102 | GV100 | TU102 | |
Rechenleistung | |||||
---|---|---|---|---|---|
FP32 TFLOPS | 14,2 | 16,3 | 13,8 | 16,3 | |
INT32 TIPS | 14,2 | 16,3 | - | 16,3 | |
FP64 TFLOPS | 0,445 | 0,510 | 7,45 | 0,509 | |
FP16 TFLOPS | 28,5 | 32,6 | 29,8 | 32,6 | |
INT8 Tensor TOPS | 57 | 130 | 110 | 130 | |
INT4 Tensor TOPS | 114 | 260 | 220 | 260 |
Die Zahlen machen schnell deutlich, was auch für die anderen Karten mit Turing-GPU gilt: Für Compute-Anwendungen mit doppelter Genauigkeit (FP64) sind diese Karten nicht ausgelegt. Eine TU102-GPU besitzt nur 144 FP64-Einheiten – zwei pro SM. Das Verhältnis an FP64- zur FP32-Rechenleistung beträgt damit 1/32, während es bei der Volta-Architektur bei 1/2 liegt. NVIDIA hat dennoch einige FP64-Recheneinheiten in die Turing-Architektur eingebaut, um Software, die darauf ausgelegt ist, zumindest grundsätzlich funktionsfähig zu halten. Wer also FP64 benötigt, wird bei der Titan V besser bedient sein.
Stellt sich noch die Frage nach dem Preis. Die Titan RTX soll 2.699 Euro kosten und wird ausschließlich bei NVIDIA im Online-Shop erhältlich sein. Damit ist sie billiger als eine Titan V, NVIDIA musste sich für die Titan RTX aber auch an der Quadro RTX 6000 orientieren, die ebenfalls die TU102-GPU mit 4.608 Shadern und 24 GB GDDR6 verwendet, aber 6.615 Euro kostet. Für Spieler wichtig wäre der Vergleich zur GeForce RTX 2080 Ti, die in der Founders Edition für 1.259 Euro zu haben ist. Man zahlt also den doppelten Preis, für eine Mehrleistung im einstelligen Prozentbereich.