NEWS

RTX A6000 und A40

NVIDIA bringt Ampere in die Workstation

Portrait des Authors


NVIDIA bringt Ampere in die Workstation
7

Werbung

Auf der GPU Technology Conference präsentiert NVIDIA zwei neue Hardwarelösungen, die im Quadro-Segment die bisherigen Turing-Lösungen ablösen. Mit der RTX A6000 und dem A40-GPU-Beschleuniger zielt NVIDIA zunächst auf die High-End-Lösungen in diesem Bereich – analog zur GeForce RTX 3080 und GeForce RTX 3090, die auch zunächst einmal das obere Preissegment bedient. Die RTX A6000 ist für Workstations gedacht, die A40-GPU für den Einsatz im Datacenter.

Der Blick auf die Ampere-Architektur zeigt: Große Zuwachsraten für die FP32- und INT32-Rechenleistung zahlen sich im Rendering aus. Davon sollen auch die RTX A6000 und der A40-GPU-Beschleuniger profitieren. Anders als die GeForce-RTX-Karten mit ihren 320, bzw. 350 W beschränkt NVIDIA die Workstation-Lösungen auf 300 W – für beide Varianten.

Basis beider GPU-Beschleuniger bildet ein Vollausbau der GA102-GPU. Bei 28 Milliarden Transistoren sprechen wir von einer Chipfläche von 628,4 mm². Gefertigt wird der Chip in 8 nm bei Samsung. Im Vollausbau kommt die GPU auf 84 SMs (Streaming Multiprocessor) und somit bei 128 CUDA-Kernen pro SM auf insgesamt 10.752 FP32-Recheneinheiten. An INT32-Recheneinheiten vorhanden sind 5.376. Passend zu den 84 SMs sind 84 RT Cores vorhanden. Hinzu kommen 336 Tensor Cores.

Am 384 Bit breiten Speicherinterface angebunden sind 48 GB GDDR6 mit ECC-Unterstützung. Ja richtig, nicht GDDR6X wie bei der GeForce RTX 3080 und GeForce RTX 3090, sondern GDDR6 kommt hier zum Einsatz. Bei der RTX A6000 beträgt die Speicherbandbreite 768 GB/s, für den A40-GPU-Beschleuniger hat NVIDIA den Speichertakt weiter reduziert. Dieser kommt auf 696 GB/s.

Beide Karten unterstützen natürlich PCI-Express 4.0 mit 16 GB/s und NVLink 3.0 mit einer bidirektionalen Datenrate von 112,5 GB/s. MIG (Multi Instance GPU) wie auf dem A100-GPU-Beschleuniger wird nur von der RTX A6000 unterstützt, für den A40-GPU-Beschleuniger bleiben jedoch die vGPU-Technologien wie NVIDIA GRID, NVIDIA Quadro Virtual Data Center Workstation und NVIDIA Virtual Compute Server.

Die RTX A6000 ist eine klassische Dual-Slot-Karte mit Radiallüfter mit einem Gewicht von 1,179 kg. Die Thermal Design Power liegt bei 300 W. An Display-Ausgängen vorhanden sind viermal DisplayPort 1.4. Sobald eine vGPU-Technologie zum Einsatz kommt, sind die physikalischen Ausgänge jedoch nicht mehr aktiv.

Auch der A40-GPU-Beschleuniger kommt im Dual-Slot-Design, hier wird allerdings auf einen aktiven Lüfter verzichtet. Stattdessen sorgt der Luftzug im Server für die notwendige Frischluft. Die Karte kommt daher auf ein geringeres Gewicht von 987 g. Zudem sind aufgrund der Kühlung nur noch drei Mini-DisplayPorts vorhanden.

Die Stromversorgung erfolgt über den bisher bei den Grafikkarten nicht verwendeten EPS12V mit acht Pins. Den neuen 12-Pin-Anschluss der eigenen Founders Editionen bringt NVIDIA hier also nicht zum Einsatz. Über den EPS12V können bis zu 800 W geführt werden.

Gegenüberstellung der Karten
  Quadro RTX 8000 Quadro RTX 6000RTX A6000A40
GPU Turing (TU102) Turing (TU102)Ampere (GA102)Ampere (GA102)
Transistoren 18,6 Milliarden 18,6 Milliarden28 Milliarden28 Milliarden
Fertigung 12 nm 12 nm8 nm8 nm
Chipgröße 754 mm² 754 mm²628,4 mm²628,4 mm²
FP32-ALUs 4.608 4.60810.75210.752
INT32-ALUs 4.608
4.6085.3765.376
SMs 72 728484
Tensor Cores 576 576336336
RT Cores 72 728484
Basis-Takt 1.395 MHz 1.440 MHz--
Boost-Takt 1.770 MHz 1.770 MHz--
Speicherkapazität 48 GB 24 GB48 GB48 GB
Speichertyp GDDR6 GDDR6GDDR6GDDR6
Speicherinterface 384 Bit 384 Bit384 Bit384 Bit
Speichertakt 1.750 MHz 1.750 MHz2.000 MHz1.815 MHz
Speicherbandbreite 672 GB/s 672 GB/s768 GB/s696 GB/s
TDP 295 W 295 W300 W300 W
Preis 6.000 Euro 4.150 Euro--

Die RTX A6000 wird ab Mitte Dezember von NVIDIA und PNY, Leadtek, Ingram Micro und Ryoyo erhältlich sein. Der A40-GPU-Beschleuniger wird im ersten Quartal 2021 folgen. Preise und Taktraten zu beiden Karten sollen folgen, wenn diese wirklich auf den Markt kommen.