Werbung
Wenn es um die nächste GPU-Architektur aus dem Hause AMD geht, ist es derzeit schwer den Überblick zu behalten. Alle bisher durch AMD offiziell gemachten Informationen mögen zwar teilweise den technischen Hintergrund beleuchten, beantworten aber nicht wirklich die Frage nach der Leistung der entsprechenden Radeon RX Vega getauften Grafikkarten.
In der letzten Woche tauchte ein Interview mit AMDs Desktop-Prozessor-Marketing-Chef Don Woligrosky auf, der sich zur folgenden Aussage hinreißen ließ: „Vega performance compared to the Geforce GTX 1080 Ti and the Titan Xp looks really nice." Seit gestern wird heiß über die womöglich ersten 3DMark-Ergebnisse diskutiert.
Doch belastbare technischen Daten gibt es kaum. Einzig der Einsatz von High Bandwidth Memory der zweiten Generation gilt als sicher. Die architektonischen Details aber geben bisher wenig Auskunft über die Leistungsbereitschaft der Hardware und nicht einmal den Speicherausbau kennen wir derzeit sicher.
Aus dem letzten Linux-Patch werden nun aber Daten erkennbar, die wir in dieser Form bisher noch nicht gesehen haben – größtenteils bestätigen sie allerdings auch nur bisherige Vermutungen. Genauer gesagt geht es um den [PATCH 048/100] drm/amdgpu: implement GFX 9.0 support. Darin wird die Unterstützung neuer Grafik-Architekturen vorbereitet. Darin zu finden sind zahlreiche Verweise auf eine Vega-10-GPU, die vermeintlich größte Variante der neuen GPU-Generation von AMD. GFX9 ist schon länger als Codename für die Vega-Architektur bzw. Graphics Core Next 5 (GCN) bekannt.
Im Patch ist folgender Eintrag zu finden:
+ case CHIP_VEGA10:
+ adev->gfx.config.max_shader_engines = 4;
+ adev->gfx.config.max_tile_pipes = 8; //??
+ adev->gfx.config.max_cu_per_sh = 16;
+ adev->gfx.config.max_sh_per_se = 1;
+ adev->gfx.config.max_backends_per_se = 4;
+ adev->gfx.config.max_texture_channel_caches = 16;
+ adev->gfx.config.max_gprs = 256;
+ adev->gfx.config.max_gs_threads = 32;
+ adev->gfx.config.max_hw_contexts = 8;
Demnach würde Vega 10 über 64 Render-Backends (ROPs) sowie 256 Textureinheiten verfügen. Interessant sind auch die Verweise auf die die Tile Pipelines, also die Möglichkeit das Rendering des Bildes in mehrere Bereiche aufzuteilen. Vega wird nachgesagt diese Funktion zu unterstützen, während NVIDIA dies bereits mit den ersten Pascal-Chips getan hat.
Bestätigt werden außerdem die 4.096 Shadereinheiten, denn bei vier Shader Engines, 16 CUs pro Shader Engine ergibt dies nach Adam Riese 4.096 Shadereinheiten (4 x 14 x 64 = 4.096).
Zum Vergleich die entsprechenden Einträge für Fiji:
+ case CHIP_FIJI:
+ adev->gfx.config.max_shader_engines = 4;
+ adev->gfx.config.max_tile_pipes = 16;
+ adev->gfx.config.max_cu_per_sh = 16;
+ adev->gfx.config.max_sh_per_se = 1;
+ adev->gfx.config.max_backends_per_se = 4;
+ adev->gfx.config.max_texture_channel_caches = 16;
+ adev->gfx.config.max_gprs = 256;
+ adev->gfx.config.max_gs_threads = 32;
+ adev->gfx.config.max_hw_contexts = 8;
Für einen besseren Vergleich haben wir die verschiedenen High-End-GPUs von AMD und NVIDIA einmal gegenübergestellt:
Modell: | GP102 | Fiji | Vega 10 |
Technische Daten | |||
---|---|---|---|
Fertigung: | 16 nm | 28 nm | 14 nm |
Transistoren: | 12 Milliarden | 8,9 Milliarden | 12,8 Milliarden |
GPU-Takt (Basis): | 1.480 MHz | - | - |
GPU-Takt (Boost): | 1.582 MHz | 1.050 MHz | 1.200 |
Speichertakt: | 1.375 MHz | 500 MHz | 700 MHz |
Speichertyp: | GDDR5X | HBM1 | HBM2 |
Speichergröße: | 11 GB | 4 GB | 8 GB |
Speicherinterface: | 352 Bit | 4.096 Bit | 2.048 Bit |
Bandbreite: | 484 GB/s | 512 GB/s | 358,4 GB/s |
DirectX-Version: | 12 | 12 | 12 |
Shadereinheiten: | 3.584 | 4.096 | 4.096 |
Textureinheiten: | 224 | 256 | 256 |
ROPs: | 88 | 64 | 64 |
Typische Boardpower: | 250 W | 275 W | - |
Wir haben in der Tabelle in paar Angaben ergänzt, welche sich aus anderen Quellen ergeben. So lässt sich die Anzahl der Transistoren in etwa aus der Chipgröße berechnen. Gefertigt wird Vega 10 wohl in 14 nm. Aus den Bildern der GPU sowie der bekannten Größe der HBM2-Speicherstacks (7,75 mm × 11,87 mm und 91,99 mm²) ergibt sich eine Die-Größe von etwa 520 bis 540 mm². Die Polaris-10-GPU kommt bei 232 mm² auf 5,7 Milliarden Transistoren. Vega 10 mit 520 mm² besäße damit in etwa 12,8 Milliarden Transistoren.
Den GPU-Takt mit 1.200 MHz sowie den Speicher-Takt mit 700 MHz haben die Benchmark-Tools aus den vermeintlichen Ergebnisse so ausgelesen. Daraus ergibt sich die Speicherbandbreite mit "nur" 358,4 GB/s. Sollte dies stimmen, wird auch ersichtlich, warum AMD den Fokus derart auf die neue Speicherarchitektur legt.