NEWS

HotChips32

AMD gibt Ausblick auf RDNA 2 mit Raytracing-Beschleunigung

Portrait des Authors


AMD gibt Ausblick auf RDNA 2 mit Raytracing-Beschleunigung
98

Werbung

Auf der HotChips-Konferenz hat Microsoft die System Architecture der Xbox Series X vorgestellt. Fast alle technischen Daten des Custom-SoCs, den man gemeinsam mit AMD entwickelt hat, kennen wir bereits. Für uns besonders interessant ist das, was man über die verbaute GPU-Architektur verraten hat, denn die acht Zen-2-Kerne kennen wir bereits von den Desktop- und Mobile-Prozessoren.

Die verbaute GPU unterstützt ein Sampler Feedback Streaming (SFS), Variable Rate Shading (VRS), D3D Mesh Shading und besonders interessant eine Machine Learning Acceleration und das DirectX Raytracing (DXR). All dies wird von den zukünftigen Radeon-Grafikkarten auf Basis der RNDA-2-Architektur für den Desktop erwartet. Insofern bietet sich hier ein Blick durch ein Fenster, welches sich für den PC-Spieler erst im Herbst öffnen wird.

Die in der Xbox Series X verbaute GPU kommt auf 26 Dual-CUs (Compute Unit) mit jeweils 128 Shadereinheiten. Diese Dual-CUs kennen wir bereits von der ersten Generation der RDNA-Architektur. Insgesamt arbeiten hier also 3.328 Shadereinheiten, wobei Microsoft und AMD zwei Dual-CUs vermutlich aus Gründen der Ausbeute nicht aktivieren.

Schaut man sich nun die veröffentlichten Diagramme an, so fällt auf, dass viele essentielle Informationen noch weggelassen werden. Dies wird sich AMD sicherlich für den Zeitpunkt aufheben, an dem alle Details zur RDNA-2-Architektur veröffentlicht werden sollen. Dennoch nennt man einige Details wie den 5 MB großen L2-Cache. Die Größe des Caches kann sich aber vom Custom-SoC des Xbox Series X hin zum Big-Navi-Chip noch verändern, denn dies ist davon abhängig, wie viel Platz man sich auf dem Chip geben möchte. Für Desktop-Chips spielt dies meist weniger eine Rolle, wie für Custom-Silicon oder solche, die für den mobilen Einsatz vorgesehen sind.

Ein Blick in eine Dual-CU zeigt dann, dass sich hier pro Compute Unit mindestens ein Raytracing-Beschleuniger und mindestens vier Textureinheiten befinden. Microsoft nennt zwar keine Anzahl für die Textureinheiten und Raytracing-Beschleuniger, bei der RDNA-Architekturen waren es jedoch bereits vier Textureinheiten. Für die Raytracing-Beschleuniger ist der genau Aufbau noch unklar und damit dessen Anzahl. Die Folie spricht jedoch von vier Raytracing- oder Textur-Operationen pro Takt. Insofern ist davon auszugehen, dass es auch vier Raytracing-Beschleuniger sind. 2x 32 SIMD32 ergeben die 64 Shadereinheiten pro CU – 128 für eine Dual-CU.

Als geteilte Ressource befinden sich in einer Dual-CU der Local Data Share (LDS) sowie ein Scalar Data Cache und ein Shader Instruction Cache. Die Ähnlichkeiten zwischen der RDNA und RDNA-2-Architektur sind also mehr als ersichtlich. Offenbar ergänzt AMD die Compute Units um eben die Raytracing-Beschleuniger und versieht die Recheneinheiten mit zusätzlichen Funktionen.

Bei einem Takt von 1.825 MHz sollen die 3.328 Shadereinheiten der Xbox-Series-X-GPU auf eine Rechenleistung von 12 TFLOPS kommen. Eine Radeon RX 5700 XT bringt es auf 9,4 TFLOPS. Aber das ist nicht entscheidend, viel wichtiger ist, dass die GPUs effizienter werden und dazu sollen das Variable Rate Shading (VRS) und Sampler Feedback Streaming beitragen.

Das VRS haben wir uns bereits mehrfach ausführlich angeschaut und wird auch von NVIDIA bereits unterstützt (und angewendet). Das Sampler Feedback Streaming wird neu und auch von NVIDIA erst zusammen mit DirectX 12 Ultimate umgesetzt werden. Ein Sampler Feedback Streaming kann dazu verwendet werden das Laden und Streamen von Texturen zu verbessern und effizienter zu machen, ohne dass ein Texturshading mehrfach stattfinden muss. Immer detailreichere Texturen, immer größere Welten – dies alles sorgt vor allem für längere Ladezeiten. Um diese zu verkürzen, soll das Texture Streaming Daten dann in den Speicher der Grafikkarte laden, wenn diese tatsächlich gebraucht werden. Über eine Feedback Map wird dem Sampler eine entsprechende Rückmeldung gegeben.

Per Sampler Feedback kann zudem ein Texture-Space Shading durchgeführt werden. Dabei müssen verschiedene Shader-Berechnungen nicht immer wieder neu ausgeführt werden, sondern die Ergebnisse können mehrfach wiederverwendet werden, was die Leistung der Hardware teilweise deutlich steigern kann.

Schlussendlich hat man noch ein paar Worte zur Raytracing-Leistung verloren. NVIDIA verwendet zur Hardwarebeschleunigung der Raytracing-Berechnungen in der Turing-Architektur einen RT-Kern pro SM. Bei AMD sind es nun offenbar vier Raytracing-Beschleuniger pro CU. Die Angaben der Leistung sind etwas verwirrend, denn AMD spricht von "380G/sec ray-box peak" und "95G/sec ray-tri peak". AMD scheint auch die Shadereinheiten zur Berechnung der Bounding Volume Hierarchy (BVH) verwenden zu können.

Microsoft attestiert den Raytracing-Beschleuniger eine geringe Chipfläche im Vergleich zur um den Faktor drei bis zehn höheren Leistung durch deren Unterstützung. Dies gilt auch für die Machine-Learning-Beschleunigung, die bei einer Skalierung der Auflösung unterstützen soll. Plant AMD hier ein Gegenstück zu NVIDIAs DLSS?

Letztendlich werden wir abwarten müssen, bis wir die Details der RDNA-2-Architektur kennen werden. Die Vorstellung des Chips in der Xbox Series X gibt bereits jetzt eine kleine Vorschau auf das, was uns erwarten wird. Die Big-Navi-Chips werden vermutlich für das High-End-Segment deutlich aufgebohrt sein. Die Architektur als solches dürfte sich jedoch nicht allzu sehr unterscheiden.