Vor allem wurde das GPU-Bottleneck von Jim (Adored TV) mithilfe von zwei RX480 im Crossfire relativ stark ausgehebelt (verglichen wurde mit einer manuell übertakteten GTX1070 die etwa GTX1080-Niveau erreichen dürfte, was laut vielen Tests äquivalent zu zwei RX480 sein sollte).
Dabei kam heraus, dass das Crossfire Gespann auf Ryzen teils massiv schneller lief als die übertaktete GTX1070. Das waren fps/frametimes auf Titan X (Pascal) Niveau!
Die 2 RX480 waren hier nicht einfach besonders schnell, sondern die nVidia Karte überraschend langsam auf Ryzen.
Wo ich zudem diesen gerne zitierten Einzeiler wieder sehe: der nVidia-Treiber hat nachweislich nicht (!) einen geringeren Overhead. Er verteilt ihn lediglich unter DX11 besser auf verschiedene Threads dank einem Server-Prozess der die Drawcall-Vorbereitung auf einzelne Threads auslagert und dann gebündelt (command queue) an die GPU übergibt. Bei nVidia wird dafür ein sehr stark für viele Engines angepasster Software Scheduler verwendet.
Darum kann AMD dies auch nicht ähnlich nachbauen, da die nötige Command Queue Größe zu gering auf GCN-Chips (Polaris hat hier tatsächlich eine etwas größere erhalten) ist, verglichen mit post-Fermi-Chips von nVidia. Zudem nutzt AMD einen Hardware Scheduler (welchen nVidia nach Fermi aufgegeben hat).
Eben jener Hardware Scheduler profitiert von der Multithread-Implementierung in DX12 und sorgt dadurch für einen MASSIV geringeren Driveroverhead verglichen mit nVidia.
In DirectX11 ist das ganze etwas komplizierter. Man sieht ja zuletzt immer mehr Spiele, bei denen AMD-Karten wesentlich besser rennen als erwartet. Dies liegt nicht daran, dass man, wie mit Gameworks, spezielle Architekturschwächen des Konkurrenten ausnutzt, sondern das Threadverhalten der Engine anpasst um dem Single-Thread-Treiber von AMD entgegen zu kommen. Dabei wird dann der GPU-Thread möglichst wenig belastet und so viel wie möglich auf andere Threads/Kerne ausgelagert. Je nachdem wie aggresiv dies gestaltet wird kann der nVidia-Treiber hier aber (weiterhin relativ wenig) Performance verlieren, da der Treiber darauf ausgelegt ist die Last möglichst auf viele Threads zu verteilen, die potenziell jetzt aber für andere Zwecke schon stark ausgelastet werden. Hätten wir besser verteilte Marktanteile wäre dies auch eher die Regel, als die in den "The Way It's Meant To Be Played" Titeln, die absichtlich auch den initialen GPU-Thread vollstopfen.
tl;dr: Wer im absoluten GPU-limit testet wird natürlich vollkommen andere Ergebnisse sehen, als jemand der tatsächlich mit ordentlich Grafikleistung testet.
tl;dr2: Höherer AMD-Treiber-Overhead ist ein Hoax und hängt lediglich von der Thread-Implementierung in der Engine ab.
Eine hervorragende Quelle, wer mir nicht glauben mag: AMD vs NV Drivers: A Brief History and Understanding Scheduling & CPU Overhead - YouTube