Es kann ja jeder nachlesen, was mit dir abgeht.
Wohl war... Kann doch nix für, wenn du zwischen einem und dem nächsten Beitrag vergisst, was du oben geschrieben hast. In dem jeweiligen Beiträgen meinerseits wird mehrfach klar erläutert, was unter der Aussage zu verstehen ist. Verstehst du das, dann können wir gern weiter reden, wenn nicht? Lass einfach gut sein...
Merkwürdig das 13 SIMD der 970 'Probleme' machen und ein weiter beschnittener GM204 mit 12 SIMD der 980M keine Auffälligkeiten zeigt.
Nee so merkwürdig ist das nicht... Denn die Vermutung liegt aktuell genau darauf, das 13 von 16 eben dazu zwingt, dass man die ROP Partitionen nicht mehr gleichmäßig ansprechen kann.
Bei 12 von 16 wäre es dann fast egal. Denn man kann je einen SMM pro ROP Partition weglasern. Oder vier SMMs am Stück und somit eine ganze ROP Partition lahm legen.
In beiden Fällen hättest du die volle Bandbreite über den kompletten Bereich...
Nach den aktuellen Erkenntnisen hat die 970er noch ein paar andere Probleme. Sie hat offenbar auch weniger ROP Leistung als normal sein müsste. Und es mehreren sich die Gerüchte, dass der L2 Cache nicht voll nutzbar ist. Das hängt alles "hinten" an der ROP Partition dran. Also das SI, die SMMs (zu vier Stück) und auch der L2 Cache sowie die ROP Blöcke. Ausgehend davon wäre es bei der 980M sogar wohl fast völlig wurscht, ob du pro ROP Block jeweils 1/4tel brach liegen lässt, oder einen ganzen ROP Block vollständig ausknippst und weglaserst.
Komisch ist allerdings, dein Durchsatz entspricht ziemlich genau dem der 980er, wenn man den Speichertaktunterschied abzieht. Das ist allerdings mehr wie ich eigentlich erwarten würde... Oder die symetrische Abtrennung der SMMs in vierer Blöcken ist wirklich gänzlich anders zu bewerten wie die asymetriesche Abtrennung!?
Das Hintergrundproblem schein nämlich zu sein, dass der Speicher 1:1 anteilig zur Größe auf die Shadercluster gemappt ist. Bei 4GB sind das pro ROP Partition und somit pro vier möglichen SMMs jeweils 1GB. Mit doppelter Menge Speicher folglich 2GB bei gleicher Aufteilung.
Die 970er hat nun das Problem, das sie ungleich angebunden ist. Wärend nach aller Theorie nach, zwei der vier ROP Partitionen voll beschalten sind, kommt die dritte auf drei SMMs und die vierte auf zwei SMMs. -> macht drei weniger als Vollausbau.
Bildlich gesehen, vier Wassergläser mit je 1l Inhalt. Zwei Gläser haben vier Löcher, eins hat drei Löcher und das vierte hat nur zwei Löcher. Im ersten Step laufen dir durch alle! 13 Löcher 3,328l Wasser, im zweiten Step hat nur noch Glas 3 + 4 überhaupt Wasser. -> es läuft nur noch 0,512l Wasser in der selben Zeit! wie bei Step 1 durch eben drei aktive Löcher. Und im dritten step hat nur noch das letzte Glas Wasser und in abermals der selben Zeit läuft der letzte Rest von 0,256l durch...
Somit ergibt sich ein Einbruch der Durchflussmenge -> meint also Bandbreite von in Summe ~150l Wasser bis zur Abgabemenge von 3,328l auf 22l Wasser bis zur Menge von 3,840l und der Rest kläckert mit 11,5l Wasser durch bis alles Wasser durch gelaufen ist
Bei der 980M ist das nicht so, weil sie offenbar symetrisch gecuttet wurde. Allerdings weist die 970M das gleiche Problem auf. Im 3dc hat jemand ne 970M mit 6GB durch den Test gejagt
Und da ist knapp über 5,2GB schluss mit Durchsatz...