Klingt eher danach, dass bis 3500mb parallel angesprochen wird im mehrkanal und die restlichen 500mb dann von einem einzelnen kanal angesprochen werden.
Nur ist das eben nicht der Fall... Die Daten liegen in ALLEN Speicherchips. Sonst wäre die Bandbreite nicht gegeben.
Und ja, natürlich ist das wie auf nem Mainboard. Nur das eben das SI hier 256Bit breit ist. Aka Quad-Channel, wenn man so will. Damit die Bandbreite ankommt, müssen alle Riegel gleichzeitig angesprochen werden... Dennoch gibt es da im Grunde keinen Zusammenhang mit der absoluten Speichergröße!
Laut nVidia werden die ersten, schnellen 3,5GB (3328MB) mit einer höheren Priorität angesprochen, deshalb wirst du hinten immer den langsamen Rest sehen.
Das lässt sich aber technisch nicht erklären... Es sei denn, es ist rein eine Softwareeinschränkung. Sowas hatte ich oben ja schonmal vermutet. Aber so 100% glaube ich daran nicht muss ich sagen.
Und vor allem, warum sollte man dort priorisieren? Das macht imho wenig Sinn.
Stell dir ne Badewanne vor, du hast 16 Wasserhähen, die dir Wasser da rein lassen (GTX 980) -> der Abfluss der Badewanne ist genau so "breit", wie die 16 Wasserhähne in Summe, so dass sich kein Wasser drin stauen kann.
Nun nimmst du dir eine andere Badewanne, der Abfluss ist immernoch exakt gleich breibt aber anstatt 16 Wasserhähnen bleiben dir nur 13. -> folglich wird weniger Wasser bei gleichem Druck pro Leitung in die Wanne zur gleichen Zeit gelangen.
-> das ist exakt die fehlende Bandbreite von der 980 zur 970. Soweit sogut...
Spinnen wir das Beispiel nun weiter. Du lässt bei ersterer Konstruktion exakt 4096l Wasser da rein laufen. -> das dauert seine gewisse Zeit bis es durch den Abfluss rausgelaufen ist.
Bei letzterer Konstruktion machst du es analog -> 4096l Wasser. Es benötigt mehr Zeit -> weniger Wasserhähne, soweit immernoch gut.
Nur warum sollten die letzten ca. 500l auf einmal weniger schnell da durchlaufen? Das ergibt schon rein logisch keinen Sinn.
Aber jetzt wo ich das so schreibe, fällt mir womöglich sogar eine Lösung dafür ein... Und wenn das so ist wie ich es mir denke, dann dürfte es faktisch echt ein Designfehler sein. Wobei, Designfehler ist vielleicht das falsche Wort, der Lasercut dürfte da viel eher die Schuld dran haben.
Was ist, wenn die SMMs jeweils dedizierte Speicherchips hätten? Je vier SMMs müssten sich somit einen 64Bit Controller teilen. Cutet man nun drei SMMs direkt nebeneinander weg (von der gleichen Interfacegruppe), würde das bedeuten, das drei Gruppen vollen Speed nutzen würden -> über die Größe von allen drei Pärchen-Speicherchips -> das vierte Pärchen wäre nur zu einem virtel voll ansprechbar. Ergo 128MB. Das wären 3200MB mit vollem Speed.
Rechnet man weiter, stehen ca. 150GB/sec für die 970er, und ca. 178GB/sec für die 980er. Das sind ziemlich genau diese 18,75%, wie es auch 13 zu 16 SMMs sind. Der letzte Bereich von ~500MB wird mit 22GB/sec im Schnitt angesprochen -> was rechnerisch 1/4 der SMX pro 64Bit Controller entsprechen würde. Kommt also ebenso hin. Es müssten nach dieser Theorie aber immer Einbrüche ab 3200MB auftreten. Wenn ich die Benches verfolge, scheint es aber auch Werte zu geben, die erst später einknicken... -> würde also dagegen sprechen.
Es kann somit aber auch nicht sein, dass SMMs von zwei unterschiedlichen ROP Partitionen betroffen wären. Denn dann müssten wiederum die letzten ~500MB mit 44GB/sec ansprechbar sein anstatt mit 22...
Nur selbst wenn das soweit schlüssig ist, stellt sich mir hier immernoch die Frage, warum gibt es diese 1:1 Beziehung? Mir wäre keine andere Spiele-GPU bekannt, wo man so ein Konstrukt intern fährt...
PS: was dieser Erklärung gegenüber steht ist das Statement von NV, wonach die 980er das gleiche Verhalten zeigen soll(te) -> da diese alle SMMs aktiv hat, kann sie nicht das gleiche Verhalten zeigen. Zumindest nicht an der Bandbreite.
Aber ggf. ist da noch was ganz anderes im Busch? Die Speicherbandbreite selbst kommt mir sowieso arg niedrig vor. Das sind 20,5% unter der theoretischen Einheit. Meine 780TI Stock kommt auf knapp 90% des theoretisch möglichen... Auch Werte von GK104 in Nais Bench zeigen da eher ~10% Abweichung von der Theorie...
Eine 750/750TI wäre mal interessant für einen Gegentest!