GM200 und R9 300er

Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Wenn die GPU nicht auch weiter beschnitten wird, sollten keine Probleme von 12GB zu 6GB zu erwarten sein. Da nimmt man dann einfach Speicherbausteine mit halber Kapazität.

Hmm. Ich bezweifle aber dass die 980ti 3072 Shader haben wird. Die Lücke zur 980 wäre zu groß. Eher sowas wie ~2568, also ind er Mitte zwischen 980 und Titan X.
 
Hmm. Ich bezweifle aber dass die 980ti 3072 Shader haben wird. Die Lücke zur 980 wäre zu groß. Eher sowas wie ~2568, also ind er Mitte zwischen 980 und Titan X.

Oh, da hab ich mich etwas missverständlich ausgedrückt. Die Shader kann man im Prinzip beschneiden wie man lustig ist. Hauptsache das Speicherinterface bzw. der L2-Cache wird nicht weiter beschnitten und bleibt im Vollausbau.
 
Ich hoffe das übt dann "Releasedruck" auf AMD aus! will endlich die 390X! :d
 
Die Frage is nun ob die 12gb Ram auch komplett schnell angebunden sind.
Das muss man ja nachdem Desaster fragen bevor man die überhaupt in betracht zieht.
 
Oh, da hab ich mich etwas missverständlich ausgedrückt. Die Shader kann man im Prinzip beschneiden wie man lustig ist. Hauptsache das Speicherinterface bzw. der L2-Cache wird nicht weiter beschnitten und bleibt im Vollausbau.
Soweit ich das verstanden habe, ist genau das das Problem! Die Maxwell Architektur ist nicht so modular, sondern hat relativ große "Einheiten". Will man weniegr Shader drin lassen, muss man schnell viele andere Teile abschalten und verleirt damit auch L2-Cache und im schlimmsten Fall auch Speicherinterface.
Kenne mich mit der genauen Architetur aber nicht so aus...
Allerdings hat NV bei der 970 dieses 2-Ram-Breiche System auf jeden Fall nicht aus Jux eingebaut!
 
@StillPad


384bit Speicherinterface sprechen dafür. Die 4GB sind mit 256bit angebunden. Rechnest Du die Hälfte dabei, bist Du bei 6GB und 384bit. Jetzt nimmst Du RAM-Bausteine mit doppelter Kapazität und bist bei 12GB.
So "sollte" es sein.
 
So alles hinfällig, die gtx 960 4 GB kommt:d
 
Soweit ich das verstanden habe, ist genau das das Problem! Die Maxwell Architektur ist nicht so modular, sondern hat relativ große "Einheiten". Will man weniegr Shader drin lassen, muss man schnell viele andere Teile abschalten und verleirt damit auch L2-Cache und im schlimmsten Fall auch Speicherinterface.
Kenne mich mit der genauen Architetur aber nicht so aus...
Allerdings hat NV bei der 970 dieses 2-Ram-Breiche System auf jeden Fall nicht aus Jux eingebaut!

Nur damit ich dich richtig verstehe. Du meinst also, dass beim wegschneiden von SMM-Cluster automatisch auch L2-Cache und Speicherinterface beschnitten werden müssen und es nicht möglich wäre NUR die SMM-Cluster alleine zu beschneiden und den Rest intakt zu lassen?

Ob das wirklich so ist, weiß ich nicht. Halte ich durchaus für möglich. Ich habe es bisher aber immer so gesehen, dass man SMM-Cluster nahezu beliebig deaktivieren kann, denn während der Produktion einer GM204-GPU weißt du ja nie welche der 16 SMM-Cluster aufgrund von Fehlern deaktiviert werden müssen. So kann bei einer GTX970 mit nur 13 aktiven SMM-Cluster, ein GPC-Cluster auch nur einen aktiven SMM-Cluster haben, während die drei anderen mit jeweils 4 aktiven SMM-Cluster vollwertig sind. Oder aber in 3 GPC-Cluster ist jeweils 1 SMM-Cluster deaktiviert. Dritte Möglichkeit wäre dann noch 1 GPC-Cluster mit 2 aktiven SMM-Cluster und 1 GPC-Cluster mit 3 aktiven SMM-Cluster. Egal wie man deaktiviert, alle Lösungen sollten in etwa gleichwertig sein.

Beim L2-Cache von insgesamt 2048KB sehe ich es so, dass dieser sich zuerst auf die 4x 64bit Speichercontroller aufteilt, wo er dann zu 8x 256KB Blöcken durch je ein 32bit Interface den Speicher direkt anspricht. Nun wird aber bei der GTX970 ein 256KB Block deaktiviert und es stehen insgesamt nur noch 7x 256KB zur Verfügung. Einen der 4 Speichercontroller stehen damit nur noch 256KB für je 2 32bit Interface zur Seite, um mit dem Speicher zu kommunizieren. Mit der Kepler-Architektur wäre dieser Weg nicht möglich gewesen und man hätte einen 64bit Speichercontroller komplett lahmlegen müssen. Nur durch diesen Umstand, den deaktivierten 256KB L2-Cache Block entsteht die ganze GTX970 Speicherproblematik.

Ich habe deshalb meine Zweifel, dass man SMM-Cluster und L2-Cache nicht getrennt beschneiden kann. Für die zusätzliche Beschneidung des L2-Caches sehe ich als Grund die fehlerhafte Chipausbeute. Vollwertige L2-Cache Chips mit teildeaktivierten SMM-Cluster dürften wesentlich unwirtschaftlicher sein als solche mit ebenso teildefekten L2-Cache. Die Möglichkeit besteht also eine GTX970 mit 2048KB Cache zu fertigen, allerdings zu deutlich uninteressanteren Bedingungen.

Beweise das dies auch wirklich so ist, habe ich aber keine! Oben stehender Sachverhalt spiegelt nur mein Wissen, gepaart mit gesunden Menschenverstand wieder. Falls es sich anders verhält, lerne ich gerne dazu.
 
Auf dem Bild damals zur GTX970 sehen war aber das die Maxwell Cluster auf der Einen und der L2 Cache mit Speichercontroller auf der anderen Seite
Dazwischen Lag die Crossbar! Beide Seiten (Maxwellcluster und L2Cache+Interface) sind scheinbar voneinander relativ unabhängig!

So hab ich die Zeichnung jedenfalls verstanden, also sollte das SP beschneiden ohne den L2 Cache an zu fassen gehen.
Gemacht wurde es aber damit man die Chips mit einem defekten Cache bereich trotzdem verwenden kann.

Und daraus fehlten dann einfach mal so 1/8 vom Speicher xD
Aber hey man hat am Chip etwas gespart!
 
Hmm. Ich bezweifle aber dass die 980ti 3072 Shader haben wird. Die Lücke zur 980 wäre zu groß. Eher sowas wie ~2568, also ind er Mitte zwischen 980 und Titan X.

Das dürften eher um die 22 SMMs werden. Also 2816 ALUs ;)
Die Lücke ist auch nur auf dem Papier so groß... Bedenke, der Takt wird beim GM200 ganz sicher wieder ganz paar MHz, wenn nicht gar ganz paar hundert MHz niedriger ausfallen als beim GM204.
50% mehr ALUs bei 20% weniger Takt und die Lücke ist nicht mehr so riesig :wink:

Die Titan X sehe ich irgendwo im Bereich 40%, vielleicht 45% oberhalb der 980er. Ein mögliches Gamermodell dazwischen mit 22 SMMs + nochmals etwas weniger Takt und schärferen PowerTarget Restriktionen kann man dann um die 25% oberhalb plazieren. Könnte mir allerdings auch vorstellen, dass NV hier klar auf das jeweilige AMD Gegenstück abzielt, bzw. dieses versucht hinter sich zu lassen... Das macht die Preise etwas flexibler.

Soweit ich das verstanden habe, ist genau das das Problem! Die Maxwell Architektur ist nicht so modular, sondern hat relativ große "Einheiten". Will man weniegr Shader drin lassen, muss man schnell viele andere Teile abschalten und verleirt damit auch L2-Cache und im schlimmsten Fall auch Speicherinterface.
Kenne mich mit der genauen Architetur aber nicht so aus...
Allerdings hat NV bei der 970 dieses 2-Ram-Breiche System auf jeden Fall nicht aus Jux eingebaut!

Das sind schon zwei getrennte paar Schuhe... Es gibt im Grunde vier Ausführungen der GM204 GPU. Und nur eine davon ist Vollausbau ;) Während allerdings zwei der Ausführungen das Speicherproblem haben. Allerdings sind eben die zwei weiteren im Notebookbereich anzutreffen und dort spart man nicht mit dem VRAM ;) Ob nun eine GTX 970M mit physisch 8GB nur 7GB schnellen VRAM hat, ist im Grunde in der Praxis wurscht -> in diese Regionen wird man wohl auf absehbare Zeit nicht vordringen, entsprechend kommt es da nicht zu problemen.

PS: die 980M ist mit 12 SMMs, die aktiv sind auch voll über das SI und den L2 Cache angebunden. Auch gibt es offenbar laut Aussagen NVs auch Prototypen der 13 SMM breiten 970er, die über volle ROP Partitionen verfügen.
Auch Maxwell gliedert sich, wie schon Kepler davor bspw. in GPCs -> diese GPCs beherbergen SMMs (SMX bei Kepler) zu je 128ALUs. Die ROP Partitionen sind davon primär losgelöst -> was auch die Crossbar verdeutlicht. Das SI, der L2 Cache und der Connect zur Crossbar hingegen ist die andere Seite der Medallie.


Es gibt also im Grunde auch keine Anzeichen, dass beim GM200 ebenso wie bei der 970er verfahren werden muss. Denkbar wäre es allerdings, die Katze ist ja nun aus dem Sack... Wenn sie es vorher ankündigen, ist das ja auch "OK" ;) Mit dem 384Bit SI wären dass allerdings am Ende dann anstatt acht Beinchen zur Crossbar eben jener 12 -> eins weggekürzt würde unterm Strich bedeuten, dass 5,5GB schnell laufen würden, wärend wiederum 512MB lahm wären. Oder man kürzt mehrere Beinchen ein.
Das dürfte allerdings am Ende viel eher eine Frage der Ausbeute sein... Gerade 28nm dürften heute relativ perfekt laufen, also einen Zwang da unbedingt den Ausschuss an den Mann bringen zu müssen, sehe ich weniger, das trifft viel eher auf neue Prozesse zu, die von Anfang an holprig gestartet sind (40nm bei Fermi bspw.)
 
Das dürften eher um die 22 SMMs werden. Also 2816 ALUs ;)
Die Lücke ist auch nur auf dem Papier so groß... Bedenke, der Takt wird beim GM200 ganz sicher wieder ganz paar MHz, wenn nicht gar ganz paar hundert MHz niedriger ausfallen als beim GM204.
50% mehr ALUs bei 20% weniger Takt und die Lücke ist nicht mehr so riesig :wink:

Die Titan X sehe ich irgendwo im Bereich 40%, vielleicht 45% oberhalb der 980er. Ein mögliches Gamermodell dazwischen mit 22 SMMs + nochmals etwas weniger Takt und schärferen PowerTarget Restriktionen kann man dann um die 25% oberhalb plazieren. Könnte mir allerdings auch vorstellen, dass NV hier klar auf das jeweilige AMD Gegenstück abzielt, bzw. dieses versucht hinter sich zu lassen... Das macht die Preise etwas flexibler.



Das sind schon zwei getrennte paar Schuhe... Es gibt im Grunde vier Ausführungen der GM204 GPU. Und nur eine davon ist Vollausbau ;) Während allerdings zwei der Ausführungen das Speicherproblem haben. Allerdings sind eben die zwei weiteren im Notebookbereich anzutreffen und dort spart man nicht mit dem VRAM ;) Ob nun eine GTX 970M mit physisch 8GB nur 7GB schnellen VRAM hat, ist im Grunde in der Praxis wurscht -> in diese Regionen wird man wohl auf absehbare Zeit nicht vordringen, entsprechend kommt es da nicht zu problemen.

PS: die 980M ist mit 12 SMMs, die aktiv sind auch voll über das SI und den L2 Cache angebunden. Auch gibt es offenbar laut Aussagen NVs auch Prototypen der 13 SMM breiten 970er, die über volle ROP Partitionen verfügen.
Auch Maxwell gliedert sich, wie schon Kepler davor bspw. in GPCs -> diese GPCs beherbergen SMMs (SMX bei Kepler) zu je 128ALUs. Die ROP Partitionen sind davon primär losgelöst -> was auch die Crossbar verdeutlicht. Das SI, der L2 Cache und der Connect zur Crossbar hingegen ist die andere Seite der Medallie.


Es gibt also im Grunde auch keine Anzeichen, dass beim GM200 ebenso wie bei der 970er verfahren werden muss. Denkbar wäre es allerdings, die Katze ist ja nun aus dem Sack... Wenn sie es vorher ankündigen, ist das ja auch "OK" ;) Mit dem 384Bit SI wären dass allerdings am Ende dann anstatt acht Beinchen zur Crossbar eben jener 12 -> eins weggekürzt würde unterm Strich bedeuten, dass 5,5GB schnell laufen würden, wärend wiederum 512MB lahm wären. Oder man kürzt mehrere Beinchen ein.
Das dürfte allerdings am Ende viel eher eine Frage der Ausbeute sein... Gerade 28nm dürften heute relativ perfekt laufen, also einen Zwang da unbedingt den Ausschuss an den Mann bringen zu müssen, sehe ich weniger, das trifft viel eher auf neue Prozesse zu, die von Anfang an holprig gestartet sind (40nm bei Fermi bspw.)

Sage mal hast du solch langeweile oder schreibst du gerne Aufsätze....... ?
 
Das ist kein Aufsatz. Denn der hat ja bekanntlich eine Einleitung, Haupteil und nen Schluss :d
 
Bisher finde ich seine Post´s immer sehr lehrreich...
Aber Paul Panzer möge man den Witz verzeihen ;)
 
Wenn ich das richtig sehe echt nur 4GB?
Dann bleibt das Optimum ja bestehend aus Crossfire 290x 8GB...
Zumindest wenn man maximalen Speicher will um luft nach oben zu haben oder mit massiv Mods zu spielen.
 
Zuletzt bearbeitet:
Denke mit DX 12 wird das Problem mit dem Speicher etwas nach hinten rücken.

Nicht unbedingt. Aber bis DX12 im Form von PC-Spielen auch am Markt angekommen ist, vergehen sicher noch 1-2 Jahre. Bis dahin gibt es sicher schon eine R9 400 Serie und 8GB VRAM...
 
Also ich kann mir nicht vorstellen das die 390X nun wirklich nur 4gb haben wird.
Auf dem Papier isse ja schneller als die Titan X die mal eben 12gb haben will.
Ich denke die 390X wird 8gb haben. Gibt ja jetzt schon 290Xer mit 8gb wäre ja blöd wenn eine alte Karte mehr Speicher hat als eine Neue.
 
Die Speichergröße hat erstmal nix mit schneller oder langsamer zu tun.
Beim neuen HBM speicher sind 4GB nicht unrealistisch
 
Evtl kommt von Sapphire wieder eine sonderedition mit 8GB falls das bei HBM speicher soweit möglich ist.

Solange mann aber nur eine Karte nutzt sind die 4GB sicherlich noch eine zeitlang ausreichend. Da für mich nur CF in frage kommt werd ich falls es wirklich nur 4GB sind wohl auf die 290x mit 8GB gehen müssen.
 
Die Speichergröße hat erstmal nix mit schneller oder langsamer zu tun.
Beim neuen HBM speicher sind 4GB nicht unrealistisch

Was willst denn auf die schnellste Karte denn wenig Ram packen?
Dat macht doch keen Sinn ;)

Man sieht doch jetzt schon das Watchdogs über 6GB Ram benutzt.
Vielleicht wird die 390X es schaffen das dann mal mit 30FPS zum laufen zu bringen und dann kannste es nicht zocken weil der RAM immer überfüllt ist.
Und Zukunftssicher halte ich die 4gb auch nicht mehr.
 
Die Logik verstehe ich nicht so ganz:
then this Radeon R9 290-series replacement would be the company’s fastest card ever, especially with the latest games running ultra-high-definition resolutions like 4K or 5K. If that happens, then the launch would significantly disrupt sales of all other Radeon R9 series products,
In wiefern wirkt sich das Erscheinen einer 600 Euro Karte, (negativ) auf die Verkäufe der <300Euro Modelle aus? Das ist einfach nicht die selbe Zielgruppe.

Jetzt wo NV ihr eigenes Flagschiff angekündigt hat, wäre AMD gut beraten das Selbe zu tun, egal ob die kleineren Karten noch auf sich warten lassen oder nicht, finde ich.

Die Verschiebung ist nicht so klasse, aber immerhin "full-lineup" hört sich gut an. Dann sind es nicht nur Rebrands!
 
Zuletzt bearbeitet:
Das verstehe ich auch nicht...die Leute die eine R9 290(X) haben wollen, haben schon eine...die anderen warten auf die neuen Karten...ausserdem sind die Karten, wie du schon sagst, preislich soweit auseinander, dass Sie sich nicht gegenseitig beeinflussen würden.
Keine Ahnung wer diese Strategie bei AMD vorschreibt aber das sowas nicht funktioniert lernt man im 1.Semester BWL.
Je länger die mit ihren Karten warten umso schlechter sieht es für sie aus.
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh