Paper bestätigt AMD Zen-APU mit HBM-Speicher

Redphil

Redakteur
Thread Starter
Mitglied seit
02.12.2004
Beiträge
6.831
Ort
Leipzig
<p><img src="/images/stories/logos-2013/AMD_Logo_2013.jpg" alt="AMD Logo 2013" style="margin: 10px; float: left;" />Man konnte zwar schon <a href="index.php/news/hardware/prozessoren/37326-amd-zen-prozessoren-angeblich-im-4-quartal-2016.html" target="_blank">davon ausgehen</a>, dass AMD HBM-Speicher auch für neue APUs nutzen wird - ein Paper hat das aber jetzt bestätigt. Es entstand unter Mitwirkung von Mike Mantor, einem der wichtigsten Grafikspezialisten von AMD.</p>
<p>Eine Grafik lässt AMDs APU-Entwicklung nachvollziehen. Auf die aktuelle Carrizo-Architektur sollen 2016 Zen-APUs folgen. Die Grafik hebt vor allem den Fortschritt beim integrierten Videospeicher hervor. Schon mit Carrizo wurde der voll-kohärente Speicher über einen Onion3-Bus angebunden. Das führte zu einer...<br /><br /><a href="/index.php/news/hardware/prozessoren/37611-amd-arbeitet-an-einer-zen-apu-mit-hbm-speicher.html" style="font-weight:bold;">... weiterlesen</a></p>
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
HBM Gen1 mit max. 4GB auf dem Die würde ich für eine APU mehr als ausreichend finden. Gen.2 dann eben auf den nächsten Teilen bzw. auf den GPU´s !
 
waren nicht die AMD APUs in Spielen vor allem wegen der Speicheranbindung limitiert? Das sollte nun der Vergangenheit angehören, oder?
 
Dass AMD scheinbar nicht auf HBM-Speicher der zweiten Generation setzt, überrascht etwas - schließlich wird diese Generation 2016 erwartet. Bisher hatte AMD selbst auch angegeben, dass die Zen-APUs erst für 2017 zu erwarten sind.

Allet andere als überraschend, bei Tomshardware steht dass HBM1 4GB kann.
Die Leistungsleistung einer Onboardkarte braucht niemals nie mehr als 4GB, also Genmeration 1!
 
Wird der HBM Speicher dann nicht auch als Arbeitsspeicher verwendet so wie bei den Konsolen? oder soll der nur für die Grafik dienen?

Denn für eine schwächere APU reichen die 4GB vollkommen und vor allem wird Hynix und AMD so die HBMv1 Chips los!

Die Dinger werden auf jeden Fall interessant, zusammen mit 14nm und Zen klingt das Paket nach der perfekten Lösung für kleine FullHD-Gaming-HTPCs!
 
@NasaGTR
Dazu hat man noch nichts gesagt, imho wäre eine Einbindung als eine Art L4 Cache [1] aber am sinnvollsten. Dann hat man die Upgradeoption und die Geschwindigkeit.

[1] Für beide, da die CPU ja eig. auch von extrem hohen Bandbreiten profitiert.
 
Könnte mir vorstellen, das L4 Cache oder System RAM möglich wären (per Bios einstellbar).

Um das ganze dann für OEMs günstiger und damit interessanter zu machen.
 
Naja als normaler RAM wären die 4GB zu klein...
Aber Stimmt ne Mischung aus L4 Cache und VRAM, dazu DDR4 als RAM wären top!
 
Das liest sich echt gut! :)

Kann den Zen Launch kaum noch erwarten!
 
Wow, das wird dann echt interessant was die wahre Leistungsfähigkeit der APUs angeht
und damit Zen auch der CPU-Teil besser sein soll kann das echt ein Knaller werden
bisher hatten die APUs zwar vornehmlich mit langsamen Speicher zu kämpfen, aber auch die CPU hätte etwas besser sein können
 
Könnte mal jemand den unterschied einer aktuellen APU von 1333 auf 1866 ddr3 ram rechnen und es dann auf HBM hochrechnen um einen GROBEN anhaltspunkt zu liefern was wir erwarten können?
 
Bisher hatten die APUs mit prinzipiell garkeinem Speicher zu kämpfen.Also keinem eigenen.War ja vom Hauptspeicher abgezwackt.

Ich verstehe deine Aussage nicht so ganz...
was ich sagen wollte war: selbst sehr schneller Speicher 2100+ war noch nicht schnell genug für die GPU
jetzt mit HBM dürfte es besser werden, da der Weg kürzer ist (liegt ja direkt am DIE) und der Durchsatz stark ansteigt

EDIT:
ohje, du beziehst dich auf das "eigen"?
ich glaube kaum, dass das einen signifikanten Unterschied macht
DDR3 war an sich schon zu langsam, da gibt es keine zwei Meinungen
 
Zuletzt bearbeitet:
Das ist ganz einfach ASCI3:
Die R7 250E/HD7750 müsste, wenn man die Speicherlimitierung streicht, zwischen 7850 und 7870K liegen, denn sie hat gleich viele Shader und liegt mim Takt in der Mitte.
In der Realität sieht das momentan allerdings ganz anders aus: AMDs APU „Kaveri“ im Test (Seite 4) - ComputerBase

Die 250E ist quasi eine Kaveri GPU ohne Speicherlimitierung.
 
Na endlich gibt´s mal Bewegung im APU-Sektor. Kann es kaum erwarten endlich ein kompaktes Powersystem zu bauen. Starke CPU mit mind. 4 Kernen dazu eine starke Grafikeinheit und schnellen RAM-Speicher und das alles auf der Fläche eines Sockels untergebracht. :cool:
Extrem kleine und updatefähige Gamingkisten sind wohl bald möglich.

4 GB ist zwar nicht die Welt, reichen aber locker für sämtliche Anwendungen und Spiele aus. Da dies alles auf dem selben Sockel AM4 basieren soll, so ist auch eine DDR4-Anbindung vorhanden, wo man noch zusätzlich erweitern kann. Wie das dann aufgeteilt wird, ist noch nicht sicher. Vermutlich wie ein sehr großer Cache-Speicher. Kann nur besser sein, als eine reinen DDR4-Anbindung.

Bei Arbeitsanwendungen ist die CPU mit dem Speicher gefragt und kann daher voll genutzt werden. Bei Games ist ja wieder mehr die GPU gefragt und dann bekommt sie den Vorrang des Caches.
 
Wenn der HBM exklusiv der GPU zur Verfügung steht hätten wir möglicherweise mit Zen direkt die Grafik Power der aktuellen 4GB Mittelklasse. Das wäre dann Konsolenniveau und würde das Martksegement für dedizierte Grafikkarten deutlich schrumpfen lassen.
 
Könnte mal jemand den unterschied einer aktuellen APU von 1333 auf 1866 ddr3 ram rechnen und es dann auf HBM hochrechnen um einen GROBEN anhaltspunkt zu liefern was wir erwarten können?
schau dir die 7750 an (ebenfalls 512 Shader), die gibt es mit DDR3 und GDDR5 und die liefert nur 70% der Leistung des GDDR5 Modells. Und hier greift keine CPU noch parallel auf den Speicher zu.

Und das bei der Zen APU bei 512 shadern bleibt, ist auch eher unwahrscheinlich.
 
Zuletzt bearbeitet:
Welche steigerungen wären demnach zu erwarten?

70% bei gleich bleibender architektur der gpu?
 
EDIT:
ohje, du beziehst dich auf das "eigen"?
ich glaube kaum, dass das einen signifikanten Unterschied macht
DDR3 war an sich schon zu langsam, da gibt es keine zwei Meinungen
Wenn eigener Speicher,dann hätte AMD GDDR5 genommen.DAS macht dann schon einen Unterschied.Aber das Zeuch (GDDR5 sowie DDR3) wäre zu fett gewesen,um es auf eine FM2-CPU zu brutzeln.Da wäre ein neuer Sockel nötig gewesen,oder extra Speicher auf dem MoBo.
Aber bitte siehe meine erste Anmerkung nicht als Kritik oder so.
 
Intel hat zurzeit die schnellste APU die am Markt ist, mit deren Broadwell Prozessoren wo 128MB eDRAM genutzt wird, kann man sagen inwieweit sich HBM auf AMD's APU's auswirken wird, oder anders gefragt, ist HBM schneller als eDRAM?
 
Alleine die 102 GB/s eDRAM gegenüber 500GB/s HBM1 sollten schon was bringen.
 
Stimmt....Hab vom Fiji abgeguckt...Trotzdem schneller und energieeffizienter.
 
Moment mal, bei aller Euphorie über das Thema APU mit HBM, aber hier (zumindest nach dem Artikel) stellen sich doch mal ganz paar Fragen...

- HBM "Gen1" mit 128GB/Sec bedeutet entweder ein Stack (im Artikel steht was von vier?) zu 500MHz oder vier Stacks zu 125MHz -> oder eine andere Kombo... Der Typ im Video spricht von 1GB, ergo nix mit 4GB, sondern 1GB, was ein Stack mit 500MHz bedeuten würde. Also verglichen mit Fiji gibts dort einen so einen Speicherbaustein neben dem DIE. Der Speicher wird dabei als Cache benutzt -> wird im Video gesagt. Und der DDR4 hängt bildlich gesehen dahinter.
- Onion3 Bus -> von 40 auf 50GB/sec aufgebohrt heist immernoch deutlich weniger als die Hälfte vom HBM Speicherdurchsatz. 50GB/sec ist dabei immernoch deutlich weniger, als es aktuelle 512 ALUs fassende GCN GPUs mit GDDR5 haben. Das ist nicht so viel Steigerung, wie man sich hier vielleicht erhofft... Im Dual Channel DDR3 mit 2400er Speichern kommt man schon auf ca. 38GB/sec theoretisch. Das wären poplige 15% mehr...
- Garlic Bus -> laut Angaben im Netz wurde der mit Carrizo rausgekürzt? Weil der Onion+ bzw. Onion3 Bus das nun miteinander kombiniert und damit der dedizierte Bus nicht notwendig ist/wäre -> aus HSA Sicht ist das auch sinnvoll bzw. konsequent, anstatt der GPU zu erlauben, dort über einen eigenen Weg in den Speicher zu greifen. Allerdings sehe ich halt das Problem, wenn, anders als bspw. bei der PS4 noch, kein dedizierter HighBandwith Bus mehr vorhanden ist, müssen die Daten durch den schmalen 50GB/sec fassenden Onion3 Bus... Da bleibt halt nicht viel übrig.

Gibt es noch andere Artikel zu dem Thema? Die etwas mehr in technische Details gehen? Weil so der Text ist mir etwas zu oberflächlich um hier irgendwas raus zu interprätieren... Wenn Sachen nicht erwähnt werden, heist das ja nicht, dass diese nicht vorhanden sind -> bspw. der Part mit dem dedizierten Bus System für direkten Memory Access auf den HBM Speicherpool. Ist da noch mehr drin als auf der Folie steht??
 
[...]
- Onion3 Bus -> von 40 auf 50GB/sec aufgebohrt heist immernoch deutlich weniger als die Hälfte vom HBM Speicherdurchsatz. 50GB/sec ist dabei immernoch deutlich weniger, als es aktuelle 512 ALUs fassende GCN GPUs mit GDDR5 haben. Das ist nicht so viel Steigerung, wie man sich hier vielleicht erhofft... Im Dual Channel DDR3 mit 2400er Speichern kommt man schon auf ca. 38GB/sec theoretisch. Das wären poplige 15% mehr...
ah shit, vollkommen übersehen
ja das lässt das ganze wieder nicht so rosig aussehen :/
 
@fdsonne: wccftech ist als Quelle oft etwas schwierig zu nutzen, deshalb habe ich in der News hauptsächlich die Infos aus der Grafik zusammengefasst. Die Meldungen im Netz, die ich sonst auf die Schnelle gefunden habe (z.B. AMD said to be working on Zen APU with HBM | KitGuru und Zen APU with HBM, 128GB/s bandwidth, larger onboard GPU spotted) beziehen sich auch auf wccftech.

Das sollte keine Kritik am Text sein, ich bin halt etwas vorsichtig, bevor ich hier in Euphorie ausbreche über Techniken, wo sich mir zumindest einige Fragen stellen...
Gerade das Thema mit dem Speicher geistern in meinem Hirn schon seit den ersten Meldungen über HBM und APUs rum -> sprich wie will man das lösen.

Gerade bei der gezeigten Folie kleben ja zwei Werte drauf. Und nachdem, was ich vorhin auf die schnelle über den Onion3 Bus gelesen habe, gibts halt keinen dedizierten Zugriff vom "GPU" Part der APU mehr direkt in den Speicher, sondern das geht über diesen Bus. Ob das nun der Weisheit letzter Schluss ist oder die Meldungen schlicht falsch sind, kann ich nicht sagen... Aber vielleicht kennt hier ja jemand nähere Details dazu.
Für mich wirken 50GB/sec durch den Bus als theoretisches "Maximum"? irgendwie zu wenig... Sollte es soweit kommen, hätte ich mir persönlich deutlich mehr erhofft. 100GB/sec+, damit das auch richtig abgeht...

Ich bin mir aber selbst noch nicht so 100% sicher, was ich von HBM APUs halten soll. Auf der einen Seite kann man damit potentiell das Bandbreitenproblem aus dem Weg schaffen, aber auf der anderen Seite steht der Preis. So eine APU mit sagen wir 300 oder 400€+ wird sich nur schwer verkaufen lassen, wenn es eine CPU + dGPU Kombo für ähnliches gibt, die schlicht schneller und deutlich flexibler ist. Von daher kann ich mir schon vorstellen, dass man hier möglichst "spart" wo man nur kann, damit man die Preise in für den Endkunden attraktiven Rahmen halten kann. Wenn da 200€ für die große APU stehen, wäre das schon wünschenswert...
 
Vermutung:
Der HBM hängt direkt an der GPU und dient hier wie bei einer dGPU als VRAM, Onion3 wäre dann vergleichbar mit PCIe. Bei den kleineren APUs bleibt HBM halt weg, da sollten die 50GB/s von Onion3 aber noch ausreichen um die 2*~25GB/s vom DualChannel DDR4 zur Verfügung zu stellen.
 
Das würde doch aber dem Konzept von HSA irgendwie entgegen stehen?
Da gehts doch auch darum, dass es den EINEN Speicher gibt. Sowohl GPU als auch CPU teilen sich diesen... Oder besser ausgedrückt, es gibt nicht mehr GPU und CPU, sondern nur noch einen Prozessor, der x86 Code sowie auch Code für 3D Anwendungen und sonstwedes GPGPU Zeug abdecken kann -> wo die Einheiten das halt ensprechend abdecken.

Wenn du nun dem GPU Part Speicher dediziert beiseite stellst, wirds wieder ein Platzproblem geben. Bei 1GB -> was rechnerisch bei HBMv1 und 128GB/sec rauskommt, wäre das nicht die ideale Lösung.
Die große Preisfrage für mich ist immer, für was soll das Teil sein... Wenn es mehr oder weniger ums Spielen geht, braucht man doch eigentlich nicht riesige Speicher mit viel Bandbreite -> die Texturen dürfen doch spielend auch in etwas langsameren Speicher liegen. Die GPU muss nur verglichen Schnell ihre Daten der Berechnungen ablegen und zugreifen können. Die Texturen sind ja nur das Beiwerk, was viel Platz kostet. Im GPGPU Bereich bzw. anderen GPU beschleunigten Themen schaut das möglicherweise wieder ganz anders aus. Kommt wohl also auch auf die Ausrichtung der APU an.

Der Typ im Video spricht von DDR4 als quasi Erweiterung im Platz, nur wie und an was macht man das nun fest, welche Daten wo liegen? Das klingt in erster Linie erstmal danach, dass der HBM Speicher eher als Cache zwischen hängt. Ist ja nicht so schlecht, muss halt sauber funktionieren, wenn alle Daten diesen Cache durchlaufen. Ggf. gibts da dann reservierte Bereiche? Also das definitiv immer der GPU gewisser Platz bereit steht für ihre Arbeit.
Keine Ahnung... Ich glaube da müssen mehr Infos her :fresse:
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh