[Sammelthread] AMD Fusion "Llano" APU-2011 (K10 Cores & VLIW5 GPU) A4 / A6 / A8 Series

Ram kostet doch derzeit eh fast nichts.
Dann kann man locker zum 1600 geifen.
Hab mir auch grade diesen für mein Bulldozer-Board geholt, weil er nicht mehr kostet wie DDR1333 vor ca 2 Monaten.
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
@Pfilzer: Danke für die INfos. Habe mal 1600´er Ram mit aufgenommen. Noch ganz knapp unter 300 mit der Config.:fresse:
 
Glaube ich nicht wirklich. Sandy nutzt z.B. auch nur 1333Mhz und ist trotzdem schnell. Habe eher gehört das die Speichertaktunterschiede nur beim benchen auffallen.
Sandy Bridge hat aber eine deutlich langsamere IGP, die natürlich auch weniger Speicherbandbreite braucht. Dazu kommt, dass der Speichercontroller in Sandy Bridge auch nicht so weit entwickelt ist wie bei Llano. Also die Kommunikation zwischen CPU und GPU ist bei Llano fortschrittlicher und weiter integriert. Intel behilft sich da teils lediglich mit der Notlösung L3. Also bis DDR3-1600 skaliert Llano noch recht gut. Darüber hinaus nur noch gering. DDR3-1866 muss es deshalb nicht sein. Wenn es das Budget aber hergibt, kann man schon DDR3-1600 empfehlen.
 
Zuletzt bearbeitet:
Glaube ich nicht wirklich. Sandy nutzt z.B. auch nur 1333Mhz und ist trotzdem schnell.

Moment, wir reden ja von der Bandbreitenlimitierung für die IGP. ;) Sandy Bridge hat noch den L3 Cache, einen generell effizienteren Speichercontroller und die deutlich schwächere IGP, hier spielt die Bandbreite ohnehin eine geringere Rolle - für Llano haben einige Seiten aber sogar noch bei DDR3-2133 noch ganz nette Zugewinne im IGP-Betrieb ermittelt. :)
 
Ja stimmt. Hatte nicht berücksichtigt das von der Speicherbandbreite für die IGP gesprochen wird. Und nicht für die CPU alleine.;)
 
Moment, wir reden ja von der Bandbreitenlimitierung für die IGP. ;) Sandy Bridge hat noch den L3 Cache, einen generell effizienteren Speichercontroller und die deutlich schwächere IGP, hier spielt die Bandbreite ohnehin eine geringere Rolle - für Llano haben einige Seiten aber sogar noch bei DDR3-2133 noch ganz nette Zugewinne im IGP-Betrieb ermittelt. :)

welche seiten?

wobei bei höheren Taktraten die Latenzen an Bedeutung zunehmen. wenn taktsteigerungen mit hohen latenzen erkauft werden, sinkt der effekt durch den höheren takt schnell wieder. daher 1600er oder 1800er mit möglichst niedrigen latenzen, imo.



E: In Preissuchmaschinen ist der A8-3800 jetzt in England gelistet, aber noch nicht auf Lager.
 
Zuletzt bearbeitet:
Lässt sich ja alles belegen. ;)

Test:

Die Netto-Bandbreite von Llano ist für DDR3-1866 ziemlich mies - im Verhältnis nicht besser als der diesbzgl. auch nicht wirklich effiziente K10(.5). Ich tippe mal darauf, dass man sich bei Bulldozer etwas intensiver dieser Problematik gewidmet hat.
 
Da ja bekannt ist, dass Llano doch nur ein marginal verbesserter Athlon ist, verwundert das wohl nicht.
 
Jup, typische Speicherbenchmarks sagen uns zu der Aussage oben gar nichts. Es geht vielmehr darum, wie CPU und GPU gemeinsam angebunden werden, Stichwort Zero Copy oder Unified Address Space. Und dort ist Llano eben ein ganzes Stück fortschrittlicher.
 
Da ja bekannt ist, dass Llano doch nur ein marginal verbesserter Athlon ist, verwundert das wohl nicht.

Nicht wirklich, in der Tat. Gerade die momentan noch fehlenden wichtigen Verbesserungen beim Thema Bandbreite/On-Chip-Kommunikation, also nicht nur ein effizienterer IMC sondern auch ein gemeinsamer (L3-)Cache und der Ringbus, werden wir in zukünftigen Nachfolgern Llanos sicherlich noch sehen. Die Vorteile liegen auf der Hand, um mal David Kanter zu zitieren:

"In particular, it is clear that sharing the last level cache and unified power management are hugely beneficial to performance and power efficiency."
"The Sandy Bridge LLC and ring interconnect can rapidly pass data from the GPU back to the CPU – AMD’s Fusion is a far higher performance GPU, but that particular style of communication is discouraged."
 
Zuletzt bearbeitet:
Da ja bekannt ist, dass Llano doch nur ein marginal verbesserter Athlon ist, verwundert das wohl nicht.
Richtig, daher ist der Bandbreitendurchsatz nicht viel weiter als auf dem Level von vor 4 Jahren als der K10 rauskam. Mit Trinity auf Bulldozer Basis schaut das sicherlich ein ganzes Stück anders aus. Bereits die erste Bulldozer Generation soll einen um bis 50% verbesserten Speichercontroller besitzen. Aber wie gesagt, das eigentlich interessante an Llano ist die Anbindung von CPU und GPU an den Speichercontroller. Hier ist man Intel mindestens ein bis zwei Schritte voraus. Deren Kommunikation über den L3 ist lediglich eine Notlösung. AMD spart sich praktisch diesen Zwischenschritt und kann die Daten direkt über den Speichercontroller transferieren, innerhalb eines gemeinsamen Adressraumes, was die Kommunikation natürlich beschleunigt. Intel wird wohl einen ähnlichen Weg gehen müssen, wenn sie eine performante iGPU nutzen möchten. Selbst ein LLC ist einfach viel zu klein, um Grafikdaten ausreichend puffern zu können. Caches sollen ja auch nichts für die Bandbreite bringen, Caches sind für niedrige Latenzen zuständig. Bei GPGPU schaut es ein bisschen anders aus. Da hängt es einfach von der work size der Daten ab, ob Bandbreite oder Latenzen ausschlaggebend sind. Aber selbst bei Latenzen sehe ich wenig Sinn in einem Unified LLC. Da dürften lokale Caches immer noch effizienter sein.
 
Wie auch David Kanter sagt: L3 plus Ringbus ist besser als IMC und alles andere als eine Notlösung.
 
Wie auch David Kanter sagt: L3 plus Ringbus ist besser als IMC und alles andere als eine Notlösung.
Was er schreibt ergibt keinen Sinn. Aber das kennen wir ja durchaus von ihm. Man sollte seine Artikel nicht unbedingt für bare Münze nehmen. Er hat Bulldozer auch mit dem P4 verglichen und behauptet, Bulldozer wäre ein Speed Dämon. :rolleyes: Mittlerweile sollte man es besser wissen.

Die Daten vom RAM müssen sowieso über den MC. Der effizienteste Weg ist daher, direkt dort Datenkohärenz zwischen CPU und GPU sicherzustellen. Der Weg über den LLC ist ein Zwischenschritt, der die Kommunikation nur unnötig verkompliziert und verlangsamt. Es ist und bleibt daher eine Notlösung. Einen Unified Cache kann man maximal zur Kommunikation zwischen CPU und GPU nutzen. Das ist erstens aber eher weniger das Problem einer Fusion Lösung, denn normalerweise werden die Daten direkt auf die jeweilige Prozessoreinheit geladen. Das Wesen von Fusion ist, die richtige Prozessoreinheit für die jeweilige Aufgabe zu nutzen und nicht sinnlos Daten zwischen verschiedenen Prozessoreinheiten hin und her zu schieben. Zweitens bringt das nur etwas, wenn die benötigten Daten schon gecached sind. Und drittens bringt es nur etwas, wenn die Grösse der Daten vergleichsweise gering ist. Typische L3 Grössen von aktuell 4 bis 8 MiB sind nun mal alles andere als üppig dimensioniert. Daran wird auch die nahe Zukunft nicht viel ändern, wenn der L3 immer nur um ein paar MiB aufgestockt wird.
 
Nicht nur David Kanter, auch Andreas Stiller zog in der Vergangenheit den Vergleich zu Netburst - und das nicht völlig ohne Grund.
 
Ja, Andreas Stiller liegt in einigen Punkten genauso falsch. Der behauptete auch, Bulldozer würde an IPC verlieren gegenüber K10, obwohl AMD schon vor langer Zeit das Gegenteil bestätigt hat. Ich hatte mich mit ihm darüber mal per E-Mail unterhalten. Lustigerweise kannte er viele Infos von AMD nicht mal. Das sagt mir eher, dass da grundsätzliches Wissen zur Thematik fehlt. Es bleiben halt persönliche Ansichten dieser Leute, vielleicht sogar mit einem Schuss Voreingenommenheit. Deshalb sollte man das nicht zu ernst nehmen und zu viel reininterpretieren.

Wie auch immer, Bulldozer ist jedenfalls alles andere als ein Speed Dämon und auch nicht mit Netburst vergleichbar. Laut letzten Infos hat Bulldozers Integer Pipeline 15 Stufen (3 mehr als bei K10) und liegt damit auf Nehalem / SB Niveau. Netburst hatte anfänglich 20 Stufen und später über 30.
 
Zuletzt bearbeitet:
Was Bulldozer ist, wird sich noch zeigen. Bisher kann ich (man) die Leistung schlecht abschätzen. Außer wenig seriösen Benches gab es noch nicht viel, woran man die Performance messen kann.

Für mich persönliche würde es eine herbe Enttäuschung sein, wenn er den 2600K Sandy nicht schlagen kann Multithreaded.

Llano ist eine verdammt gute Sache, leider aufgrund einer schlappen Produktion von Global Foundries wenig verfügbar. Mit der APU lassen sich 80% der Usability für gewöhnliche Home-User abdecken. Was will man mehr Quadcore (Multithreading), Grafikeinheit (DX11, 1.4a HDMI, 3Dfähig, GPU beschleunigte Anwendungen, Games), Effiziens (selbst Hand anlegen) in einem Paket und vorallem Platzsparend.

Für mich persönlich dem Core i-3 Ablegern im Paket überlegen.
 
Laut letzten Infos hat Bulldozers Integer Pipeline 15 Stufen (3 mehr als bei K10) und liegt damit auf Nehalem / SB Niveau.
Die letzte Info war aber nicht sicher. Da hat nur irgendeiner ein Bildchen gemalt. Kann ich auch für 18-19 Stufen machen, wenn Du magst ;-)
 
Davon sprach ich auch nicht. Ich meinte damit den Optimization Guide von AMD. Der spricht von 15 Takten Penalty bei unbedingten Sprüngen. Das kann man als ziemlich gutes Indiz für die Länge der Integer Pipeline werten. Selbst wenn es am Ende ein oder zwei Stufen anders sein sollte, es ist klar, dass wir hier weit entfernt von Netburst sind. Man kann auch Bobcat als Vergleich heranziehen. Ich denke, dessen Pipeline wird sich nicht so sehr von Bulldozer unterscheiden. Warum auch?

Und mal abgesehen davon, wir wissen von Dresdenboy, dass solche "Bildchen" relativ nahe an der Wahrheit liegen können. ;)
 
Zuletzt bearbeitet:
Die ersten 65W-Modelle sind gelistet. Haben tut sie zwar noch keiner, aber immerhin: Geizhals.at :banana:
 
Kann mir jemand sagen, ob der IMC auch mit 1,65 V RAM-Spannung zurecht kommt? Beim Sandy Bridge wird ja davon abgeraten.
 
Kauf dir doch einfach neuen und geh auf Nummer sicher, RAM ist im Moment ja wirklich nicht teuer. ;)
 
Das war jetzt irgendwie keine Antwort auf die Frage.
 
Danke.
Komisch, dass das nicht auf der AMD-Website bei den Specs steht.
 
Na ist ja für die von Vorteil, wenn du deine APU durchglühst... :d

Ich finde die AMD-Seite generell etwas uninformativ, wirkt ein ein bisschen wie die HP-Homepage... ;)
 
Hallo,
ich habe fürn Freund ein A6-3650 System zusamengebaut.
Läuft auch alles prima.

Nun möchte ich ein wenig Übertakten, und habe im Bios den Multi auf 30 gestellt CPU-Z und Win7 zeigt mir die 3Ghz auch an.
Ist denn der Multi offen bei dieser CPU?

Oder ist das ein fehler von AMD (habe da was gelesen)
Muss ich doch über FSB Takten?
Wie und wo stelle ich das im Bios ein ....Mainboard "ASRock A75M-HVS"

Bissle Undervolten wollte ich auch, sollte ja gehen wie viele berichten.

Danke schon mal an alle!!!

Gruss
 
Beim A6-3650 sollte der Multiplier eigentlich bei 26 gelockt sein und du musst über den FSB takten.

Wo du das beim Board einstellst sollte eigentlich im Handbuch stehen. ;)
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh