[Sammelthread] AMD Fusion "Llano" APU-2011 (K10 Cores & VLIW5 GPU) A4 / A6 / A8 Series

mr.dude · 17.06.2011

Undertaker 1 schrieb:
Oh, das ist natürlich extrem unsauber. Das wertet den 1333->1600 Zugewinn um einiges ab. Gar nicht bemerkt, wichtiger Hinweis.

Ich kann mich an einen gewissen Undertaker 1 erinnern, der vor vielen Monden behauptet hat, dass Latenzen bei GPUs praktisch irrelevant sind. Ach da haben wir es ja.

Eine GPU hängt praktisch ausschließlich an der Bandbreite und nicht der Latenz.

Aber jetzt sollen Latenzen natürlich trotzdem relevant sein? Halt immer so wie man es braucht. Ist ja nichts neues, gell? Was für ein episches Eigentor. :haha:

Übrigens, wo sind denn die Infos zu den Latenzen her? Ich sehe zumindest nichts im Diagramm.

Und mal abgesehen davon, DDR3-1333 CL7 hat eine schlechtere Latenz als DDR3-1866 CL9. Wenn die Speicherlatenzen wirklich so viel ausmachen würden, dann würden sich die Ergebnisse weiter zusammen schieben, was noch weniger für eine grundlegende Bandbreitenlimitierung spricht.

Undertaker 1 · 17.06.2011

Zwei Punkte: Zum einen erhöht eine niedrigere Speicherlatenz die Effizienz, d.h. auch die Bandbreite steigt, Größenordnung etwa 5%. Weiterhin haben wir es mit teilweisen CPU-Limits zu tun - und die CPU-Leistung wird durchaus von der Speicherlatenz beeinflusst.

[mr.dude.mode]Mal wieder epic fail.[/mr.dude.mode]

Schaffst du auch mal ein Posting ohne Polemik? Das hätte ich dir auch auf simple Nachfrage erzählen können.

mr.dude schrieb:
Und mal abgesehen davon, DDR3-1333 CL7 hat eine schlechtere Latenz als DDR3-1866 CL9. Wenn die Speicherlatenzen wirklich so viel ausmachen würden, dann würden sich die Ergebnisse weiter zusammen schieben, was noch weniger für eine grundlegende Bandbreitenlimitierung spricht.

Wir haben bereits Ergebnisse in der Größenordnung von 30% zwischen DDR3-1333 und DDR3-1866. Klarer kann man ein Bandbreitenlimit nicht aufzeigen. Es ist auch vollkommen unklar, warum du diese Problematik so krampfhaft abzustreiten versuchst. Die IGp-Performance ist doch dennoch ordentlich.

FM4E · 17.06.2011

Unterlasst mal bitte diese ständigen Sticheleien und bleibt sachlich.

mr.dude · 17.06.2011

Undertaker 1 schrieb:
Zwei Punkte: Zum einen erhöht eine niedrigere Speicherlatenz die Effizienz, d.h. auch die Bandbreite steigt, Größenordnung etwa 5%.

Nee, Bandbreite ist Bandbreite. Und die wird nur durch Takt und Datenbreite des Speicherinterfaces bestimmt. Aber schon klar, um Ausreden bist du nie verlegen. :haha:

Was übrigens trotzdem nichts an deiner Behauptung ändert, dass Latenzen praktisch irrelevant sind und nur Bandbreite zählt. Also entweder stehe dazu oder gib zu, dass deine Behauptung damals falsch war.

Undertaker 1 schrieb:
Weiterhin haben wir es mit teilweisen CPU-Limits zu tun - und die CPU-Leistung wird durchaus von der Speicherlatenz beeinflusst.

Ich dachte, es ging um die GPU? Jetzt doch plötzlich wieder CPU? Du kannst dich auch nicht entscheiden, oder?

Undertaker 1 schrieb:
Wir haben bereits Ergebnisse in der Größenordnung von 30% zwischen DDR3-1333 und DDR3-1866.

Die Grafik zeigt im Schnitt lediglich 20%. Wenn nach euren Aussagen die Latenz solchen Einfluss hat, dann noch weniger. Bei 40% mehr Bandbreite kein wirkliches Bandbreitenlimit. Schon seltsam, warum du ständig irgendwas heraufbeschwören willst, was gar nicht existiert. Was bezweckst du damit?

Undertaker 1 · 17.06.2011

mr.dude schrieb:
Nee, Bandbreite ist Bandbreite. Und die wird nur durch Takt und Datenbreite des Speicherinterfaces bestimmt.

Theoretisch korrekt. Praktisch, das lässt sich leicht nachmessen, steigt die Bandbreite bei niedrigeren Latenzen wenig, aber reproduzierbar an. Die Größenordnung nannte ich.

mr.dude schrieb:
Ich dachte, es ging um die GPU? Jetzt doch plötzlich wieder CPU?

Die Grafik zeigt im Schnitt lediglich 20%. Wenn nach euren Aussagen die Latenz solchen Einfluss hat, dann noch weniger. Bei 40% mehr Bandbreite kein wirkliches Bandbreitenlimit.

Fast hast du es, jetzt nur noch 1 und 1 zusammenzählen.

Wir haben mehrere Benchmarks, die teils CPU-limitiert sind. Wir haben verschiedene Speicherlatenzen, die ihren Einfluss auf die (L3-lose!) CPU haben. Und nun haben wir, oh Wunder, im Schnitt noch 20% Differenz... Na?

Ob wir nun 20% oder 30% Zugewinn haben: Für die prinzipielle Fragestellung ist das relativ egal. Im CPU-Bereich sehen wir was passiert, wenn wir praktisch keinerlei Bandbreitenlimitierung haben: Bis auf die speicherlastigen Packprogramme macht die Nutzung von 1, 2 (oder 3) Speicherkanälen einen Leistungsunterschied von <5%. <5% bei bis zu 3-facher Bandbreite. Oder ein Beispiel aus der GPU-Welt: Bei gleichem GPU-Takt lagen HD4850 und HD4870 trotz 80% mehr Bandbreite letzterer unter 10-15% auseinander.

Jetzt haben wir, CiV und SC2 ausgenommen, bei 40% mehr Bandbreite knapp 25% Mehrleistung, teils auch um die 30% - und da können wir Restlimits der CPU noch nichteinmal ausschließen. Ja, das ist mehr als ein klares Speicherlimit. So what, ist trotzdem die schnellste IGP. Ich glaube du bist der einzige Mensch im ganzen Netz, der das leugnet. Dabei noch viel Spaß, ich bin raus.

Nimrais · 17.06.2011

Ich möchte das speicherthema nicht noch weiter anheizen, aber ich hab mal ddr3 mit gddr3 (ddr2) verglichen. Das ganze ist ja ein witz. Und alles nicht wegen Takt sondern speicheranbindung. 256bit vs 64bit. Ist der controller wirklich soo teuer, dass es sich nicht rentiert? Oder kann man dimms nicht mit breiterem si ansprechen? Weshalb nicht 4 bänke mit quadchannel? Oder gleich festverlöteter ram. Muss ja nicht viel sein und in nb's sogar noch platzsparend... wie sieht es später mit ddr4 aus? Steigen da die geschwindigkeiten stark an? Sry schreibe mit dem handy deswegen die schreibweise...

Undertaker 1 · 17.06.2011

Der Preis ist schon der Hauptgrund. Die Mehrkosten entstehen dabei gleich an mehreren Stellen: Zusätzliche Deifläche für den größeren Speichercontroller, zusätzliche Pins, aufwändigere Boards mit mehr Layern - das geht in der Summe richtig ins Geld, zumindest im angepeilten Preisbereich Llanos ist soetwas schlicht nicht realisierbar - auch wenn es deutlich Mehrleistung brächte.

Balzon · 17.06.2011

Von dem Latenzvorteil profitiert CPU+GPU bei Llano, logisch. Das kann durchaus ein paar Prozent ausmachen, was in so einer Rechnung eine große Gewichtung hätte. Die Beweiskraft liegt hier jedoch bei demjenigen, der trotz dieser Unstimmigkeit die Folie erstmalig ins Spiel brachte. Schauen wir uns die Speicherpreislisten an. Es hat sich CL9 für DDR3-1600 und DDR3-1866 durchgesetzt. Diese Timings sind die praxisnähsten. Man könnte höchstens noch CL8/CL9 oder CL9/CL10 durchgehen lassen, CL7/CL9 geht auf keinen Fall.

Schauen wir uns ein paar der wenigen verwertbaren Benchmarks an wo sich die CPU Limitierung im Rahmen halten dürfte.

Metro 2033
1333= 19,5
1600= +15,4 von 1333
1866= +8,9% von 1600

15,4% Anstieg nur bei knapp 21% mehr Bandbreite. Klingelt es langsam? Eine perfekte Skalierung gibt es nur selten. Also wird es von 1600 auf 1866 eben nicht besser aussehen. Zur Erinnerung, der Bandbreitenanstieg von 1600 auf 1866 liegt 4,4% geringer. Diese 6,5% Differenz bei geringeren Bandbreitenanstieg und trotz Latenzungleichgewichts sind richtig gut. Das ist eindeutig der Beleg für die starke Bandbreitenabhängigkeit. Genauso sieht es in Mass Effect 2 aus und kaum anders in Hawx. Starcraft wird völlig CPU limitiert sein, Dirt 2 und Civ 5 sind auch bekannt für die starke CPU Abhängigkeit. Da kann man selbst mit Sandy Bridge und HD3000 eine nahezu 100 prozentige CPU Limitierung erreichen wenn mans drauf anlegt (Benchmark Units). Das ist einfach unbrauchbar. Ja selbst Crysis wird gerne unterschätzt. 1-2 fps hin oder her durch eine kleine Limitierung kann das Skalierungsergebnis stark verfälschen.

Balzon · 18.06.2011

mr.dude schrieb:
Wobei ich glaube, die Latenzen hat sich Mirko nur aus den Fingern gesaugt.

Könntest du es unterlassen mich mit fremden usern zu verwechseln?

Dann solltest du mal im Twitter nachschauen, dort hat Theo Valich schon nach den Timings gefragt. Und wieso erkundigst du dich nicht selber nach den Timings wenn es dir so sehr an der Folie gelegen ist? Das wäre dein erstes Opfer gewesen. Bis jetzt hat mir Anand immer geantwortet.

http://www.abload.de/img/beweisfy6b.png

Die Folie ist nicht nur ein Teaser auf Twitter, die wurde auch im Forum des Artikels verlinkt.

mr.dude · 18.06.2011

Ich hatte bereits gefragt, woher die Latenzen stammen. Wenn du es nicht für nötig hältst darauf zu antworten, muss ich davon ausgehen, dass du dir das nur ausgedacht hast. Auf Twitter stand jedenfalls nichts. Und welcher Artikel? Das Desktop Review ist, wie ich bereits sagte, noch gar nicht online.

Balzon · 18.06.2011

Ich zitiere Anands Twitter vom 15. Juni.

@theovalich same latency at 1333 & 1600, 1866 pushes CL up to 9 - 10% higher latency

@theovalich agreed, the memory i was using wouldn't do CL7 at 1866 but i will have some in house this week that will

Zur endgültigen Absicherung habe ich ihn daraufhin angefragt, worauf er CL7 für 1333/1600 und CL9 für 1866 bestätigte.

mr.dude schrieb:
Und welcher Artikel?

Der bereits verlinkte A8-3850 Artikel. Ich zitiere Anand aus den Comments dieses Artikels:

Here's some additional data to tide you over

http://images.anandtech.com/reviews/cpu/amd/llano/review/desktop/ddr3scaling-16x10.png

mr.dude · 18.06.2011

Balzon schrieb:
Der bereits verlinkte A8-3850 Artikel.

Das ist aber nicht der Artikel, aus dem die Folie entspringt. Denn wie gesagt, dieser Artikel ist noch gar nicht online.

Balzon · 18.06.2011

mr.dude schrieb:
Das ist aber nicht der Artikel, aus dem die Folie entspringt. Denn wie gesagt, dieser Artikel ist noch gar nicht online.

Das ist klar. Es ging darum, dass die Folie nicht nur vom Twitter Account den Ursprung nahm.

aden · 19.06.2011

Konnte die ersten Llano Modelle bei Onlineshops ausfindig machen.
Der A8-3850 kostet demnach zwischen 125-135 €.
Angeblich sind die Teile ab 28.6.2011 verfügbar.
mfg

mr.dude · 26.06.2011

Da es keinen expliziten Thread für Bobcat gibt, poste ich es einfach mal hier, da es im Wesentlichen auch zu AMD Fusion gehört.

Im XS hat der User mAJORD einen Architekturvergleich zwischen K8, K10 und Bobcat gemacht. Der Testparcours ist sicherlich begrenzt, gibt aber zumindest einige Anhaltspunkte.

Bobcat Core performance analysis - Bobcat vs K10 vs K8

Sehr interessant, wie flott Bobcat bei Integer unterwegs ist, trotz lediglich 2-fach superskalarer Pipeline. Bei FP-lastigen Anwendungen fällt Bobcat dann erwartungsgemäss ab aufgrund der auf Verbrauch getrimmten schwachbrüstigen FPU, speziell gegenüber K10.

che new · 27.06.2011

Quad-Core Llano@4,35GHz^^

Edit: A8-3800 müsste die 65W TDP Version mit 2,4GHz (Turbo 2,7GHz) sein, es wird zum Übertakten auch der 27er Multi verwendet.

Quelle: MSI Global ? News

Roldhak · 27.06.2011

hmm... nehm ich!

Duplex · 27.06.2011

Da Llano in 32nm gefertigt wird erwarte ich bis zu 4,6Ghz OC Potential gegenüber einen Deneb in 45nm.

che new · 27.06.2011

Naja so einfach ist die Gleichung (32nm > 45nm) aber nicht Duplex, wenn die Desktop-Llano DIEs die selben Core-Steppings besitzen und die gleichen Transistoren zum Einsatz kommen wie bei den Mobile-Llanos, dann sind die DIEs auf möglichst niedrigem Stromverbrauch bei moderaten Taktraten ausgelegt. Die werden im oberen Bereich relativ schnell ineffizient oder limitieren.

Falls aber wie in der Vergangenheit (z.B. bei den K8 CPUs) auch Desktop Core-Steppings zum Einsatz kommen, die im unteren Bereich etwas höhere Spannungen benötigen aber spürbar höher takten können, dann sollten es kein Problem sein. Fragt sich nur ob AMD bereits ab den ersten Chargen verschiedene Core-Steppings ausliefert, denn sein wir mal ehrlich 2,9GHz beim 100W TDP Top-Modell ist jetzt nicht sooo prickelnd (auch wenn die GPU davon vielleicht 20-30W TDP für sich beansprucht).

mr.dude · 27.06.2011

Wäre mal interessant zu wissen, ob die angezeigte Spannung korrekt ist. Etwa 1,15 V bei fast 4,4 GHz wäre zumindest super. Diese Spannung braucht mein X2 240 für seine lediglich 2,8 GHz.

y33H@ · 27.06.2011

Die Spannung stimmt nicht, Auslesefehler - tritt beim Takt auch gerne auf und freier Multi (der tatsächlich auch umgesetzt wird) wäre ebenfalls sehr überraschend

Also diesen Wert bitte mit Vorsicht behandeln .

aden · 27.06.2011

der multi passt doch für nen 3800er, oder ? 27x100=2700 mhz.
wenn das teil wirklich so geht läuft mirs wasser im mund zusammen ^^ frage mich aber was der bei den einstellungen an strom verbrät.
mfg

che new · 27.06.2011

Die Spannung kann schon stimmen, solche Werte sind z.B. aufgrund von Clock Gating möglich (wobei die CPU dann allerdings intern deutlich heruntertaktet). Beim Zacate gibt es ähnliche Beobachtungen:

Idle P2 State -> 800MHz@1,000V
Idle P0 State -> 1600MHz@1,300V

Wenn Cool and Quiet jedoch deaktiviert wird, läuft die CPU laut CPU-Z mit 1600MHz@1,000V im Idle. Natürlich muss sie dabei dennoch intern heruntertakten (Clock Gating), denn die CPU schafft die vollumfänglichen 1600MHz nur mit minimal 1,175V (eigenen Tests).

Die Llano-CPU wird wohl mindestens etwas über 1,3V für 4,35GHz benötigen: Link

y33H@ · 27.06.2011

Llano wird mehr als 1,3V für den Standardtakt (!) benötigen - das sah man man an der VID bei den BIOS-Bildern, die iirc Coolaler oder OBR gezeigt hatten. Muss suchen ...

mr.dude · 27.06.2011

@che new

Ok, das wäre natürlich eine plausible Erklärung. Etwas über 1,3 V wäre aber immer noch gut für diesen Takt. Zumindest ein deutlicher Schritt nach vorne gegenüber den 45 nm Modellen. Das lässt für den 32 nm Prozess und Bulldozer hoffen.

@y33H@

Womit ein Prozessor ab Werk ausgeliefert wird und was OC/UV betrifft, sind doch zwei verschiedene Paar Schuhe. Mein X2 240 wird zB mit 1,4 V VID ausgeliefert, läuft seit 2 Jahren aber völlig stabil mit 1,15 V.

che new · 27.06.2011

@y33H@
Ich schrieb ja auch mindestens, was so viel wie keines Falls darunter bedeutet. Und was ist für dich Standardtakt? Dass selbst ein 65W TDP-Modell mit 2,4GHz mehr als 1,3V benötigt bezweifle ich mal. Das wäre doch lächerlich, 32nm HKMG sollte die Spannung gegenüber 45nm eher senken als erhöhen.

y33H@ · 27.06.2011

mr.dude schrieb:
Womit ein Prozessor ab Werk ausgeliefert wird und was OC/UV betrifft, sind doch zwei verschiedene Paar Schuhe. Mein X2 240 wird zB mit 1,4 V VID ausgeliefert, läuft seit 2 Jahren aber völlig stabil mit 1,15 V.

Wenn du deine CPU außerhalb ihrer Specs betreibst, ist das deine Sache. AMD liefert den A8-3850 mit einer VID von rund 1,4 Volt für den Standardtakt aus - klar geht idR weniger, aber der Hersteller gibt diesen Wert (inkl. Sicherheitspuffer) nun mal vor :rolleyes:

che new schrieb:
Und was ist für dich Standardtakt?

2,9 GHz für den A8-3850.

BYTE64 · 27.06.2011

Dieser A8-3800 hat ja mal richtig Power...nicht schlecht! :drool:

che new · 27.06.2011

@y33H@

Bevor wir wieder aneinander vorbeireden und eine Diskussion vom Zaun brechen, einige wir uns doch bitte auf folgende Punkte:

1. Es geht bei Coolaler um einen A8-3800 mit 2,4GHz Standardtakt, der vermutlich mit ~1,15V Vcore läuft (wenn Clock Gating greift mit ~1,00V im Idle): Link

2. Coolaler betreibt die CPU nicht nach Herstellerspezifikationen, es liegt nahe dass er nur so viel Vcore draufgelegt habe wird wie nötig.

y33H@ · 27.06.2011

Gut, dann liefere ich was anderes - ich möchte ja kein NDA brechen :coolblue:

http://www.youtube.com/watch?v=0kGwrqSntFs

1,47 Volt für 3,4 GHz - das ist realistisch, ausgehend von einer VID um die 1,4 Volt für den A8-3850.

[Sammelthread] AMD Fusion "Llano" APU-2011 (K10 Cores & VLIW5 GPU) A4 / A6 / A8 Series

Urgestein

Enthusiast

Redakteur

Urgestein

Enthusiast

Enthusiast

Enthusiast

Enthusiast

Enthusiast

Urgestein

Enthusiast

Urgestein

Enthusiast

Enthusiast

Urgestein

Enthusiast

Enthusiast

Urgestein

Enthusiast

Urgestein

Enthusiast

Enthusiast

Enthusiast

Enthusiast

Urgestein

Enthusiast

Enthusiast

01010101

Enthusiast

Enthusiast