[Sammelthread] AMD Bulldozer "New CPU Architecture" Sockel 942 AM3+ Sammelthread [Part 2]

Status
Für weitere Antworten geschlossen.
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Man kann die 80% auch so verstehen. In Dual Core Anwendungen ist ein BD Modul nur 80% so schnell wie ein regulärer BD Dual Core. Aber in Single Thread Anwendungen stehen dem einen Core in dem Modul alle Ressourcen zur Verfügung und somit wäre die Single Leistung bei 100%.

Ich sehe nur Schätzungen positive oder negative. Würde praktisch für ein 2 Modul Bulldozer mit möglichen 4 Thread aber nur der Nutzung von 2 Thread 200% bedeuten. Für 4 Threads würde es dann nach der Rechnung nur 160% bedeuten.
Aber kann man so die Rechnung machen? Zumal dies ja nur theoretisch ist. Wir wissen ja das es praktisch keine 100% gibt.
 
Zuletzt bearbeitet:
Wenn das für dich flamen ist, muss ich dazu gleich wieder fragen, warum man dich nach über 22000 Beiträge auf CB gebannt hat.
Weil ich so Leuten wir dir, Snoopy, oder mr.dude oder Schaffe89 ständig argumentatives Contra gegeben, Fakten und Aussagen richtig gestellt und damit Threads teils Offtopic geführt habe. Und über die Jahre hinweg sammelt sich das eben *Schulter zuck* Dafür bin ich im Gegensatz zu den beiden anderen, die auf persönlicher Ebene diffamierend und oft auch beleidigend vorgehen, nie ausfallend geworden und daher auch nicht lifetime-banned.
Deine 30% höre ich heute zum ersten mal. Gestern waren es noch 25%.
Gestern wie heute waren es 20 bis 30%, nur dass ich heute nur den höheren Wert benannt habe.
Man kann die 80% auch so verstehen. In Dual Core Anwendungen ist ein BD Modul nur so schnell wie ein regulärer BD Dual Core. Aber in Single Thread Anwendungen stehen dem einen Core in dem Modul alle Ressourcen zur Verfügung und somit wäre die Single Leistung bei 100%.
Nein, denn es gilt:

Multithreading: Modul-BD = 80% eines fiktiven Dualcore-BD
Singlethread: Modul-BD = 100% eines fiktiven Dualcore-BD

Wie oft muss ich die Aussage von JF noch verlinken?!
Jungs unterlasst es doch jedes mal die gleiche Diskussion los zu treten, dass bringt hier niemanden weiter.
So sei es ...
 
Zuletzt bearbeitet:
Undertaker 1, ich habe die 80% vergessen zu schreiben.
In Dual Core Anwendungen ist ein BD Modul nur 80% so schnell wie ein regulärer BD Dual Core.
Habe es nachgereicht.

y33H@
Du behauptest also auch, dass ich der Snoopy sei. Du und auch andere scheinen ein Trauma zu haben. Aber gut, dagegen kann ich nicht machen. Dann wirst du eben für mich entweder dick oder doof sein, also entweder Stan Laurel oder Oliver Hardy. Dann können wir uns ja weiterhin auf den Geist gehen.
 
Zuletzt bearbeitet:
Multithreading: Modul-BD = 80% eines fiktiven Dualcore-BD
Singlethread: Modul-BD = 100% eines fiktiven Dualcore-BD

Nichts anderes schreibe ich doch auch. Nur können wir daraus nicht ableiten um wie viel schneller nun Bulldozer wird.

Es kann keiner plausibel erklären wie man die Leistung einordnen kann. Es sind nur Schätzungen die sich auf dem Niveau von positiver Schätzung oder negativ Schätzung bewegen.

Diese Einordnung der Leistung beider Lager zieht durch den ganzen Thread.
Wir können praktisch nur gegenseitig unsere Einschätzungen besprechen und da geht es richtig hart zur Sache :).
 
Erneut die Frage, woher die 160% aus der Antwort auf Duplex stammen...
mr.dude sagt, der zweite Int-Core bringe +80%. Korrekt aber ist, ein Modul erreicht 80% eines (fiktiven) BD-Dualcores (siehe JF!). Vermutlich hat mal jemand dann 80% mal zwei gerechnet und kam auf 160%. Damit würden zwei Module (vier Int-Cores) 160 Prozent der Leistung eines (fiktiven) BD-Dualcores (= 200%) erreichen. So kann man allerdings nicht rechnen, da hier u.a. der L3-Cache nicht mit einbezogen wird.
 
Zuletzt bearbeitet:
Damit würden zwei Module (vier Int-Cores) 60 Prozent der Leistung eines (fiktiven) BD-Quadcores erreichen.

Dem kann ich nicht folgen. :confused: Ausgehend davon, dass ein Modul 80% der Leistung eines Dualcores bringt, "echte" Kerne sowie mehrere Module aber zu 100% skalieren ergibt sich für mich folgendes Bild:

Singlecore: 100%
Modul: 160%
Dualcore: 200%
2 Module: 320%
Quadcore: 400%

-> Zwei Module leisten also ebenso 80% eines hypothetischen "echten" Quadcores.

Alternativ die letztlich identische Rechnung auf Basis eines Dualcores wie bei JF:

Modul: 80%
Dualcore: 100%
2 Module: 160%
Quadcore: 200%
 
Multithreading: Modul-BD = 80% eines fiktiven Dualcore-BD
Singlethread: Modul-BD = 100% eines fiktiven Dualcore-BD

Eine dumme Frage: müsste die Singlethread Leistung nicht über 100% eines fiktiven Dualcore-BD liegen? Weil sich das Modul bei nur einem Thread dann - wenn ich mich nicht irre - zu einem einzelnen Super-Kern zusammenschließen kann und damit irgendwie beide Sub-Module an dem Thread arbeiten.
 
Soweit ich das verstanden habe, kann dann nur die FPU exklusiv verwendet werden. Bei nur einem Thread ist auch nur einer der Integercores aktiv. Ein Vorteil könnte bei einem solchen Szenario noch der Turbo werden, aber da muss man erstmal abwarten wie der funktioniert.
mr.dude sagt, der zweite Int-Core bringe +80%. Korrekt aber ist, ein Modul erreicht 80% eines (fiktiven) BD-Dualcores (siehe JF!). Vermutlich hat mal jemand dann 80% mal zwei gerechnet und kam auf 160%. Damit würden zwei Module (vier Int-Cores) 160 Prozent der Leistung eines (fiktiven) BD-Dualcores (= 200%) erreichen. So kann man allerdings nicht rechnen, da hier u.a. der L3-Cache nicht mit einbezogen wird.
Abgesehen vom L3-Cache müsste die Aussage von Duplex demnach auf "Bulldozer 4 Module x 1.6 = 6.4" korrigiert werden...jetzt versteh ich auch, wo die 160% herkommen, danke.
 
Also wir nehmen Linux und klammern Spiele aus? Damit schießt du an der Zielgruppe, die hier schreibt und liest, meilenweit vorbei.
Es geht hier nicht um Zielgruppen, falls dir das noch nicht aufgefallen sein sollte. Der Threadtitel lautet "Next Generation new CPU Architecture". Und genau darum geht es, um die Bulldozer Architektur. Oder willst du behaupten, Bulldozers Erfolg würde einzig und allein von Spielen abhängen? :stupid:

Die +50% unter Windows und inklusive Spielen von Deneb auf SB kannst du ergo nach wie vor nicht widerlegen
Muss ich auch gar nicht, das sie nirgendwo belegt sind. Selbst bei CB, die ja nicht gerade pro AMD testen, liegt der i7-2600K 4C/4T 3,4 GHz + Turbo im Schnitt gerade mal 31% vor dem X4 970 3,5 GHz in Spielen. Also bitte, spare dir diese Versuche und bleibe bei Anwendungen, die wirklich nur auf die CPU gehen. Auch wenn dir das als PCGH'ler schwer fallen mag. Oder weise erstmal deine 50% Behauptung nach. Und dazu gehören nicht nur Diagramme mit bunten FPS-Balken, sondern AUSLASTUNGSNACHWEISE (!). Das ist das Hauptproblem. Ansonsten sind solche CPU-Vergleiche wertlos.


Das heist also ein CMT Kern eines Moduls bei gleichem Takt und ohne Turbo bringt grob 80% eines herkömmlichen Phenom II Kerns in der Vollausstattung inkl. L3 Cache?
Nicht ganz. Multithreading Technologien wie CMP oder CMT muss man immer in Verbindung mit mehreren logischen Prozessoren / Threads betrachten. Oder bezogen auf Bulldozer, hätte dieser exakt die gleiche Architektur wie K10.5, würde ein Bulldozer Modul bei gleichem Takt 80% der Performance eines Phenom II Dual-Core liefern.


Ich dachte immer von so einem Modul bringt ein Kern 100% Leistung und der zweite, weil er kein echter Kern ist, ca. 80% Leistung.
Der erste Kern ist genauso "echt/unecht" wie der zweite Kern, da sie die gleichen dedizierten und gemeinsam genutzten Ressourcen besitzen. Ansonsten, ja, der zweite Kern soll einen Speedup von 80% bringen.

Dann müsste ein Modul 1,8 rechnerische Kerne haben und vier Module entsprächen 7,2 rechnerischen Kernen - wobei jeweils noch unbekannt ist, wie schnell so ein rechnerischer Kern ist.

Wenn jetzt ein Modul aber nur 2x 80% liefern würde, dann wären das ja nur 6,4 rechnerische Kerne. Dann müsste so ein 4 Modul BD aber gewaltig pro Kern und Takt Gas geben, um sich überhaupt deutlich von einem X6 abzusetzen.
Nochmal, CMT und CMP Kerne darf man nicht auf diese Weise durcheinanderwürfeln. Der Faktor 1,8 eines Moduls hat keinerlei Beziehung zu den Kernen eines aktuellen X2/X4/X6.


Nope, JF sagt 80% und nicht 90%, ergo müsste man mit 160% rechnen
Weder 90% noch 160% wurden bisher offiziell genannt. Aber wie gesagt, beide Angaben haben eine verschiedene Basis. Deshalb kann man sie nicht vergleichen.

Davon, dass der 2te Int-Core die Leistung um 80% steigert, sagt JF nichts.
Doch, tut er. Es wurde hier auch schon öfters verlinkt. Warum erzählst du immer wieder die gleichen Märchen? Wenn ich dir nochmal ein Zitat zeige, versprichst du mir dann, diese falschen Behauptungen in Zukunft zu unterlassen?


Man kann aber auch die 80% so verstehen. Ein BD Modul bringt 80% der Leistung, als ein normalerweise Dual Prozessor einer BD Architektur.
Exakt. Hier nochmal die offiziellen Folien dazu:




Oben ein CMP Dual-Core mit 2 logischen Prozessoren, unten ein Bulldozer Modul (CMT) mit 2 logischen Prozessoren.
Estimated average of 80% of the CMP performance ...

Das hat aber NICHTS mit dem Speedup von einem Kern eines Moduls auf 2 Kerne eines Moduls zu tun.


mr.dude sagt, der zweite Int-Core bringe +80%. Korrekt aber ist, ein Modul erreicht 80% eines (fiktiven) BD-Dualcores
Beides ist korrekt. Ich kann nur nochmal darauf hinweisen, bringt das nicht durcheinander. Das sind zwei verschiedene Baustellen.
 
Zuletzt bearbeitet:
Irgendwie verwirrt mich das ganze mit dem gerechne...
Jetzt mal Klartext.

Ich habe ein Modul mit zwei Kernen. Nutze ich allein einen der beiden Kerne erreiche ich 100%, richtig?
Nutze ich hingegen zwei Kerne des selben Moduls erreiche ich 160%?
Ein "echter" Dualcore als fiktives BD Modul würde hingegen 200% erreichen? Quasi das, wenn man von zwei Modulen nur jeweils einen Kern nutzen würde?
Sachen wie Turbo mal ausgeklammert... Und alles bei gleichem Takt?

Also kurz zusammengefasst:
1 Modul, ein Kern = 100%
1 Modul, zwei Kerne = 160%
2 Module, je ein Kern = 200%
2 Module, zwei Kerne = 320%

Richtig so?

Also ich habe jetzt mal kurz die Preise für die 6-Kern CPUs für Dual-CPU Systeme auf Basis des Gulftown und Istanbul angeschaut und da liegt AMDs Topmodel deutlich unter dem "billigsten" von Intel...

Wo hast du da geschaut?
Wenn ich mir anschaue, bei geizhals (unabhängig ob lieferbar oder nicht) schlagen die Sockel-F Istanbul Modelle mit 2,6GHz mit um die 930€ zu Buche.
Für den C32 hingegen nur mit um die 300€ (2,8GHz) und 200€ (2,6GHz)
Für den G34 als Magny Cours schon wieder mit 960€ (2,6GHz, 8 Cores) und 1220€ (2,3GHz, 12 Cores)

Intel dürfte Leistungstechnisch je nach Anwendung mit den aktuellen 32nm Quad/Hexacores aber gut eine Ecke drüber liegen. (die großen Modelle)
Und wenn nicht alle Cores ausgelastet werden können, trumpft Intel ebenso mit der besseren Pro Core Leistung auf.

Ich wünsche mir hier daher bei AMD einen deutlichen Leistungsanstieg, wie auch immer der aussehen mag ;)
Für mich muss das gesamt Paket stimmen, also sowohl die Multithreaded Leistung als auch die Leistung bei Anwendungen, die weniger was mit vielen Cores anfangen kann. Stand heute sehe ich hier Intel klar vorn. Für mich lohnt der Umstieg aktuell aber nach wie vor nicht. Die Nehalem Quads/Hexacores bieten so viel Mehrleistung pro Core bei den gegeben Taktraten nicht zu meiner "alten" Kiste. Die hochgetakteten Modelle sind zwar eine Ecke weit vorn, dafür aber mit extremen Preisen von 1000€+ pro CPU nicht wirklich bezahlbar. Sandy Bridge hingegen bringt schon was mehr. Gibt es aber nicht im Dual CPU Bereich.
Ich warte also gespannt wie sich das ganze über das Jahr entwickelt um dann irgendwann zuzuschlagen.

Kurze Zwischenfrage, warum sind die C32 Lisbon CPUs so extrem günstig im Vergleich zu Sockel-F und G34 Modellen? Da muss doch ein Haken dran sein!?
 
Irgendwie verwirrt mich das ganze mit dem gerechne...
Jetzt mal Klartext.

Ich habe ein Modul mit zwei Kernen. Nutze ich allein einen der beiden Kerne erreiche ich 100%, richtig?
Nutze ich hingegen zwei Kerne des selben Moduls erreiche ich 160%?
Nein, 180%.

Ein "echter" Dualcore als fiktives BD Modul würde hingegen 200% erreichen?
Also entweder "echter" Dual-Core (CMP) oder Bulldozer Modul (CMT). Beides gleichzeitig geht nicht.

Also kurz zusammengefasst:
1 Modul, ein Kern = 100%
1 Modul, zwei Kerne = 160%
2 Module, je ein Kern = 200%
2 Module, zwei Kerne = 320%

Richtig so?
Nope.

1 Modul, ein Kern = 100%
1 Modul, zwei Kerne = 180%
2 Module, je ein Kern = 200%
2 Module, zwei Kerne = 360%

Zumindest sagt das AMD. Ob es wirklich so ist, können letztendlich nur Tests zeigen.
 
Zuletzt bearbeitet:
Also entweder "echter" Dual-Core (CMP) oder Bulldozer Modul (CMT). Beides gleichzeitig geht nicht.

schon klar, deswegen schrieb ich ja dahinter, bei zwei Modulen nur jeweils einen Kern genutzt.

Nope.

1 Modul, ein Kern = 100%
1 Modul, zwei Kerne = 180%
2 Module, je ein Kern = 200%
2 Module, zwei Kerne = 360%

Zumindest sagt das AMD. Ob es wirklich so ist, können letztendlich nur Tests zeigen.

Alles klar, jetzt wird es klarer...
Ob es wirklich so kommt, steht ja immer vorher in den Sternen. Ich denke mal man wird den Wert sicher im Schnitt nicht ganz schaffen. Aber selbst wenn man nur annähernd diese Werte erreichen würde, wäre das denke ich für Multithreading schon ein guter Performance Schub. Bleibt halt abzuwarten wie sich das BD vier Modul Gesann im Vergleich zu einem aktuelle Quad schlagen wird. (wenn einerseits genau vier Cores ausgelastet sind, und andererseits alle acht)
 
http://blogs.amd.com/work/2010/08/30/bulldozer-20-questions-–-part-2/

Manche sollten doch nochmal in die Originalquelle schauen. ;)

"Compared to CMP (chip multiprocessing – which is, in simplistic terms building a multicore chip with each core having its own dedicated resources) two integer cores in a Bulldozer module would deliver roughly 80% of the throughput."

Ein Modul erreicht 80% eines hypothetischen Dualcores (=100%). Wieviel ein einzelner Kern eines Moduls in Relation dazu leistet, wurde bisher nicht gesagt.
 
1 Modul, ein Kern = 100%
1 Modul, zwei Kerne = 180%
2 Module, je ein Kern = 200%
2 Module, zwei Kerne = 360%

Zumindest sagt das AMD. Ob es wirklich so ist, können letztendlich nur Tests zeigen.

Nein und nochmals nein! Siehe zum gefühlten 317ten Mal die Aussage von JF im Bulldozer-Blog, die auch Undertaker gerade mal wieder zitiert hat. Wo der 2te Int-Core laut JF (!) +80% bringt? Das verlinkst du mir bitte. Ich bin gespannt.
 
Zuletzt bearbeitet:
Nein und nochmals nein! Siehe zum gefühlten 317ten Mal die Aussage von JF im Bulldozer-Blog, die auch Undertaker gerade mal wieder zitiert hat. Wo der 2te Int-Core laut JF (!) +80% bringt? Das verlinkst du mir bitte. Ich bin gespannt.

Aiming for the Sweet Spot in 2010 and Beyond | Business Blog

The Bulldozer architecture can provide up to 80% greater expected throughput when running 2 threads simultaneously compared to a single thread running on a single integer core.

sind 180%
 
Was bitte bringt die ganze % Rechnerei wenn keiner die Ausgangsbasis kennt?
Über sowas braucht man echt nicht lange streiten....
 
Aiming for the Sweet Spot in 2010 and Beyond | Business Blog

The Bulldozer architecture can provide up to 80% greater expected throughput when running 2 threads simultaneously compared to a single thread running on a single integer core.

sind 180%

"up to" ist hier wohl das Zauberwort. Einmal geht es um Höchstwerte, einmal wohl um den durchschnittlichen Fall. Zudem: Diese Quelle ist weit über ein Jahr alt - da gab es noch lange kein lauffähiges Silizium.
 
Schon bekannt?
Erste "richtige" Performanceangaben.

Bulldozer to come close to Core i7

However, initial test scores that slipped to a hands of industry source are suggesting that Bulldozer should come really close to new Core i7 six-core CPUs. Bulldozer has both six and eight cores in the pipeline and they should be launching before the end of Q2 2011, at least that is the current schedule.

welchen neuen 6 Core i7 meinen die? den i7-990x oder ein möglichen 6 Core Sandy Bridge?

wenn das stimmen sollte wären das mind. 50% Leistungssteigerung gegenüber Thuban, Zambezi ist sogar geschätzt 25mm² kleiner als Thuban, damit wäre BD in Multithreading vor Sandy Bridge 4/8, bin schon gespannt was BD in Singlethread demonstrieren wird, Nehalem IPC mit Turbo könnte für SB auch reichen.
 
Was bitte bringt die ganze % Rechnerei wenn keiner die Ausgangsbasis kennt?
Über sowas braucht man echt nicht lange streiten....
Es ist halt der Versuch zu erklären wie BD als Modul funktionieren könnte. Allerdings ist es richtig was du sagt. Der Ausgangspunkt fehlt völlig und wir müssen weiter schätzen.
Wir bleiben leider unwissend bis zum Tag der Erscheinung :).
Eine Enttäuschung werde ich aber ganz sicher nicht erleben, selbst wenn BD nicht schneller wird als ein Pentium 1. Es wäre halt schade, weil es keinen Spaß machen würde Formel 1 zu schauen mit einem Auto.
Dann könnte man es sich auch sparen ein Hardwareforum zu besuchen. Auch würden die ganzen Diskussionen wegfallen. Weniger Klick würden generiert werden. Womöglich sogar die eine oder andere Hardware Seite aufgeben muss.
 
Zuletzt bearbeitet:
Wenn das stimmen sollte was PCGH zu der Fudzilla News schreibt ist das doch eher mager. Zumindest will PCGH wissen, dass es ein i7 970 oder i7 980 gewesen sein soll. Als Quelle wird aber Fud angegeben und da steht nichts darüber.
 
Nein und nochmals nein! Siehe zum gefühlten 317ten Mal die Aussage von JF im Bulldozer-Blog, die auch Undertaker gerade mal wieder zitiert hat. Wo der 2te Int-Core laut JF (!) +80% bringt? Das verlinkst du mir bitte. Ich bin gespannt.
SuperHans hat ja schon eine Quelle verlinkt. Hier eine weitere, die klar zeigt, woher diese Aussage stammt:
the word from our engineers is that adding a second integer core to each bulldozer module is ~5% silicon but nets ~80% performance uplift over a single integer core
Also höre endlich mit diesen Märchen auf. Natürlich hat JF von 80% Speedup durch den zweiten Kern gesprochen und nichts anderes. Du findest dazu auch noch viele weitere Beiträge von ihm auf AMDZone. ZB auch, dass die 160% nicht stimmen, siehe hier oder hier. Die CMT vs CMP Geschichte ist, wie gesagt, eine andere Baustelle. Dies werden wir sowieso nie nachprüfen können, da es eben keinen reinen CMP Bulldozer geben wird, den wir mit einem CMT Bulldozer vergleichen könnten. Wir werden nur den Speedup des zweiten Integer Kerns nachprüfen können. Dazu noch eine relativ aktuelle Aussage, die ebenfalls endeutet, dass der Speedup des zweiten Kerns recht hoch sein muss, was sich mehr nach 80+% als 60% anhört.
There are details that will come out after launch, I can't get into that now. But people obsessing on the idea that they have to run 2 threads on 2 seperate modules for better performance are actually missing a bigger picture, but I can't get into that here.
 
Die Quelle(n) wurde aufgezeigt, ich bin zufrieden :)
 
Status
Für weitere Antworten geschlossen.
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh