[Sammelthread] AMD Bulldozer "New CPU Architecture" Sockel 942 AM3+ Sammelthread [Part 2]

Status
Für weitere Antworten geschlossen.
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Das wäre vllt sogar das einfachste hier dem OS ähnlich Intel einen Kern und einen Thread pro Modul "vorzugaukeln"
Denn so setzt das OS ansich eigenständig die Berechnung vorrangig auf die Cores. Und wenn mehr Threads abzuarbeiten sind, als Cores unbelegt sind, so kommen die anderen Einheiten ins Spiel... Wäre sicher ne Überlegung.
Jetzt wie du es schreibst hört sich das sogar logisch an!
Ok, dann hätten wir 8 Fenster im Taskmanager, aber was ist mit dem Hyperthreaded Chip gemeint?
Auffällig bei dem Bild ist, dass nur eine Hälfte dargestellt wird, aber beide FPU Einheiten vorhanden sind und nur ein Pfeil auf die linke FPU zeigt.
Evt. werden 2 Threads pro Kern genutzt um die FPU besser auszulasten?

:wink:
 
Ernst gemeinte Frage, was ist im Bezug auf die Pro Core Leistung im Vergleich zu den aktuellen SandyBridge CPUs zu erwarten?

Ich meine ein BD mit vier Modulen/acht Kernen kann wohl seine stärke erst richtig ausspielen, wenn die Anwendung klasse mit diesen acht Kernen skalliert. Nur sehe ich hier aktuell nach wie vor extremen Nachholebedarf in Sachen Software.
Kann man davon ausgehen, das der BD hier einen extremen Sprung nach vorn macht und Sachen Pro Core Leistung die Sandys überbieten kann?
Ausgehen kann man davon nicht. Ich spekuliere aber darauf, dass Bulldozer auch pro Kern recht flott wird und seine Vorteile nicht nur beim Multithreading ausspielen wird.
Sandy Bridge liegt pro Takt etwa 20-30% von den "Stars" Kernen. Das sollte Bulldozer schon fast mit höherem Takt + verbessertem Turbo wettmachen können. Ich rechne hier mit Taktraten von klar über 4 GHz, wenn nur ein Kern eines Moduls ausgelastet wird. Dazu kommt, dass einem Thread dann ein "fettes" Frontend + 2x 128-bit FMACs zur Verfügung stehen, um auch pro Takt ordentlich was durch die Pipeline zu pusten.


Duplex, ja ich weiß. Man kann dies hier bestimmt 20 mal nachlesen, dass y33H@ sagt BD muss 50% IPC zulegen um mit Sandy gleich schnell zu sein. Ich sehe aber keine 50%.
Keine Sorge, im Schnitt und Befehlssatz bereinigt sind es auch keine 50%. Wie ich schon sagte, da liegen wir eher bei 20-30%, je nach Plattform.


Wobei 50% mehr bei ja allein durch die Coreanzahl schon drin sein müssten, sofern man hier 8Modul/16Core gegen 8Core Magny Cours vergleicht. Der 12Core Magny Cours bekommt ja mit 2,3GHz nochmal weniger Takt.
Oder steh ich auf dem Schlauch?
Vorsicht, Bulldozer ist ein neues Design -> CMT. Das kann man nicht oft genug erwähnen und lässt sich nicht so ohne weiteres mit einem herkömmlichen CMP Design vergleichen. Laut AMD liefert ein Bulldozer Modul (CMT Dual-Core) 80% des Durchsatzes eines CMP Dual-Core. Rechnen wir das mal auf Magny-Cours und Interlagos um, kommt man auf:

Magny-Cours = 600% (6*100%)
Interlagos = 640% (8*80%)

Trotz 33% mehr Kernen auf dem Papier für Interlagos, haben wir erstmal nur knapp 7% mehr Durchsatz pro CPU. Der Grossteil der 50% muss also woanders herkommen.
 
Ausgehen kann man davon nicht. Ich spekuliere aber darauf, dass Bulldozer auch pro Kern recht flott wird und seine Vorteile nicht nur beim Multithreading ausspielen wird.
Sandy Bridge liegt pro Takt etwa 20-30% von den "Stars" Kernen. Das sollte Bulldozer schon fast mit höherem Takt + verbessertem Turbo wettmachen können. Ich rechne hier mit Taktraten von klar über 4 GHz, wenn nur ein Kern eines Moduls ausgelastet wird. Dazu kommt, dass einem Thread dann ein "fettes" Frontend + 2x 128-bit FMACs zur Verfügung stehen, um auch pro Takt ordentlich was durch die Pipeline zu pusten.
Das klingt ja erstmal sehr vielversprechend...

Was meinst du, wird AMD diesen hohen Turbo auch bei den acht Modul CPUs ansetzen (können)
Ich mein die Magny Cours 12-Kerner sind ja mit 2,3GHz vergleichsweise niedrig getaktet.

Vorsicht, Bulldozer ist ein neues Design -> CMT. Das kann man nicht oft genug erwähnen und lässt sich nicht so ohne weiteres mit einem herkömmlichen CMP Design vergleichen. Laut AMD liefert ein Bulldozer Modul (CMT Dual-Core) 80% des Durchsatzes eines CMP Dual-Core. Rechnen wir das mal auf Magny-Cours und Interlagos um, kommt man auf:

Magny-Cours = 600% (6*100%)
Interlagos = 640% (8*80%)

Trotz 33% mehr Kernen auf dem Papier für Interlagos, haben wir erstmal nur knapp 7% mehr Durchsatz pro CPU. Der Grossteil der 50% muss also woanders herkommen.

OK, das war dann wohl ein Rechenfehler meinerseits. Ich ging davon aus, das der "zweite" Core in einem Modul bis 80% mehr Performance bringt.
Sprich 6x100% beim jetzigen K10 gegen 4x100%+4x80% beim BD. Was ja dann wohl so nicht stimmt.
Aber gut, ich bin gespannt, wie hoch AMD die Server CPUs takten kann. Ich hoffe doch man geht nicht zu knausrig mit dem Stromverbrauch um. Denn wie gesagt, gerade im HighPerformance Workstation Geschäft kursiert neben einiger stark Mehrkern-optimierter-Software auch genügend Zeugs, was nicht wirklich viel von mehr Kernen hält. Und hier wäre es sehr unvorteilhaft vllt sogar weniger Leistung zu erziehlen, als mit meinen popligen Woodcrest Xeons... ;)
 
Keine Sorge, im Schnitt und Befehlssatz bereinigt sind es auch keine 50%. Wie ich schon sagte, da liegen wir eher bei 20-30%, je nach Plattform.
Dem widersprechen die meisten Reviews. 20-30% liegt bereits der Lynnfield vor Deneb pro Takt und Kern, SB packt da noch mal gut 10% drauf. Siehe CB, PCGH, HT4U, THW, Anand etc.

Deine 20-30% musst du mal aufzeigen anhand von einem guten Dutzend Spielen und einem guten Dutzend Anwendungen. Unter Windows und ohne Grafiklimit. Viel Erfolg.
 
Zuletzt bearbeitet:
Also ich verstehe das Modul bei BD so.

Nehmen wir einen Pheom II X2. Würde man nun diesen nehmen und als Modul bauen, würde dann bei gleichem Takt in zB Cinebench das Modul nur noch 80 erreichen, während der nicht Modul 100 erreicht. Allerdings kommen jetzt die Fragezeichen. Ich denke nicht das so ein BD Modul im Vergleich zu einem Phenom II X2 in Cinebench 80 schafft, sondern mindestens 130.

y33H@ 20-30%. Gut dann nehmen wird 25% +15% Sandy sind 40%. Du sagt immer mindestens 50%
 
Zuletzt bearbeitet:
Also ich verstehe das Modul bei BD so.

Nehmen wir einen Pheom II X2. Würde man nun diesen nehmen und als Modul bauen, würde dann bei gleichem Takt in zB Cinebench das Modul nur noch 80 erreichen, während der nicht Modul 100 erreicht. Allerdings kommen jetzt die Fragezeichen. Ich denke nicht das so ein BD Modul im Vergleich zu einem Phenom II X2 in Cinebench 80 schafft, sondern mindestens 130.

Warum nicht?

Wenn man so will wäre ein Modul (mit zwei Cores) quasi ein SingleCore der alten Generation. Sprich man setzt alt Anzahl der Cores gegen neu Anzahl der Module.
Ein Quadcore Phenom II tritt also gegen einen vier Modul BD an.

Wie gesagt, immer unter der Vorraussetzung, das die Anwendung hier mitspielt.
Für Anwendungen die nicht mitspielen, so greift dann der hohe Turbo. Um dennoch gut mehr Performance Plus zu machen.
 
AMD zählt Kerne, also Phenom II X4 gegen Dual-Modul-BD. Hier +50% und AMD hat Sandy.
 
OK, das war dann wohl ein Rechenfehler meinerseits. Ich ging davon aus, das der "zweite" Core in einem Modul bis 80% mehr Performance bringt.
Ja, das tut er auch. Das ist allerdings eine andere Baustelle und sollte man nicht durcheinanderbringen.

1. CMT vs CMP = 80% vs 100%
2. 1 CMT Kern vs 2 CMT Kerne (im selben Modul) = 100% vs 180%

So lauten zumindest die bisherigen offiziellen Informationen.


Dem widersprechen die meisten Reviews.
Tatsächlich? Dann zeige mir mal ein Linux 64-bit Review, das deine Angaben bestätigt. Ich denke eher, du verwechselst mehrere Reviews des gleichen Szenarios mit einem wirklich umfassenden Vergleich über viele verschiedene Szenarios hinweg. Und ob ersteres nun von 2 oder 20 Reviews gezeigt wird, spielt keine Rolle. Deshalb stimmt deine Behauptung trotzdem nicht in einem pauschalen Kontext. Spiele sind hier übrigens immer noch irrelevant, da sie bei praxisnahen Settings in erster Linie von GPU und I/O anhängen. Also versuche erst gar nicht, mit diesem Unsinn wieder abzulenken.
 
Also wir nehmen Linux und klammern Spiele aus? Damit schießt du an der Zielgruppe, die hier schreibt und liest, meilenweit vorbei. Die +50% unter Windows und inklusive Spielen von Deneb auf SB kannst du ergo nach wie vor nicht widerlegen *seufz* Und deine dubiose I/O-Theorie hast du bis heute auch noch nicht erläutert oder mit eindeutigen Benchmarks unterstützt.
 
Zuletzt bearbeitet:
Ja, das tut er auch. Das ist allerdings eine andere Baustelle und sollte man nicht durcheinanderbringen.

1. CMT vs CMP = 80% vs 100%
2. 1 CMT Kern vs 2 CMT Kerne (im selben Modul) = 100% vs 180%

So lauten zumindest die bisherigen offiziellen Informationen.

Das heist also ein CMT Kern eines Moduls bei gleichem Takt und ohne Turbo bringt grob 80% eines herkömmlichen Phenom II Kerns in der Vollausstattung inkl. L3 Cache?
 
Das heist also ein CMT Kern eines Moduls bei gleichem Takt und ohne Turbo bringt grob 80% eines herkömmlichen Phenom II Kerns in der Vollausstattung inkl. L3 Cache?
Nein, es besagt wohl nur, dass ein Modul nicht aus zwei vollwertigen Kernen besteht. Wie schnell ein Bulldozer Kern oder Modul sein wird, weiß man nicht und wird es wohl so schnell auch nicht erfahren.
 
Das heist also ein CMT Kern eines Moduls bei gleichem Takt und ohne Turbo bringt grob 80% eines herkömmlichen Phenom II Kerns in der Vollausstattung inkl. L3 Cache?

Ich dachte immer von so einem Modul bringt ein Kern 100% Leistung und der zweite, weil er kein echter Kern ist, ca. 80% Leistung.

Dann müsste ein Modul 1,8 rechnerische Kerne haben und vier Module entsprächen 7,2 rechnerischen Kernen - wobei jeweils noch unbekannt ist, wie schnell so ein rechnerischer Kern ist.

Wenn jetzt ein Modul aber nur 2x 80% liefern würde, dann wären das ja nur 6,4 rechnerische Kerne. Dann müsste so ein 4 Modul BD aber gewaltig pro Kern und Takt Gas geben, um sich überhaupt deutlich von einem X6 abzusetzen.
 
Ich dachte immer von so einem Modul bringt ein Kern 100% Leistung und der zweite, weil er kein echter Kern ist, ca. 80% Leistung.

Dann müsste ein Modul 1,8 rechnerische Kerne haben und vier Module entsprächen 7,2 rechnerischen Kernen - wobei jeweils noch unbekannt ist, wie schnell so ein rechnerischer Kern ist.

Wenn jetzt ein Modul aber nur 2x 80% liefern würde, dann wären das ja nur 6,4 rechnerische Kerne. Dann müsste so ein 4 Modul BD aber gewaltig pro Kern und Takt Gas geben, um sich überhaupt deutlich von einem X6 abzusetzen.

nein das ist unsinn beide kerne in einem modul sind gleich, nur wenn 2 threads auf einem modul laufen, also beide kerne ausgelastet sind, sinkt die leistung pro kern etwas weil sich die kerne z.b. l2cache und fpu teilen müssen.

laut JF-AMD erreicht ein modul 90% der leistung von der eines fiktiven bulldozer dual cores wo alles doppelt vorhanden ist.
 
Na, dann habe ich mit meinen 1,8 rechnerischen Kernen pro Modul doch recht. Es hat mich nur gewundert, weil weiter oben etwas von 2x 80% pro Modul stand und anderswo etwas von 640% pro 4 Modul BD etc...
 
Sieht aus wie ein Fehler oder DFI versucht wirklich nochmal die mATX Welle zu reiten.
 

Das würde ich auch eher als Fehler ansehen. Das Board selber ist ja schon sehr alt. Das gibt es nur nicht mehr zu kaufen, aber es ist auf Geizhals noch gelistet, aber halt nicht mehr verfügbar.

DFI LANparty BI 785G-M35, 785G (dual PC3-10667U DDR3) (7596-050R) | Geizhals.at Deutschland
Tech-Review.de » Artikel » Reviews »

Bin aber echt sehr gespannt auf den Bulldozer. Irgendwas muss den Sandy Bridge ja ablösen - der ist langweilig geworden. ;)

Bin echt auf erste Benchmarks gespannt - schade, dass man nicht so leicht an ES CPUs rankommt, wie bei Intel. Dann würden wir sicherlich schon mal was gesehen haben.
 
Ich finds irgendwie gut, dass keine geleakten Benchmarks auftauchen. Das erhält die Spannung. Vorm SB-Launch waren ja selbst im Luxx schon unzählige Samples unterwegs.
Im Desktop Bereich sicher, keine Frage, deswegen fragte ich ja explizit für mein Anliegen in Sachen Dual CPU Bereich. Und dort sind schnelle AMD CPUs auch schweine teuer. Vllt nicht ganz so extrem wie die Intels, aber mit der Preisgestaltung zwischen Top AMD Produkt vs. Top Intel Produkt im Desktop Bereich ist im Server/Dual CPU Bereich leider nix... ;)
Also ich habe jetzt mal kurz die Preise für die 6-Kern CPUs für Dual-CPU Systeme auf Basis des Gulftown und Istanbul angeschaut und da liegt AMDs Topmodel deutlich unter dem "billigsten" von Intel...

Höheren Takt kann Intel problemlos mitfahren, die Zeiten der Taktwettrennen sind - dachte ich - eigentlich vorbei. Takt alleine hilft dem BD nicht.
Ob Intel höheren Takt so ganz problemlos mitgehen kann, bleibt abzuwarten. Und ich sagte auch nicht, dass BD allein über den Takt mithalten kann/muss, da solltest du schon richtig lesen. Nochmal, Bulldozer kann entweder komplett durch IPC-Steigerungen aufholen oder einen leichten Rückstand alternativ mit einem (durch einen stark verbesserten Turbo) höheren Takt ausgleichen.
 
Techtrancer, das gezeigte DFI hat ganz klar einen AM3 Sockel und kann somit kein AM3+ Sockel sein.

Sockel AM3 So sieht auch der DFI Sockel aus


Sockel AM3+
 
Was auch deutlich macht, dass BD mechanisch nicht in den Sockel AM3 passen wird. Somit ist die winzige Hoffnung, BD könnte möglicherweise mit Einschränkungen auf Sockel AM3 laufen völlig zerbröckelt. BD hat einen Pin mehr:d
Allerdings macht mir der plötzliche Wegfall von Derrick R. Meyer mehr Sorgen, als das BD nicht auf AM3 läuft. Schließlich war Dirk seit 1996 bei AMD und hatte die Leitung bei der K7 Entwicklung.
 
Zuletzt bearbeitet:
das habe ich auch schon länger im Kopf

Bulldozer 4 Module x 1.8 = 7.2

Sandy Bridge 4 Kerne x 1.25 = 5

Jetzt kommt die frage, wieviel IPC hat ein Bulldozer integer Core & wie hoch taktet er?
Nope, JF sagt 80% und nicht 90%, ergo müsste man mit 160% rechnen:
JF schrieb:
Compared to CMP (chip multiprocessing – which is, in simplistic terms building a multicore chip with each core having its own dedicated resources) two integer cores in a Bulldozer module would deliver roughly 80% of the throughput.
Davon, dass der 2te Int-Core die Leistung um 80% steigert, sagt JF nichts. Also warum damit rechnen?
 
Man kann aber auch die 80% so verstehen. Ein BD Modul bringt 80% der Leistung, als ein normalerweise Dual Prozessor einer BD Architektur. Wir wissen aber nicht welche IPC Steigerung tatsächlich vorhanden ist.
Somit können wir wieder sehen, dass wir Null Plan haben. Wir wissen einfach nichts. Trotzdem kommen eben von dir die pessimistischen Einschätzungen und von andere eben die optimistischen Einschätzungen. Eigentlich stellt sich da eher die Frage?

Warum schätzt du und andere pessimistisch?
Warum schätzen andere und ich optimistisch?
Denn Wissen ist keines vorhanden, egal auf welcher Seite.
 
Zuletzt bearbeitet:
Ich finds irgendwie gut, dass keine geleakten Benchmarks auftauchen. Das erhält die Spannung. Vorm SB-Launch waren ja selbst im Luxx schon unzählige Samples unterwegs.

Ich weiß - hatte selber schon seit Mitte Dezember einen. Der Vorteil dadurch ist, dass man sich gut selber vorher sein eigenes Bild machen kann. Spannung finde ich in diesem Fall doof. :fresse:
 
Man kann aber auch die 80% so verstehen. Ein BD Modul bringt 80% der Leistung, als ein normalerweise Dual Prozessor einer BD Architektur.
Das kann man nicht so verstehen, sondern genau das sagt JF: Ein Modul-BD erreicht 80% der Leistung eines (fiktiven) CMP-BD. Letzteres bestünde aus zwei Kernen mit eigenem L2 usw., also nichts geshart wie bei einem Modul.
Warum schätzt du und andere pessimistisch?
Warum schätzen andere und ich optimistisch?
Denn Wissen ist keines vorhanden, egal auf welcher Seite.
Ich schätze nicht pessimistisch, wenn ich sage, AMD holt pro Takt mal gepflegt 30% auf (Nehalem-Niveau). Das ist schließlich ein ziemlich großer Sprung. Warum du "optimistisch" bist? Aus dem gleichen Grund warum du Intel und Leute wie mich, Undertaker, boxleitnerb, mirko10 und Co. flamst. Lieber etwas zurückhaltender und sich über ein schnelles finales Produkt freuen, als euphorische Fanboy-Exzesse und am Ende enttäuscht das finale Produkt - so wie es bei der HD 6970 bei vielen der Fall war.
 
Eigentlich habe ich jetzt mal versucht eine anständige Diskussion zu pflegen, allerdings willst du das nicht wie man sieht.
Insofern hoffe ich auch das du einstecken kannst und nicht nur austeilen um dann den Meldebutton zu klicken.
Wo habe ich dich jetzt angemacht? Ich habe ganz normal gefragt. Auch ist es absolut ohne Wert, wenn jemand auf irgendwas pessimistisch ist und ein andere optimistisch. Wenn das für dich flamen ist, muss ich dazu gleich wieder fragen, warum man dich nach über 22000 Beiträge auf CB gebannt hat. Willst du weiterhin solch eine Diskussion mit unzähligen gelöschten Beiträgen auf jeder Seite?
Ich hoffe wir können mal runter kommen, muss aber auch für beide Seiten gelten.

Deine 30% höre ich heute zum ersten mal. Gestern waren es noch 25%. Ich denke optimistisch, weil nur so der Markt spannend bleibt. Ich persönlich habe dadurch keine Enttäuschung, weil ich nicht emotional an die Produkte gebunden bin. Bist du emotional an die Produkte gebunden?
Wenn dann ist man emotional bei der Diskussion, wie wir ja für uns beide feststellen können.
ich tippe grob auf pro-MHz-Leistung auf/über Lynnfield-Niveau (+25% auf Deneb), aber unter Sandy Bridge. http://www.hardwareluxx.de/community/16061819-post80.html

Für mich sieht das eben so aus. Mein beschränktes Wissen über CPU Architekturen ermöglicht mir nicht die Leistung eines kommenden BDs einzuschätzen. Insofern kann ich nur entweder Pessimist oder Optimist sein. Allerdings sehe ich auch hier keinen der stichhaltig und rational die Leistung eines BDs mit den wenigen Informationen einstufen kann. Auch bei dir sehe ich das nicht. Zudem sehe ich das weder bei den von dir aufgezählten User noch sehe ich es bei den hier recht deutlichen Optimisten. Es ist und bleibt aktuell eben so, dass jeder nur schätzt. Wer aber hier nur schätzt und trotzdem dann üble Vergleiche zieht (Pentium 3 zu Pentium 4, AMD macht die gleichen Fehler wie Intel mit Pentium und all dieses Zeug), der muss sich nicht wundern, wenn Reaktionen kommen. Schließlich heißt das Thema hier nicht. Die Pessimisten und deren BD Einschätzungen. Zumal wie schon gesagt, keiner auch nur im Ansatz seinen Pessimismus erklären kann in Bezug auf die wenigen Informationen der neuen Architektur. Sowie auch keiner der Optimisten erklären kann warum er im Bezug auf die BD Architektur und den wenigen Informationen darüber optimistisch ist.
 
Zuletzt bearbeitet:
Status
Für weitere Antworten geschlossen.
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh