AMDs Bulldozer 50 Prozent schneller als Core i7? (Update)

Status
Für weitere Antworten geschlossen.
Die Ausführungseinheiten sind wirklich nicht der Knackpunkt, das Frontend (bis auf die Branch Prediction) aber auch nicht. Du kannst bei normalen CPU Programmen das Front-End beliebig breit machen und auch entsprechend viele FUs dazu bauen und würdest trotzdem nicht mehr viel Leistung rausholen.
Darum ging es ja auch gar nicht. Egal wie breit das Frontend ist, die springende Punkt war, die Pipeline möglichst konstant und hoch auszulasten.

Das Problem hatte Intel deswegen, weil sich 2 Threads dann z.B. um 3 ALUs und eine SSE Einheit gestritten haben. Das Problem hat AMD nicht, den jeder Thread hat seine eigene Pipeline mit seinen eigenen ALUs. Die einzige Sache, wo sich die beiden Threads behindern können ist bei 256Bit AVX Instruktionen.
Na ja, ganz so einfach ist es nicht. Zwei Threads in einem Modul müssen sich auch Frontend und L2 teilen. Das wäre bei 2 Threads in zwei Modulen nicht der Fall.
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
er sagt dass es die allermeisten leute .....
Es mag durchaus sein, das er das gemeint hat. Sein Vergleich passt aber nicht zu dem was du nun schreibst. Ich habe auch nicht gefragt was er sagen will, sondern dass ich diesen Vergleich nicht verstehe.

Er schrieb
...
Die hd4870 hat auch nicht mehr leistung mit seinen 800 sp als eine gtx580 mit ihren 512sp....

Die HD 4870 hat zudem 160 5D Shader-Einheiten. Es ist einfach ein unsinniger Vergleich, mit dem man nichts und schon schon überhaupt nicht das erklärt kann was du nun schreibst was er gemeint haben könnte.
 
Die HD 4870 hat zudem 160 5D Shader-Einheiten. Es ist einfach ein unsinniger Vergleich, mit dem man nichts und schon schon überhaupt nicht das erklärt kann was du nun schreibst was er gemeint haben könnte.

Ich persönlich finde den Vergleich garnicht mal so abwägig.

Er schreibt das Produkt X mit 800Einheiten nicht mehr Leistung bringt als Produkt Y mit 512Einheiten. Das selbe könnte man auf die CPUs anwenden CPU#1 hat 8Cores und CPU#2 nur 4(Beispiel). Trotzdem könnte es sein das CPU#2 schneller ist.

Den meisten Endanwender ist es egal wieviele logische CPUs/Integer Cores/etc pp. auf einem DIE rumlungern, solang es die Leistung bringt die man braucht.
Wenn nun der BD wirklich 50% schneller sein sollte, dann juckt es einfach kaum jemanden warum es so ist.
Ich wette mehr als 90% aller Blödmarkt Kunden fragen den Verkäufer welcher PC denn schneller ist, aber werden so gut wie nie fragen warum der denn schneller ist.
 
Roldhak
Ich verstehe was du meinst.
Aber er schreibt ja nicht X 800 Shader-Einheiten gegen Y 512 Shader-Einheiten, sondern er benennt Produkte. Man kann nun nicht bei diesen Produkten irgendwelche Eigenschaften isoliert benutzen um dann das zu erklären was du meinst.

Zudem hat eine HD 4870 160 5D Shader-Einheiten und 965 Millionen Transistoren, während eine GTX 580 512 1D Shader-Einheiten hat und 3 Milliarden Transistoren. Das sind 2 völlig voneinander verschiedene Eigenschaften. Man kann da nicht einfach was rauspicken um sich einen Vergleich zu basteln.

Wenn dann müsste man einen Vergleich zwischen einer 6870 und 5850 nehmen.

Eine 6870 mit 224 5D Shader-Einheiten und 1,7 Milliarden Transistoren ist auch leicht schneller als eine 5850 mit 288 5D Shader-Einheiten und 2,15 Milliarden Transistoren.
 
Darum ging es ja auch gar nicht. Egal wie breit das Frontend ist, die springende Punkt war, die Pipeline möglichst konstant und hoch auszulasten.

Ok, war dann wohl nur ein Missverständnis.


Na ja, ganz so einfach ist es nicht. Zwei Threads in einem Modul müssen sich auch Frontend und L2 teilen. Das wäre bei 2 Threads in zwei Modulen nicht der Fall.

Das ist zwar richtig, aber im Vergleich zum K10.5 wurde das Frontend dafür deutlich aufgebohrt und der L2-Cache gleich mal vervierfacht, so dass selbst pro Kern die doppelte Menge L2-Cache zur Verfügung steht. Bei normalen Workloads gibt es wohl nicht so viele Threads die wirklich so sehr am L2-Cache hängen.
 
Wenn dann müsste man einen Vergleich zwischen einer 6870 und 5850 nehmen.

Eine 6870 mit 224 5D Shader-Einheiten und 1,7 Milliarden Transistoren ist auch leicht schneller als eine 5850 mit 288 5D Shader-Einheiten und 2,15 Milliarden Transistoren.

hmm stimmt, der vergleich wäre da doch besser als der vorherige.
 
wann soll den der "Bulldozer" kommen ?? wollte mir eigentlich ende Jan. SB kaufen, aber vllt. sollte ich noch bisl warten ???
 
Roldhak
Ich verstehe was du meinst.
Aber er schreibt ja nicht X 800 Shader-Einheiten gegen Y 512 Shader-Einheiten, sondern er benennt Produkte. Man kann nun nicht bei diesen Produkten irgendwelche Eigenschaften isoliert benutzen um dann das zu erklären was du meinst.

Zudem hat eine HD 4870 160 5D Shader-Einheiten und 965 Millionen Transistoren, während eine GTX 580 512 1D Shader-Einheiten hat und 3 Milliarden Transistoren. Das sind 2 völlig voneinander verschiedene Eigenschaften. Man kann da nicht einfach was rauspicken um sich einen Vergleich zu basteln.

Wenn dann müsste man einen Vergleich zwischen einer 6870 und 5850 nehmen.

Eine 6870 mit 224 5D Shader-Einheiten und 1,7 Milliarden Transistoren ist auch leicht schneller als eine 5850 mit 288 5D Shader-Einheiten und 2,15 Milliarden Transistoren.

danke für die korrektur :) das trifft es dann ja wohl um einiges besser ^^.

Nun ja so wie momtena von vond er power von bulli geredet wird würde ich fast aus spaß warten :fresse2:

also ich rechne damit das bd anfang mai kommt ;) auf jeden fall im 2.quartal^^
 
Zuletzt bearbeitet:
Das ist zwar richtig, aber im Vergleich zum K10.5 wurde das Frontend dafür deutlich aufgebohrt und der L2-Cache gleich mal vervierfacht, so dass selbst pro Kern die doppelte Menge L2-Cache zur Verfügung steht. Bei normalen Workloads gibt es wohl nicht so viele Threads die wirklich so sehr am L2-Cache hängen.
Klar, im Vergleich zu K10.5 sind mehr Ressourcen vorhanden. Die Frage bleibt dennoch, ob und um wie viel es sich auswirkt, 2 Threads in 2 Modulen statt einem laufen zu lassen.
 
also wenn amd damit die 300-350€ anpeilt ,das ding im august erscheint
und ca 30% mehr kann als ein sb2600k für sagen wir 260€ dann passt das doch alles
bald kommen doch noch paar i7 raus was meint ihr was die leisten und kosten werden :d
 
Keine Ahnung, wie man hier auf August kommt. Die Roadmap spricht von Q2. Und dieses Quartal geht von April bis Juni.
 
gleich Leistung wie der 2600K für den 2 schnellsten Bulli bei Querschnitt aus Spielen und Anwendungen ( keine benches in geringer auflösung nur anwendungen die man so auch wirklich benutzt und nicht wie zB winrar der sogar von nem ssd raid ausgebremst wird ) bei 270€ wäre absolut iO der schnellste Bulli ca 10% mehr leistung und um die 400-450€
 
in Cinebench ist Westmere 6C/12T gute 29% schneller als Sandy Bridge 4C/8T
laut Gerüchten ist BD 4M/8C mit Westmere auf augenhöhe, Bulldozer wird in Multithreading ganz klar schneller als SB 4/8, 30% mehrleistung sind nicht wenig.

p6xndjy6.jpg
 
Interessant wäre ein Vergleich SB 4 (ohne HT) vs BD 4M (ohne CMT).
Wenn BD dann noch 10-20% vor SB ist, wäre das ein gewaltiger Schritt.
 
Interessant wäre ein Vergleich SB 4 (ohne HT) vs BD 4M (ohne CMT).
Wenn BD dann noch 10-20% vor SB ist, wäre das ein gewaltiger Schritt.

CMT wird man aber vermutlich nicht so einfach abschalten können denk ich mal.
Wär ja als würde man fast die hälfte der CPU deaktivieren.
 
interessanter wäre da schon eher wenn alle threads von einem programm kommen ob da 2 threads auf 2 modulen schneler ist oder 2 threafds in einem modul
 
interessant wirds wenn die endlich für uns endkunden kaufbar sind :d

Das mit April steht oder? Würde gut passen hab da bday un so^^
Achja die sind doch bestimmt im März in Hannover oder?^^
 
in Cinebench ist Westmere 6C/12T gute 29% schneller als Sandy Bridge 4C/8T
laut Gerüchten ist BD 4M/8C mit Westmere auf augenhöhe, Bulldozer wird in Multithreading ganz klar schneller als SB 4/8, 30% mehrleistung sind nicht wenig.

In meinen Augen muss man bei so einem Vergleich das gesamte Leistungspotenzial der CPUs miteinander vergleichen und das bedeutet - insb. bei BE oder K CPUs, bei denen man einen Aufpreis für einen offenen Multi bezahlt - auch deren Übertaktungspotenzial mit in Betracht zu ziehen.

Klar, der uninformierte Kunde aus dem Mediamarkt wird selbst eine CPU, für die er den Aufpreis zum Übertakten gezahlt hat, nicht übertakten. Aber wen interessieren die uninformierten Kunden. Wir zählen ja wohl alle zu den Informierten.

Und betrachtet man das Übertaktungspotenzial (Übertaktung nicht bis zum Anschlag, aber Übertaktung mit geringem Aufwand, d.h. LuKü und innerhalb der VCore Specs) dann liegt der Westmere @4,1 Ghz keine 30% mehr vor der SB @ 4,8 Ghz, sondern nur noch weniger als die Hälfte:



In der Single-Thread Performance sieht der Westmere sogar gar kein Licht mehr gegen die SB, denn SB ist hier über 30% schneller:



Und was bringt eine CPU, die nur bei Ausnutzung von allen 6 Kernen schnell ist? Das bringt doch nur etwas für Leute, die viel Videobearbitung o.ä. machen (voarausgesetzt ihre Schnitt-Software schafft es überhaupt mehr als 4 Kerne anzusprechen).

Also was ist unter dem Strich schneller: Westmere, der in den seltensten Fällen mal 10-15% schneller als SB sein dürfte, oder SB die in der Regel bis zu 30% schneller ist?
 
Aber wen interessieren die uninformierten Kunden.
So ziemlich jedes Unternehmen. Und selbst für viele Informierte ist dies irrelevant.
Die tollen OC Tests mögen ja ganz nett sein für irgendwelche Leute hier, mögen dem Hersteller minimales Prestige bringen, aber da draußen, wo das Geld verdient wird, interessiert das nicht die Bohne. Wenn mit den Systemen produktiv gearbeitet wird so wird dort nichts an der Taktschraube gedreht.

Alles andere ist Foren "Subkultur".
 
Die tollen OC Tests mögen ja ganz nett sein für irgendwelche Leute hier, mögen dem Hersteller minimales Prestige bringen, aber da draußen, wo das Geld verdient wird, interessiert das nicht die Bohne.

Es geht nicht um Prestige. Es geht um Noob-OC. Ich habe ja auch keine Werte aus dem OC Therad angeführt, in dem die SB auf über 5,4 Ghz geprügelt wird.

Aber ich stimme dir zu, dass es für einige Leute uninteressant ist. Die meisten davon werden dann aber wohl nicht den Aufpreis für eine BE oder K CPU zaheln. Aber wenn man eine BE oder K CPU beurteilt, dann kann man das OC-Potenzial (für Noobs) nicht ausser acht lassen.

Und ja, ich stimme dir zu: "Die tollen OC Tests mögen ja ganz nett sein für irgendwelche Leute hier". Das machen wir ja: wir beurteilen, was die Hardware uns bringt. Was interessieren mich irgendwelche Unternehmen, mit denen ich nicht assoziiert bin.
 
Zuletzt bearbeitet:
Klar, im Vergleich zu K10.5 sind mehr Ressourcen vorhanden. Die Frage bleibt dennoch, ob und um wie viel es sich auswirkt, 2 Threads in 2 Modulen statt einem laufen zu lassen.
Natürlich wird sich das auswirken, deswegen ja die 180% und keine 200% (Kleine Nebenbemerkung, die 160% hat JF auf amdzone schon vor nem halben Jahr deutlich dementiert, er rechnet 100%+80%, ich würde 90%+90% drauß machen, aber egal).
Wahrscheinlich wird man von der Geschichte eh nix merken, da AMD sicherlich so schlau ist und die gleichen CPUID Flags für CMT nutzt, wie SMT, ergo wird Win7 erstmal alle Module mit 1 Thread versorgen, und dann erst Module doppelt belegen. Wie bei SMT halt auch.

ciao

Alex
 
lol.

wenn man nen phys. 8 Kerner AMD Bulldozer mit nem phys. 4 Kerner (i7-950) vergkleicht ist es ja klar, dass der AMD mehr Power hat.

50 % Mehrleistung ei doppelter Anzahl an Kernen ist finde ich zu wenig.

Das wird dieses mal wieder so sein. Intel zwar teurer aber dafür leistungsfähiger. AMD dafür billig und nicht so leistungsfähig :coolblue:
 
lol.

wenn man nen phys. 8 Kerner AMD Bulldozer mit nem phys. 4 Kerner (i7-950) vergkleicht ist es ja klar, dass der AMD mehr Power hat.

50 % Mehrleistung ei doppelter Anzahl an Kernen ist finde ich zu wenig.

Das wird dieses mal wieder so sein. Intel zwar teurer aber dafür leistungsfähiger. AMD dafür billig und nicht so leistungsfähig :coolblue:

Ja das haben wir jetzt schon oft gelesen. Es macht auch deutlich, dass man gerne Sachen nicht ausspricht um der Meinung "BD ist nicht so toll" Ausdruck zu verleihen.

8 Kerne gegen 4 Kerne nur 50% schneller = schlecht.
8 Threads gegen 8 Threads 50% schneller = gut.

Das ist eben das spannende für mich. Wir bekommen nun noch mehr Möglichkeiten je nach Lager unsere Argumente zu gestalten :)

Der 4 Modul 8 Kerne 8 Threads BD soll 50% schneller sein als ein i7 950 mit 4 Kerne und 8 Threads = ~15% schneller als ein i7 980 mit 6 Kerne und 12 Threads.

Es macht wirklich Spaß :wink:
 
Zuletzt bearbeitet:
So ziemlich jedes Unternehmen. Und selbst für viele Informierte ist dies irrelevant.
Die tollen OC Tests mögen ja ganz nett sein für irgendwelche Leute hier, mögen dem Hersteller minimales Prestige bringen, aber da draußen, wo das Geld verdient wird, interessiert das nicht die Bohne. Wenn mit den Systemen produktiv gearbeitet wird so wird dort nichts an der Taktschraube gedreht.

Alles andere ist Foren "Subkultur".

Exakt.
Das große Geld wird im OEM-Markt verdient. Dort kann man die Boards eh vergessen, auch weil sich die Kunden nicht dafür interessieren/denen ausreicht was ihnen geboten wird bzw. sie schlicht nicht informiert sind.
Die größten Gewinnmargen gibts im Workstation und Servermarkt und dort wird überhaupt nicht OC'd, um die Systemstabilität nicht zu gefährden. Denn jeder Absturz, jedes Neueinrichten kostet Zeit und somit (jede Menge) Geld.

OC ist für den informierten Enthusiasten von Bedeutung und trägt allenfalls zum Prestige innerhalb einer zahlenmäßig sehr kleinen Gruppen an Usern bei.
 
wann soll den der "Bulldozer" kommen ?? wollte mir eigentlich ende Jan. SB kaufen, aber vllt. sollte ich noch bisl warten ???

Das letzte was ich gelesen habe war April.

Klar, im Vergleich zu K10.5 sind mehr Ressourcen vorhanden. Die Frage bleibt dennoch, ob und um wie viel es sich auswirkt, 2 Threads in 2 Modulen statt einem laufen zu lassen.

Jo, das ist die Frage, ich gehe von relativ geringen Auswirkungen aus, denn alle Performance-kritischen Bereiche wurden verdoppelt oder stark erweitert.

interessanter wäre da schon eher wenn alle threads von einem programm kommen ob da 2 threads auf 2 modulen schneler ist oder 2 threafds in einem modul

Das ist eine gute Frage. 2 Module haben den Vorteil von deutlich mehr Ressourcen, hauptsächlich bei SSE/AVX und L2-Cache. Das breitere Frontend wird sich vermutlich nicht so stark auswirken. Andererseits können 2 Threads im gleichen Modul schneller kommunizieren durch den gemeinsamen L2-Cache. Zusätzlich ist es evtl. eine höhere Turbo-Stufe drin, wenn man dadurch Module komplett abschalten kann.

In der Single-Thread Performance sieht der Westmere sogar gar kein Licht mehr gegen die SB, denn SB ist hier über 30% schneller

Mag ja sein, aber welches Programm, das viel Leistung braucht, ist heute noch single-threaded?

Und was bringt eine CPU, die nur bei Ausnutzung von allen 6 Kernen schnell ist? Das bringt doch nur etwas für Leute, die viel Videobearbitung o.ä. machen (voarausgesetzt ihre Schnitt-Software schafft es überhaupt mehr als 4 Kerne anzusprechen).

Im privaten Bereich gibt des doch nur noch zwei große Bereiche, bei denen man auf viel CPU-Leistung angewiesen ist, nämlich Spiele und Videobearbeitung (von mir aus auch noch Seti&Co). Bei Spielen bringt eine hohe Single-Thread-Leistung noch was, aber andererseits sind die meisten Spiele immer noch Grafik-limitiert, so dass es auf 10-20% CPU-Leistung normalerweise nicht ankommt, weil es bei den relevanten Auflösungen keinen großen Unterschied macht. Im Videobereich ist dagegen die Nutzung von vielen Threads heute kaum noch ein Problem.

Wahrscheinlich wird man von der Geschichte eh nix merken, da AMD sicherlich so schlau ist und die gleichen CPUID Flags für CMT nutzt, wie SMT, ergo wird Win7 erstmal alle Module mit 1 Thread versorgen, und dann erst Module doppelt belegen. Wie bei SMT halt auch.

Ich bin mir nicht ganz sicher, ob das wirklich die beste Methode ist, denn man kann keine einzelnen Kerne, sondern nur Module komplett abschalten.
Wenn ich also 4 Threads hätte, könnte ich entweder alle Module laufen lassen und dann 1 Thread pro Modul benutzen oder eben nur 2 Module benutzen, die dafür dann aber höher takten. Bei den genannten 180% für die Benutzung beider Kerne eines Moduls, würde ein zusätzlicher Turbo von 10% bereits ausreichen um das zu kompensieren und ich denke bei einer halb abgeschalteten CPU sollte durchaus mehr als das drin sein.

lol.

wenn man nen phys. 8 Kerner AMD Bulldozer mit nem phys. 4 Kerner (i7-950) vergkleicht ist es ja klar, dass der AMD mehr Power hat.

50 % Mehrleistung ei doppelter Anzahl an Kernen ist finde ich zu wenig.

Du hast einen entscheidenden Punkt vergessen. Es gibt grundsätzlich 2 Möglichkeiten die Leistung pro Kern zu erhöhen. Entweder du erhöhst die Leistung pro Takt oder eben du erhöhst die Taktfrequenz. Bei einem 8 Kerner der nur 4 Threads ausführst, sollte der Turbo einiges kompensieren können, vor allem, da Bulldozer eine Hochfrequenz Architektur ist. Beim Pentium 4 hat das damals nicht gut geklappt, was ja hauptsächlich daran lag, dass sie den Stromverbrauch nicht in den Griff bekommen haben. Heute hat man mit Clock- und Powergating deutlich bessere Möglichkeiten den Stromverbrauch zu regulieren.
 
Zuletzt bearbeitet:
Ja das haben wir jetzt schon oft gelesen. Es macht auch deutlich, dass man gerne Sachen nicht ausspricht um der Meinung "BD ist nicht so toll" Ausdruck zu verleihen.

8 Kerne gegen 4 Kerne nur 50% schneller = schlecht.
8 Threads gegen 8 Threads 50% schneller = gut.

Das ist eben das spannende für mich. Wir bekommen nun noch mehr Möglichkeiten je nach Lager unsere Argumente zu gestalten :)

Der 4 Modul 8 Kerne 8 Threads BD soll 50% schneller sein als ein i7 950 mit 4 Kerne und 8 Threads = ~15% schneller als ein i7 980 mit 6 Kerne und 12 Threads.

Es macht wirklich Spaß :wink:
Das ist grundsätzlich sicher richtig, auch wenn in der Praxis am Ende natürlich eher nach dem Preis verglichen wird und nicht so sehr nach der Anzahl der Threds.

Interessant wird die Zahl der Threads (und die der Kerne natürlich auch) eigentlich erst, wenn sie nicht genutzt werden, also wenn der i7-980 dann in vielen Anwendungen gegen einen i7-2600 ablost.
 
Mag ja sein, aber welches Programm, das viel Leistung braucht, ist heute noch single-threaded?

Das ist natürlich klar - aber die Relation bleibt ja solange bestehen, wie der X6 nicht mehr Kerne als der X4 einsetzen kann. D.h. selbst wenn 4 Threads (!) parallel genutzt werden, dürfte der 2600k bis zu 30% schneller sein.
 
wenn BD die Module komplett abschalten kann, dann ist auch mehr Taktspielraum drin, evtl. takten dann die restlichen Module mit 1000MHz mehr? 500MHz Turbo auf 8 Cores sind ja schon drin, bei 2 Modulen sind 1000MHz mehr Takt nicht unwahrscheinlich, BD kann durch das 17FO4 Design 20-30% höher takten als K10 @45nm, dazu kommt noch 32nm+HighK was auch für zusätzlichen Taktspielraum & weniger Energie sorgt.
 
Zuletzt bearbeitet:
Status
Für weitere Antworten geschlossen.
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh