Wird AMD permanent gegenüber Intel in Reviews benachteiligt? Bitte ersten post lesen

Status
Für weitere Antworten geschlossen.
Zum Thema IMC: HT4U darüberhinaus auch nachgewiesen, dass TripleChannel und auch DualChannel eher Latenznachteile als Vorteile ggü. SingleChannel mit sich bringt. Das bedeutet im Klartext, dass Nehalem definitv keinen Unganged-Modus beherrscht, wie ich vorher vermutet habe. Das heißt, dieses Speicherinterface reagiert nur und ausschließlich auf bandbreitenabhängige Apps. Nehalem hat nicht wie der K10 2 unabhängige RAM-Controller, sondern einen 3-Fach-Controller. Über den Sinn dieses Aufwandes, der damit betrieben wird, kann man echt nur den Kopf schütteln, denn das bringt dann auch im NUMA-Betrieb kaum Vorteile, während beim K10 über HT für die CPU selber nahezu latenzfrei zugegriffen werden kann... dafür hat der K10 im Serverbetrieb natürlich nur DDR2 800, was einen heftigen Bandbreitennachteil mit sich bringt.
MMn ist das 3-Fach-RAM-Interface genauso sinnfrei wie das 512Bit-Interface des R600...
 
Zuletzt bearbeitet:
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Bin mir sicher, dass Du mit diversen BOINC Projekten und gleichzeitig laufenden 8 Threads nen Unterschied zw. Triple und Dual messen kannst :)
Was denn nun? Ist es falsch oder bist du dir nur sicher? :) Ich denke eher, dass Triple Channel auch dort nichts bringt. Oder formulieren wir es mal konkreter. Für Single Sockel Systeme limitiert die Bandbreite von Dual Channel DDR3 vermutlich nicht. Auch nicht für einen Quad Core mit SMT. Dafür ist die theoretische Rechenleistung der x86 ISA und der jeweiligen Mikroarchitekturen zu gering.
 
ich hab mir nochmal den THG Test angesehen.

ICH BEKOMM DAS KOTZEN! Mir dreht sich echt der Magen um, sowas von unglaublich.

Das kann doch wohl nicht wahr sein:

Nero Recode 8: "129% langsamer"

Das geht schonmal von der Prozentrechnung her gar nicht.

Aber auch an sich ist das schwer möglich, wenn der QX9770 angeblich nur "30% langsamer" ist, siehe Cbase:

http://www.computerbase.de/artikel/...core_2_duo_e8600_e0/10/#abschnitt_nero_recode

Hat da einer einfach mal ne 1 vorne dran gehängt?

Der THG "Test" ist ein Skandal ohne gleichen.

Das hat nichts mehr mit Fehlern zu tun die mal passieren können. Da steckt Absicht dahinter.

Bei den CB-Werten hat eindeutig eine andere Komponente limitiert, wenn du dir einmal die Unterschiede zwischen den schnelleren CPU-Modellen ansiehst - Weder Phenom noch Yorkfield haben da brauchbar skaliert, ohne eine schnellere HDD oder ein rechenaufwändigeres Projekt wird man dort keine aussagekräftigen Werte ermitteln können.


Übrigens zum Trippel-Channel:

http://www.tomshardware.com/de/Core-i7-Nehalem,testberichte-240172-13.html

Die Unterschiede sind in der Tat minimal - aber z.B. WiC gewinnt fast 5%... Insofern gerade mit Zukunftsblick nicht überflüssig, auch Dualchannel hat anfangs kaum größere Vorteile gebracht.
 
Zuletzt bearbeitet:
Was denn nun? Ist es falsch oder bist du dir nur sicher? :) Ich denke eher, dass Triple Channel auch dort nichts bringt. Oder formulieren wir es mal konkreter. Für Single Sockel Systeme limitiert die Bandbreite von Dual Channel DDR3 vermutlich nicht. Auch nicht für einen Quad Core mit SMT. Dafür ist die theoretische Rechenleistung der x86 ISA und der jeweiligen Mikroarchitekturen zu gering.
Hat halt noch keiner gemessen, deswegen bin ich mir nur sicher, kann aber nicht sagen, dass es 100% falsch ist, da der Beweis aussteht. :)

Bei Deiner Sichtweiße auf die Bandbreite, vergißt Du, dass so ein 3ter Kanal auch die Latenz verbessert, zumindest theoretisch, durch besseres Interleaving oder noch besser durch unganged Betrieb.

Bisher hab ich aber leider noch keinen Bericht gelesen, der sich genau mit dem Betriebsmodi des Intel IMC auseinandersetzt. Diverse Everest Werte zeigen sogar ne schlechtere Latenz mit Triple Channel an .. aber Evererst ist eh nur single threaded und mißt deswegen ziemlichen Müll ... besser gleich nen praxisnahen Boinc Run / Test, dann wissen wir mehr :)

Wenn der Triple Channel bei boinc und da v.a. beim speicherintensive QMC nichts brächte, dann hätte Intel den quasi für umsonst und 0 Nutzen eingebaut ... das kann ich mir nun wirklich nicht vorstellen, die hatten doch ne x% Designrichtlinie, dass nur Verbesserungen eingebaut werden die mind. x% Mehrleistung bringen.

ciao

Alex
 
Zuletzt bearbeitet:
Hier ein Bericht aus dem Alternate-Forum über den 9850BE (Zitat):

Ich denke man kann diesen Proz durchaus bedenkenlos kaufen, habe einen Vergleich anzubieten: In meiner Freizeit spiele ich mit Freunden öfters mal CNC3 über Lan(mit einem Gigabit Hub) und da bis vor kurzem noch niemand einen Amd Quadcore hatte mussten wir mit einem Q6600 auf 3GHZ mit 8GB OCZ Ram auf einem EVGA nForce 780i SLI FTW mit Gtx260 Vorlieb nehmen.
Nun endlich hat sich jemand entschlossen seine Hardware zu erneuern und sich die folgenden Komponenten zugelegt ---->DFI LANPARTY DK 790FXB-M2RSH darauf 8GB Kingston HyperX sowie eine HD 4870 Sonic Dual von Palit mit 512MB und eben dieser Prozessor. Und nun lange Rede kurzer SINN mit dem Intel-System mussten alle auf Mittel setzen damit es Flüssig läuft und da hat es sogar gehakt wenn da mehr als 500 Einheiten auf dem feld waren mit amd ***nicht Übertaktet**** können wir nun endlich auf Hoch spielen und es hakt kein bisschen, nicht mal wenn die Einheitenzahlen in die Höhe gehen Top AMD...

So ähnlich sind meine Erfahrungen auch. Nur in den Reviews werden solche Tests ja nicht durchgeführt.

Schonmal überlegt, dass das an der Grafikkarte liegen könnte ;-). Du kannst doch keine Prozessoren miteinander vergleichen, wenn das Restsystem (außer natürlich das Board) nicht absolut identisch ist.
 
GTX260(Quad) vs HD4870(Phenom), das ist doch relativ ausgeglichen und sollte nicht für die beschriebenen Unterschiede verantwortlich sein...
 
Schonmal überlegt, dass das an der Grafikkarte liegen könnte ;-). Du kannst doch keine Prozessoren miteinander vergleichen, wenn das Restsystem (außer natürlich das Board) nicht absolut identisch ist.
Die Grafikkarten sind ja gleichstark, außerdem spricht er ja das Ruckeln bei vielen Einheiten an, wodurch der Prozessor limitieren dürfte.
 
Wenn der Triple Channel bei boinc und da v.a. beim speicherintensive QMC nichts brächte, dann hätte Intel den quasi für umsonst und 0 Nutzen eingebaut ...
Du vergisst, Sockel 1366 ist immer noch der Server Sockel. Und dort liegen die Vorgaben klar bei Multi-CPU. Mich würde es jedenfalls nicht verwundern, wenn Intel aufgrund der Einfachheit die Infrastruktur weitestgehend beibehält, um mit X58 Boards die Plattform so früh wie möglich zu launchen. Dual Channel gibt es dann ja sowieso mit Lynnfield. Also warum nochmal extra Entwicklungsarbeit reinstecken, die den Launch nur unnötig verzögert? Man kann sich den theoretischen Durchsatz der SSE Pipeline mit typischen Mikrocode Sequenzen und Caching auch mal schnell durchrechnen. Dann wirst du schnell merken, dass die Bandbreite von Triple Channel bei einem Quad Core nichts bringt. SMT spielt hier auch keine Rolle. Das sorgt ja nur für eine bessere Auslastung der Rechenwerke. Die maximal mögliche Rechenkapazität und die damit verbundenen Datensets erhöhen sich dadurch aber nicht.
Latenzen können bei Desktops sicherlich mehr bewirken. Aber da sieht es bisher eher so aus, als ob Triple Channel eine höhere Latenz hat.
 
Zuletzt bearbeitet:
Benchs hin oder her, ich mein was hilft es denn wenn da steht das nen Prozessor um so und soviel schneller ist?!
Ist doch piep egal ob der WinRAR nun 5 oder nur 4 min braucht, nutze eh noch die freie 3.51 die kann noch net mal multicore.

Ich meine mein X2 @3,25GHz ist nun wirklich nicht mehr up to date und ich hab gestern FarCry 2 installiert und gezockt, alles auf Hoch mit 2x AA und kein zuckeln, was will ich mehr?
 
Du vergisst, Sockel 1366 ist immer noch der Server Sockel. Und dort liegen die Vorgaben klar bei Multi-CPU.
Das vergess ich nicht, der IMC hat schließlich nichts mit Multi CPU zu tun ... die andre CPU in nem 2P Verbund hat doch auch 3 MCs ... wieso soll der 3te MC also wegen der andren CPU im System sein ?

Das macht maximal Sinn, wenn Du behaupten würdest, dass es vorkommen kann, dass bei nem andren Systemprozessor die 3 MCs nicht ausreichen, sodass er noch die "Fremd-MCs" anzapfen müsste ... aber der Meinung bist Du ja eindeutig nicht :xmas:

Was ich behaupte ist, dass die 3 IMCs bei starkem Serverload Vorteile bringen, d.h. alle 8 Threads auf Volldampf. Sowas schafft der Otto-Normal User imo nur mit boinc Apps. Mit den üblichen Desktop Apps schafft mans nicht, selbst cinebench oder WinRar sind Kinderkrams, siehe die aktuellen Tests. Deswegen kommt auch dann nur ein DualChannel Nehalem, fürs gemeine Volk :)

ciao

Alex
 
Zuletzt bearbeitet:
Bei den CB-Werten hat eindeutig eine andere Komponente limitiert, wenn du dir einmal die Unterschiede zwischen den schnelleren CPU-Modellen ansiehst - Weder Phenom noch Yorkfield haben da brauchbar skaliert, ohne eine schnellere HDD oder ein rechenaufwändigeres Projekt wird man dort keine aussagekräftigen Werte ermitteln können.


Übrigens zum Trippel-Channel:

http://www.tomshardware.com/de/Core-i7-Nehalem,testberichte-240172-13.html

Die Unterschiede sind in der Tat minimal - aber z.B. WiC gewinnt fast 5%... Insofern gerade mit Zukunftsblick nicht überflüssig, auch Dualchannel hat anfangs kaum größere Vorteile gebracht.

Das ändert nichts daran das der THG Test Schwachsinn ist und die 129% völlig aus der Luft gegriffen sind. (und du mit dem Kommentar davon ablenkst) Zudem skalieren die sehr wohl, nur nicht zu 100%, die ganzen Quads liegen eh im Bereich von 2,66 bis 3,2 ghz, was soll da noch groß skalieren? Wenn etwas knallhart limitieren würde dann lägen alle gleich auf.
 
Zuletzt bearbeitet:
Deswegen sagte ich doch auch, "brauchbar skaliert" - ohne klares CPU-Limit, was bei CB eben ganz und gar nicht vorlag, können wir keine Werte vergleichen, da diese Limitierung umso stärker wird, je schneller die CPU ist.

Edit: Das 129% langsamer mathematischer Unfug sind ist natürlich klar, die wollten wohl schreiben der i7 ist um 129% schneller.
 
Zuletzt bearbeitet:
Also hör aber mal auf hier absichtlich mit Spitzfindigkeiten alles zu zerreden!

129% langsamer geht nicht!

Da würde der Phenom laut THG sogar weniger als überhaupt rechnen.

Außerdem ist überhaupt ein großer Abstand nunmal nicht impliziert. Du hast sehr wohl eine Skalierung beim Cbase test, auch wenn die nicht ideal ausgeprägt ist. Auch wenn du jetzt Festplatte und Workload optimierst, ist ein massives proportionales abfallen des Phenom nicht wahrscheinlich.

Also hör bitte auf den THG Test auch noch schönzureden. Der ist ne absolute Katastrophe und das solltest eigentlich auch du einsehen.

Mit ist völlig wurscht wo der Phenom nun wirklich + - 10%, bei Idealen Systembedingungen bei Nero Recode im Vergleich zum Yorkfield steht. Fakt ist, dass es nicht so sein kann wie bei THG steht und darum geht es. Hier wird absichtlich und massiv gelogen und plakative Aussagen getroffen, die nichtmal annähernd der Wirklichkeit entsprechen.

"Der Vergleich zum jahrelangen Erzfeind AMD ist vor allem mit Blick auf die Performance fast nicht mehr gegeben: Der schnellste Core i7 965 ist mehr als 2,6-mal (164%) so schnell wie das aktuelle Spitzenmodell von AMD, dem Phenom X4 9950 BE. Damit fallen die AMD-Prozessoren beinahe aus unserem Benchmark-Parcours heraus."
 
Zuletzt bearbeitet:
Moment, Moment: Also der einzig offensichtliche Fehler bei THG ist, dass sie dort eine Prozentangabe falsch berechnet und langsamer mit schneller verwechselt haben - das das Unfug ist, schrieb ich bereits. Was jetzt konkret an der Messung das Problem sein soll, weiß ich nicht. Besser als die von CB ist sie allemal, da dort keine der schnelleren CPUs ihr Potential ausspielen konnte.
 
Das steht im abschließenden Fazit von THG. Nein, nicht nur bezüglich eines einzelnen Benchmarks sondern als Einschätzung der Gesamtperformance:

Der Vergleich zum jahrelangen Erzfeind AMD ist vor allem mit Blick auf die Performance fast nicht mehr gegeben: Der schnellste Core i7 965 ist mehr als 2,6-mal (164%) so schnell wie das aktuelle Spitzenmodell von AMD, dem Phenom X4 9950 BE. Damit fallen die AMD-Prozessoren beinahe aus unserem Benchmark-Parcours heraus.

Willst du so eine Aussage als Fazit ernsthaft unterstreichen?
 
Zuletzt bearbeitet:
Um erstmal die Sache mit Nero zu klären: CB verwendet mit Nero 8.1.1.0 eine Version von Mitte 2007. Recode 3.1.4.0 bei THG kam Mitte 2008 heraus. Desweiteren wurde rechenintensive High-Quality Modus verwendet, was in Bezug auf die Festplattenlimitierung sehr lobenswert erscheint - das gefällt mir alles weit besser als bei CB.

Jetzt zum 2. Punkt dem Fazit: Zu der Angabe mit 2,6x Geschwindigkeit vermisse ich irgendwie den Bezug, welche Anwendung hier gemeint ist. Ein Mittelwert doch vermutlich eher nicht?? Will mir also auch nicht so ganz einleuchten.
 
Der Server-Sockel kommt in Form des LGA1567 erst noch, mehr als 2 CPUs unterstützt der LGA1366 gar nicht :)
Wer redet denn von Beckton? :rolleyes: Der Einstieg ist erstmal Gainestown. Und der ist zumindest als Dual Sockel geplant.

@Opteron
Irgendwie stehe ich gerade auf dem Schlauch. Du sprichst von 3 "MCs". Hat Nehalem nicht lediglich einen MC mit 2 QPI Links für Chipsatz und Prozessoren? Dh, bei Single Sockel Systemen wird lediglich einer der QPI Links genutzt und die benötigte Bandbreite sinkt dementsprechend.

Was ich behaupte ist, dass die 3 IMCs bei starkem Serverload Vorteile bringen, d.h. alle 8 Threads auf Volldampf.
Wie gesagt, rechne dir den Durchsatz der x86 ISA durch. Dann siehst du, dass das eher Wunschdenken ist.
 
Gainestown ist die Workstation-Variante :) Btw, wir sind ganz schön OT ;)
 
Zuletzt bearbeitet:
Jetzt zum 2. Punkt dem Fazit: Zu der Angabe mit 2,6x Geschwindigkeit vermisse ich irgendwie den Bezug, welche Anwendung hier gemeint ist. Ein Mittelwert doch vermutlich eher nicht?? Will mir also auch nicht so ganz einleuchten.
Beginnst du zu verstehen oder willst du es nicht zugeben?

Wenn hier eine Anwendung gemeint ist, ist das benachteiligung von AMD, da man sich dann den "worst-case" rausgepickt hat.
Wenn das ein Mittelwert ist, dann kann dieser nicht stimmen und ist wieder benachteiligung von AMD. (Außerdem, wer bestimmt denn die benches?....)
 
@Opteron
Irgendwie stehe ich gerade auf dem Schlauch. Du sprichst von 3 "MCs". Hat Nehalem nicht lediglich einen MC mit 2 QPI Links für Chipsatz und Prozessoren? Dh, bei Single Sockel Systemen wird lediglich einer der QPI Links genutzt und die benötigte Bandbreite sinkt dementsprechend.

3 MCs = 3 Memorycontroller, wobei da eben die Frage ist, ob Intel da AMDs unganged Weg gegangen ist (also 3 MCs), oder nur einen "normalen" (ganged) MC mit 3 Kanälen eingebaut hat. Aber selbst im letzten Fall gibts Latenzvorteile durch Interleaving.
Wie gesagt, rechne dir den Durchsatz der x86 ISA durch. Dann siehst du, dass das eher Wunschdenken ist.
Wie gesagt, schau nicht nur auf den Durchsatz sondern auch auf die RAM Latenz unter heavy load :)

ciao

Alex

P.S: QPI hat mit dem MemoryController übrigens nichts zu tun :)
 
Zuletzt bearbeitet:
Wenn hier eine Anwendung gemeint ist, ist das benachteiligung von AMD, da man sich dann den "worst-case" rausgepickt hat.
Wenn das ein Mittelwert ist, dann kann dieser nicht stimmen und ist wieder benachteiligung von AMD. (Außerdem, wer bestimmt denn die benches?....)

Du hast schon gelesen das ich geschrieben habe, dass mir diese Zahl ebenfalls nicht einleuchten will ;)
 
Gainestown ist die Workstation-Variante :)
Mal abgesehen davon, dass das vollkommen egal war, ob das nun explizit als Server oder Workstation deklariert wird, es ging um Multi-CPU. Und diesbezüglich war deine Aussage immer noch FALSCH.

3 MCs = 3 Memorycontroller
Das war mir schon klar. Es ging darum, dass Nehalem lediglich EINEN Speichercontroller hat.

wobei da eben die Frage ist, ob Intel da AMDs unganged Weg gegangen ist (also 3 MCs)
Aha, so kommst du darauf. Dann drückst du dich aber irgendwie falsch aus. Es ist und bleibt ein Speichercontroller.

Und wie ich sagte, Latenz kann sich durchaus positiv auswirken. Aber dananch sieht es bisher nicht aus. Um die Unterschiede mit ganged und unganged bei AMD zu sehen, brauchst du auch kein BOINC. Da reichen andere Anwendungen, die jeden einzelnen Kern belasten, genauso. Um es nochmal unmissverständlich zu formulieren, Triple Channel ist hauptsächlich der Plattform respektive der QPI Architektur geschuldet, nicht einem einzelnen Prozessor.
Übrigens, ich habe mich noch nie wirklich mit BOINC beschäftigt. Aber werden da nicht vor allem wissenschaftliche Berechnungen durchgeführt? Dort wirken sich idR gute Caches positiv aus. Wirklich hohe Datenlast findest du eher bei Datenbankapplikationen oder ähnlichem.

P.S: QPI hat mit dem MemoryController übrigens nichts zu tun :)
Nicht? Wie ist denn der Speicher an den Speichercontroller angebunden?
 
Zuletzt bearbeitet:
Mal abgesehen davon, dass das vollkommen egal war, ob das nun explizit als Server oder Workstation deklariert wird, es ging um Multi-CPU.

Gainestown ist aber nuneinmal nicht für Multi-CPU Systeme, das geht nur mit LGA1567. Maximal Dual-Sockel Workstations sind möglich, das kannst du beim Hersteller alles nachlesen ;)
 
Wenn jemand von Multi-CPU Server schreibt, verstehe ich darunter nicht das 2 Sockel das Maximum darstellen ;) Zumal für Server eben explizit der genannte LGA1567 vorgesehen ist.
Die Diskussion sollte aber ebenfalls im Nehalem-Thread fortgesetzt werden.

Siehe meine Kritik am Guru3d Artikel:

1. Testen gegen einen E8400 -> klar das das da bei zusätzlicher Last durch den Multi-GPU Treiber der Dualcore limitiert. Warum kein Test mit einem Quad? Das macht den Test völlig wertlos bzw. zeigt mal wieder, das es hier nicht um richtiges Testen ging sondern darum, einen gewissen "Effekt" beim Leser zu erzielen.


Wurde jetzt übrigens nachgeholt:

http://www.guru3d.com/article/core-i7-multigpu-sli-crossfire-game-performance-review/19

Man erkennt durch die verschiedenen Auflösungen sehr gut, ab wo das GPU-Limit eintritt - und wie der Yorkfield ohne dieses weggeputzt wird :P
 
Zuletzt bearbeitet:
Ich glaube Undertaket 1 will einfach nur wiedersprechen, irgendwie arm die ganze Herumreiterei hier wieder. Und dazu noch OT.
 
Ich glaube Undertaket 1 will einfach nur wiedersprechen, irgendwie arm die ganze Herumreiterei hier wieder. Und dazu noch OT.

Naja erbsenzählermäßig hat er recht. Intel betitelt die XEON CPUs für 2P Systeme als DP (eben dual processor), alles darüber sind MPs (Multiprozessor) ...

S1366 ist für DP Systeme (oder eben "enthusiast" single CPU Sys.)

Wenn man das aber nicht weiß, kann man aber natürlich landläufig denken und meinen alles über 1 ist "Multi" ... und dann schön aneinander vorbeireden :)

ciao

Alex
 
Zuletzt bearbeitet:
Status
Für weitere Antworten geschlossen.
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh