monolithische Kerne durch FSB im Nachteil ?

Einste1n

Neuling
Thread Starter
Mitglied seit
08.04.2007
Beiträge
15
Hi,

ich möchte mir diese Woche ein neues System kaufen. Im Blick habe ich den Q9550. Dabei stieß ich auf folgenden Artikel :

Nachdem wir auf dem Intel Developer Forum von Intel selber bereits mittels VTune gezeigt bekamen, dass der FSB nur eine Auslastung von 10 bis 20% in einigen Anwendungen besaß, wollten wir diesen Umstand selber messen. Aufgrund der vorgezogenen Vorstellung des Core2 Extreme QX6700 auf den heutigen 2. November ist uns eine aussagekräftige Bestimmung mit VTune leider nicht mehr zeitlich möglich gewesen. Den eigenen Beweis müssen wir also zu einem späteren Zeitpunkt angehen.

Quelle : http://www.hardwareluxx.de/cms/artikel.php?action=show&id=488&seite=2

Nun sind zwei Jahre vergangen und mich würde dieses Ergebnis doch sehr interessieren. Vergleicht man die aktuellen AMD 4 Kerner mit den "alten" Intel 4 Kernern die ja eigentlich gar keine echten 4 Kerner sind, ist AMD trotzdem im Nachteil. Also ist dieser Flaschenhals garkein Flaschenhals oder ist die Leistungsminderung dadurch nur so gering das es eigentlich garnicht ins Gewicht fällt ?

Eine weitere Frage die ich mir Stelle ist, dadurch das die aktuellen Intel 4 Kerner ja monolithisch sind und die zukünftigen aber auch nativ arbeiten, wird Software die auf 4 Kerne optimiert ist, dann für beide CPU Generationen 4 Kerne nutzen oder nur auf einer ? Oder ist der Software das eigentlich egal, Hauptsache 4 Kerne, egal wie die angesteuert werden ?

mfg
Einste1n
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
eine frage ist außerdem, brauchst du 4 kerne?
 
die fsb limitierung kann man bei 4-sockel systemen deutlich spüren (sind ja dann 8 dual cores miteinander und dem speicher über fsb vernetzt)

darum war und ist amd bis zur veröffentlichung der nehalem-basierten xeons hier im vorteil (die kommen erst nächstes jahr)

innem desktop system isses bei spielen und "normalen" anwendungen egal, speicherlastige und latenzkritische programme haben aber auch hier nachteile(die sowieso kaum ein ottonormal user nutzt)
 
@bawde
sicherlich!
während heut zu tage Dual Cores beide Kerne ausgelastet sind, dümpeln Quadros noch vor sich hin ;) ... Da der Q9550 immerhin eine Taktfrequenz von 2,82 Ghz hat, sollte er auch bei nicht optimierten Spielen/Software ordentlich laufen. Und wenn in Zukunft dann die erste Software mit Unterstützung von 4 Kernen erscheint, sollte er einem Dual Kern weit aus überlegen sein!

Als ich damals meinen Rechner angeschafft hatte, stand ich auch vor der Entscheidung. Dual oder Single Core. Ich hab damals einfach die Effektivität von Dual Kern unterschätzt und mir einen Single Core geholt. Das war ein Fehler den ich nicht wiederholen möchte. Ich denke daher das der Quadro noch viel Luft nach oben hat und die Duals zwar aktuell noch mithalten können bzw. in höheren Taktraten sogar überlegen sind, aber das sich das Blatt schon bald wenden wird.

Die Frage ist halt nur wie groß der Flaschenhals ist und wie sich Software verhält die auf 4 Kernen programmiert ist (ob ihr das egal ist ob nativ oder monolithisch)

@clonez
4 Sockel Systemen ? 8 Cores ? ... hinkt der vergleich nicht etwas ? Schließlich bedeuten 4 Sockel als 8 Kerne im vergleich zu 1 Sockel mit jeweils 2 getrennten Kernel ja einen ziemlich großen unterschied. Die Belastung von 4x2 Kernen die getrennt über FSB kommunizieren musst doch auch 4 mal größer sein als bei 2x2 Dual Kernen oder ?

mfg
Einste1n
 
Zuletzt bearbeitet:
Die Frage ist halt nur wie groß der Flaschenhals ist und wie sich Software verhält die auf 4 Kernen programmiert ist (ob ihr das egal ist ob nativ oder monolithisch)

die sw wird nur multithreaded programmiert und nicht nativ oder monolithisch. soll heissen, es ist letztendlich egal. es mag evtl. einen performanceunterschied geben, aber dieser ist, jedenfalls im 'normalo-user'-bereich, eigentlich zu vernachlässigen.
 
Zuletzt bearbeitet:
Eine FSB Limitierung spürt man nur bei Software mit hoher Inter-Prozess Kommunikation. Wenn da ein Thread in Core 0 / Die 0 was aus dem Cache von Core 4 / Die 1 haben will, dann geht das zuerst zum Chipsatz und dann wieder zurück. Natürlich nicht optimal.

Aber wann ist das schon der Fall ?

Bei Streaming Anwendungen rechnet jeder Kern für sich unabhängig an seinem Teil der z.B. DVD -> H.264 Berechnung, bei boinc das gleiche, dito cinebench / Rendering. #

Bei Spielen gibts im Moment max. 2 Threads die sinnvoll ausgelastet sind, kA ob der OS Scheduler da so schlau ist, das erkennt und die dann auf dem gleichen Die laufen lässt.

Aber wie auch immer .. es läßt sich feststellen, dass irgendein Nachteil, sollte es Ihn geben, bei aktueller 08/15 Software nicht zu Tage tritt.

Aja ne andre Limitierung gibts noch, wenn man I/O intensive Anwendungen hat, z.B. (Triple) SLi, Raid X mit Y Platten etc., das ist dann wieder ne andre Geschichte, und tritt im Normalbetrieb auch eher selten auf.

ciao

Alex
 
vielen Dank für Eure Antworten! Das bringt mich schon mal weiter und bestätigt mich das ein Quadro für die Zukunft besser ist. Ich habe noch einen interessanten Artikel in der ct gefunden, worum es unter anderem auch um die Sklalierungseffekt von Multicore CPUs geht.

Schließlich schrumpft in vielen Fällen auch der sogenannte Skalierungseffekt mit der Zahl der Prozessorkerne. Beim Rendering-Programm Cinema4D etwa leisten zwei Core-2-Kerne ungefähr das 1,9-fache eines einzelnen, ein Quad aber lediglich das 3,5-fache. Hier wird übrigens der von AMD so oft herausgestellte Vorteil der „echten“ Vierkerne deutlich: Die Phenom-Kerne kooperieren in diesem Benchmark tatsächlich besser, sein Skalierungsfaktor beträgt fast 3,9. Wegen der pro Kern niedrigeren Performance der bisher lieferbaren Phenoms bei diesem Programm ist aber der Core 2 Quad Q6600 trotzdem schneller ...

http://www.heise.de/ct/08/02/074/

Also wenn ich das also richtig verstehe, läuft dieser Quadro im Vergleich so schnell wie eine 9,9 Ghz Maschine (wenn halt alle Kerne genutzt werden!). Im Gegensatz dazu würde der E8400 nur maximal 5,7 Ghz rausholen. Das sind also ca. 70 - 80 % Mehrleistung für den Quadro.
 
Also das Intel den FSB eigentlich als Flaschenhals sieht, zeigt ja auch dessen Absetzung mittlerweile beim Nahalem. Nachteil der Intel Quads ist im Grunde auch, das die beiden Dualcore DIEs über den FSB kommunizieren, sprich nach Anwendungen kann da gut was an Performance liegen bleiben, wo ein nativer Quad Vorteile hat.

Aus diesem Grund gibts im Serverbereich beispielsweise auch bei guten Boards mehrere FSBs, sprich dort ist jede CPU über nen eigenen FSB an den Chipsatz angebunden. Ändert natürlich nix an der Tatsache, das dort immernoch die Quad oder Hexacore CPUs (mit ihren einzellnen Dualcore DIEs) über den einen FSB kommunizieren, über den sie angebunden sind.

Eins der Hauptprobleme wird wohl auch die Speicheranbindung sein, denn bei FSB gestützen Systemen ist der Speichercontroller extern der CPU untergebracht, und wenn diese Daten aus dem Speicher brauch gehts über den "lahmen" FSB.
Wobei hier beispielsweise die AMD Server Platform das ganze so löst, das jede CPU ihren eigenen Speicher bekommt, sprich schnell Daten dort ablegen/auslesen kann, sobald aber mal Daten aus dem Speicher der anderen CPU geladen werden müssen, dann gehts weiterhin über den verhältnissmäßig lahmen HT Link, was sowohl bei Bandbreite und Latenz erhebliche einbußen zur Folge hat.

Zu dem allerletzen, also das natürlich klar, das der Quad bei Nutzung aller Kerne nem nur wenig höher getakteten Dualcore deutlich überlegen ist.

Bei Spielen gibts im Moment max. 2 Threads die sinnvoll ausgelastet sind, kA ob der OS Scheduler da so schlau ist, das erkennt und die dann auf dem gleichen Die laufen lässt.

ne ist er glaub ich net, also ich kann bei mir nicht wirklich eine Zusammengehörigkeit der Auslastung erkennen. Also wenn ich mir die Temps der einzellnen CPUs und Kerne angucke, dann ist mal die eine, und mal die andere CPU wärmer, sprich mehr ausgelastet. Kommt auch immer noch stark drauf an, was man alles für Last erzeugt, denn trotz gleicher Gesamtauslastung varieren die Auslastungskurven der Einzellnen Kerne recht stark. Eine direkte zugehörigkeit von Thread zu Kern bzw. von ner Gruppe von Threads zu den Kernen gibts net, das wechselt immer.
 
Also wenn ich das also richtig verstehe, läuft dieser Quadro im Vergleich so schnell wie eine 9,9 Ghz Maschine (wenn halt alle Kerne genutzt werden!). Im Gegensatz dazu würde der E8400 nur maximal 5,7 Ghz rausholen. Das sind also ca. 70 - 80 % Mehrleistung für den Quadro.
Heeee? :hmm:

Q6600: 2,4Ghz*3,5=8,4Ghz

Außerdem ist der E8400 pro Mhz etwa 5% schneller.
--> E8400: 5,7*1,05=6Ghz

6 zu 8,4 = ??? ;)


Außerdem... grau ist alle Theorie... die 3,5 kannst du vergessen, da Quads beim Skalierungsfaktor in Games momentan im aller aller aller besten Fall auf 3 kommen. Und das sind echte Extremfälle.
 
Eine direkte zugehörigkeit von Thread zu Kern bzw. von ner Gruppe von Threads zu den Kernen gibts net, das wechselt immer.
Hab ich das irgendwo behauptet ? Da hast Du mich irgendwie falsch verstanden, ich rede nur von Threads .. auf welche Kernen die der OS Scheduler am Ende verteilt intressiert mich nicht wirklich ;)

ciao

Alex
 
@XAlexanderX
ja das mir schon klar, das das theoretische Werte sind. Trotzdem denke/hoffe ich das Quadros noch mehr Luft nach oben hin haben als ein Dual Kern. Schließlich soll der Rechner etwa genauso lange halten wie mein jetziger.
mfg
Einste1n
 
Inwiefern sind monolithische Multicores durch den FSB im Nachteil und gegen wen oder was? Ich kenne keine nicht-nativen monolithischen Multicores, ergäbe auch keinen Sinn. Bei monolithischen CPUs läuft die Intercorekommunikation in der CPU selbst ab, nur nach außen kommuniziert sie über den FSB. Ich sage nicht, daß das nicht auch ein Flaschenhals sein kann, dieser ist bei nicht-nativen Cores in einem Multi-Chip-Package aber viel größer?
 
Hab ich das irgendwo behauptet ? Da hast Du mich irgendwie falsch verstanden, ich rede nur von Threads .. auf welche Kernen die der OS Scheduler am Ende verteilt intressiert mich nicht wirklich ;)

ciao

Alex

Oben schriebst du noch, das du nicht weist ob bei Spielen die von dir genannten 2 Threads OS seitig so gehändelt werden, das diese beiden auf dem gleichen DIE ablaufen.

Und hier kann ich dir sagen, das es nicht wirklich so ist, da das immer und stetig wechselt, zumindest in Windows... Ob sowas mit Linux funktioniert, weis ich nicht, habe auf den beiden Dual CPU Maschinen nur Windows drauf.

Reden wir jetzt aneinander vorbei oder wie?
 
@XAlexanderX
ja das mir schon klar, das das theoretische Werte sind. Trotzdem denke/hoffe ich das Quadros noch mehr Luft nach oben hin haben als ein Dual Kern. Schließlich soll der Rechner etwa genauso lange halten wie mein jetziger.
mfg
Einste1n

Das habe ich schon verstanden. Aber ich habe dir doch aufgezeigt, dass der gigantische Leistungsunterschied, den du gesehen hast in Wirklichkeit recht klein ausfällt. Daher gibt es keinen eindeutligen Sieger, wenn man Stromverbrauch, Wiederverkaufswert etc. pp. mitberücksichtigt. Die Frage Dual oder Quad ist eine Einzelfallentscheidung.
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh