Ja stimmt, das mit den Pinnen der Threads ist ne feine Sache, gibt auch ein fertiges Tool dazu (Link & Namen hab ich leider vergessen).Moin Moin. Auch wenn das mit dem Threadtitel nicht viel zutun hat (ich will mich in die Diskusion nicht wirklich einmischen ) - mal kurz was zum Thema Threads und SMT.
Wir haben doch grundsätzlich zwei Möglichkeiten:
a) es können mehr als 4 logische CPUs ausgelastet werden - dann ist HT von Vorteil
b) es können (incl. Treiber und OS-Last) höchstens 4 Threads ausgelastet werden - dann KANN SMT von Nachteil sein
Der Nachteil im Fall b) ergibt sich daraus, dass sich der Workload ungleichmäßig auf die Kerne verteilt und sich auf einem Kern Threads Ressourcen teilen, während ein anderer garnicht ausgelastet ist.
Die Lösung ist aber ganz einfach, indem man die spiel.exe auf je eine logische CPU der Kerne bindet. Das richtet man ein mal ein und fertig. Dann bringt HT wieder Vorteile, da der Taskscheduler andere Lasten verteilen kann, ohne der spiel.exe Ressourcen zu klauen.
Laut Gerüchten soll Win7 auch selbst so schlau sein, und ersteinmal die Threads gleichmäßig auf die "echten" Kerne verteilen, bevor es einen Kern per HTh doppelt belegt.
Mal schauen, was das am Ende bringt.
Was meinst Du mit L8 ?Mit dem Cache hat das alles nur bedingt zutun. Der L8 des i7 ist so schnell, dass der kleine L2 gegenüber anderen Architekturen nicht nachteilig ist.
L2 oder L3 ?
Gibt ein paar Marketingfolien von Intel, dass der L2 so suuper schnell sei und das dehalb nichts ausmachen würde, aber das ist nicht mehr als das was es ist .. Marketing.
Irgendwie muss man ja versuchen den Leuten den Witz L2 zu verkaufen, der plötzlich nur noch 1/12 der alten Größe (pro Kern) hat.
Der kleine L2 ist einfach eine Effekt der Designentscheidung weiterhin inklusiv Caches zu verbauen. Da ist dann nicht mehr drin, da sonst der Verschnitt des L3 zu groß werden würde.
Die inklusive Cache Entscheidung kam aufgrund der eindeutigen Serverausrichtung zustande. Intel spart sich da ne Menge coherent Traffic. Da die Daten im L3 vorliegen, muss nicht der L2 abgefragt werden. In ner Multiprozessorumgebung ein Vorteil.
Aber auch bei AMD gibts eine Lösung für das Dilemma: Snoopfilter. Die hat AMD seit 2005 auf der Roadmap, und nun kommen die endlich im Istanbul 6 Kern ... Zeit wirds.
Das ein kleinere L2 Cache dann schneller angebunden werden kann, ist nur ein "Abfallprodukt". Viel ist es ausserdem eh nicht, so 9-10 Takte, der alte 6MB L2 war bei 13-14 Takten.
Frohe Ostern
Alex
Zuletzt bearbeitet: