Hallo,
ich habs nun gewagt und mich tatsächlich mit dem Thema beschäftigt, wieviel SMT bei einem Intel 6-Kerner bei einer BigADV-WU bringt.
CPU: Core i7-980x@4015 MHz, Uncore 3533 MHz
RAM: DDR3-1600 7-8-7-20
Projekt: P2685
zum SMP-Client parallel laufende Clients: keine
Zuerst hab ich mal eine WU mit SMP=6 gestartet (SMT blieb dabei aktiv):
Als Vergleich bei der TPF und der PPD bei 12 Threads hab ich die Mittelwerte aus 5 WUs herangezogen:
Durch SMT sinkt die TPF nur um 17,4 %. Zuletzt bin ich ja davon ausgegangen, dass es 40 % sein könnten.
Aufgund des Bonusprogramms gewindet die PPD mit 31,3 % stärker.
Mir ist aber direkt die ungleichmäßige Verteilung auf die Kerne aufgefallen.
Darum hab ich mal eine Weile mit Everest mitgeloggt.
Hauptsächlich wurden zwar nur 6 der 12 Kerne benutzt.
Wenn man die Aulastung von Kern 0 und 1 (2 und 3, ....) zusammen zählt, dann sollten es zum gleichen Zeitpunkt nie mehr als 100 % sein,
sofern Windows immer nur einen der beiden Kerne nutzt, der zu einem physikalischen Kern gehört.
Im Mittel sinds bei den ersten 4 Kernpaaren aber jeweils ca. 105 % und bei den letzten beiden nur ca. 95 %.
Windows scheint von den physikalischen Kernen 5 und 6 bei nur 6 Threads dummerweise etwas seltener Gebrauch zu machen.
Hier noch ein Diagramm dazu:
Deshalb hab ich die WU unterbrochen und SMT ausgemacht:
Die TPF sinkt dadurch weiter:
Bei einem Gulftown 6-Kerner reduziert sich somit bei dieser BigADV-Wu durch die Aktivierung von SMT und die Nutzung von 12 Threads die TPF um ca. 13 %. Die PPD steigt um 21 %, wodurch sich die Effizienz um 10,4 % verbessert, weil der Verbrauch nur um 9,9 % ansteigt.
Allerdings hab ich die Spannung nicht gesenkt. Damit könnte der Verbrauch ohne SMT besser ausfallen, wodurch die Effizienzänderung geringer ausfallen würde.
Bei einem 6-Kerner und den aktuellen BigADV-WUs macht SMT somit weniger aus, als ich gedacht hatte. Auf der anderen Seite sinds ja nicht wirklich mehr physikalische Kerne.
Man könnte auch den Schluss ziehen, dass F@H sehr gut in der Lage ist einen Intel 6-Kerner auszulasten.
Mich würden jetzt noch die TPF eines Phenom X6 bei einer BigADV-WU (Projekt und Taktraten bitte mit angeben; im Idealfall ohne GPU-Client) und eines Core i7-2600k, bei dem ebenfalls nur mit 4 Threads bei deaktiviertem SMT gefaltet wird, interessieren.
ich hab im Diagramm von vor ein paar Seiten noch einen Verlauf für die Gesamtdauer einer WU ergänzt:
ciao Tom