Frage zu CPU leistung und passmark

OwenBurnett

Enthusiast
Thread Starter
Mitglied seit
26.10.2007
Beiträge
883
Ort
Wien
Ich habe mal ne frage zu CPU leistung und insbesondere passmark:
PassMark - CPU Comparison AMD Ryzen Threadripper 2990WX vs Intel Xeon E5-1650 v2 vs Intel i9-7980XE

WIESO!!!

Also der Intel Core i9-7980XE hat 2.6 GHz Basistakt, mit 4.2 GHz boost und 18 kerne.
Der AMD Ryzen Threadripper 2990WX hat 3.5 GHz Basistakt, mit 3.9 GHz boost und ganze 32 kerne!

Der Threadripper müsste doch eigentlich deutlich schneller sein als der Intel.
Ich meine die single thread performancen sind
TR4: 2131
I9: 2341
Ja der I9 ist schneller aber nur ein bisschen, da müsten die +14 kerne des TR4 doch mehr als genug sein um den Intel zu überholen.
In der SingleThread-Leistung sind ja IPC unterscheide etc alle schon eingepreist. Gesamt Leistung ist aber:
TR4: 24338
I9: 27806



Nun was mich aber vollkommen verblüfft mein alter XeonE5-1650v2
hat eine Gesamtleistung von immer noch
XEON: 12723

WTF?!
Damit wäre ich doch wen ich diesen zahlen traue mit einem neuen super teuren 32 kerner TR4 nur knapp 2.5 mal so schnell unterwegs wie mit diesem alten 6 kerner.
Das ist doch Blödsinn!


Kann ich irgendwo realistische Vergleichszahlen bekommen für die MultiTheater-Leistung moderner multicore CPUs?

LG
Owen
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Ich habe mal ne frage zu CPU leistung und insbesondere passmark:
PassMark - CPU Comparison AMD Ryzen Threadripper 2990WX vs Intel Xeon E5-1650 v2 vs Intel i9-7980XE

WIESO!!!

Also der Intel Core i9-7980XE hat 2.6 GHz Basistakt, mit 4.2 GHz boost und 18 kerne.
Der AMD Ryzen Threadripper 2990WX hat 3.5 GHz Basistakt, mit 3.9 GHz boost und ganze 32 kerne!

Der Threadripper müsste doch eigentlich deutlich schneller sein als der Intel.
Ich meine die single thread performancen sind
TR4: 2131
I9: 2341
Ja der I9 ist schneller aber nur ein bisschen, da müsten die +14 kerne des TR4 doch mehr als genug sein um den Intel zu überholen.
In der SingleThread-Leistung sind ja IPC unterscheide etc alle schon eingepreist. Gesamt Leistung ist aber:
TR4: 24338
I9: 27806



Nun was mich aber vollkommen verblüfft mein alter XeonE5-1650v2
hat eine Gesamtleistung von immer noch
XEON: 12723

WTF?!
Damit wäre ich doch wen ich diesen zahlen traue mit einem neuen super teuren 32 kerner TR4 nur knapp 2.5 mal so schnell unterwegs wie mit diesem alten 6 kerner.
Das ist doch Blödsinn!


Kann ich irgendwo realistische Vergleichszahlen bekommen für die MultiTheater-Leistung moderner multicore CPUs?

LG
Owen

1. Der CPU Benchmark von PassMark stammt noch aus Zeiten als Prozessoren zum Großteil 4 Kerne und 8 Threads hatten, der ThreadRipper 2990WX hat 32 Kerne und 64 Threads

2. Selbst Windows 10 hat Probleme mit so viele Threads effizient umzugehen, darum sieht man oft große Unterschiede wenn man zB. Linux benutzt: Linux vs. Windows Benchmarks, Threadripper 2990WX vs. Core i9-7980XE

3. Heutzutage können kaum eine Handvoll Programme die volle Leistung des 2990WX nutzen, bis vor ein paar Jahren hatten selbst High End CPUs gerade mal 1/4 der Kerne und das optimieren ist für Softwareentwickler eine riesige Herausforderung

4. Wegen Punkt 3 laufen viele Programme besser mit einem Prozessor, der weniger aber höher getaktete Kerne mit höherer IPC besitzt, darum ist der i9 7980XE zum Beispiel manchmal schneller als der Threadripper
 
Weil es auch auf die Zusammenarbeit der Kerne untereinander, mit dem Cache ankommt und die Latenzen/Effizienz für den Speicherzugriff. Und bei letzterem ist der TR schlechter, da Speicherzugriffe je nach zugreifenden Kern über die Fiber (die Links, welche Cache, Speichercontroller und die Kerne verbinden) müssen und damit längere Laufzeiten haben können. Stichwort Numa-Architektur. Dafür aber ist dieses modulare Konzept eher erweiterbar und damit einfacher skalierbarer.

Darum ist es z.B. beim Epyc (also der Server-Version) wichtig, alle Speicherkanäle mit Ram zu bestücken. Damit jeder der 4 Dies seinen direkten Speicherzugriff hat. Beim TR 2990WX dagegen haben nur 2 der 4 Dies (und damit 2*8 der 4*8 Kerne) nen aktiven Speichercontroller; die anderen beiden Dies müssen beim Speicherzugriff über die Fabric.
Wenn dir das Betriebssystem dann Tasks auf die Kerne legt, die keine direkte Speicheranbindung haben und diese Threads aber I/O haben, gleichzeitig aber Kerne mit direkter Anbindung idle sind, dann wirds unschön(er) in der Performance.

Das ist auch einer der Gründe, warum der 2950 oft so gut wegkommt. Egal wohin das Betriebssystem die Threads legt, es stehen immer direkte Speicherkanäle zur Verfügung.

Das heisst: die reine Rechenleistung eines Kerns ist nur ein Teil in der Leistung, die bei der Applikation und damit beim User ankommt.
Und es kommt immer auf die Anwendungen an, was die Kiste abarbeiten soll. Manche Aufgaben kann der Epyc/TR mit seiner Architektur effizienter und effektiver abwickeln, bei anderen hat Intel wieder Vorteile.
Is nich soeinfach, das lässt sich nicht einfach auf eine IPC-Zahl, Takt oder einen einfachen Benchmark reduzieren.
 
Zuletzt bearbeitet:
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh