Die haben die AVX512-Instructions genutzt - aber du sprichst genau das an, worauf ich hinaus will. Du präsentierst hier synthetischen Benchmarks - und ich zeige, dass es in Real World Szenarios zu deutlichen Leistungseinbrüchen kommen kann. Gerade das wird auf nicht ideale Compiler-Parameter und deutlich geringere Taktfrequenzen in der Server-Welt zurückgeführt. Deswegen das schlechte abschneiden, das man so in der Realität beobachten kann.
Also du bezeichnest SPECfp als reales Szenario?
In der realen Welt gibt es viele verschiedene Anwendungen. Ist es da nicht eher abwegig solche pauschalen Aussagen zu treffen wie "Da geht es rein um Leistungswerte. Und da kann der Intel einzig und allein in SingleThread-lastigen Anwendungen punkten.", wenn doch bekannt ist, dass Intel bei AVX besser dasteht?
Auch gibt es genügend Anwendungen, welche eher unter die Rubrik
SingleThread-lastig fallen. Keine Ahnung, warum du ständig versuchst dies so krampfhaft als negativ darzustellen, dass Intel dabei besser ist..
Gerade die reale Welt besteht nicht nur aus voll parallelisierten Anwendungen, welche beliebig über x Threads skalieren, wo AMD dann mit dem höheren Core Count überall schneller ist..
Achja und wenn es bei einer Anwendung auf die bestmögliche Performanz ankommt, dann wird die - wenn möglich - auch auf der entsprechenden Maschine mit den entsprechenden Compiler-Flags kompiliert, eben um auch so noch paar Prozent herauskitzeln. Was meinst du wohl, warum die da aus deinem verlinkten Artikel SPECfp und SPECint selbst kompiliert haben und sich nicht einfach irgendwelche precompiled-binaries irgendwoher besorgt haben?
Nein, u.a. durch AVX, nicht nur.
Eigentlich gilt doch eher die Regel, dass AMD nur schneller ist, wenn sie eine höhere Anzahl an Kerne liefern und die Anwendung über all diese skaliert. Sonst ist Intel so gut wie immer schneller.
Eigentlich passiert dies ja irgendwie nur bei dem 7980x. Dies ist der einzige starke Ausreißer, welcher die TDP stärker übersteigt. Die anderen CPUs liegen entweder unter der Grenze oder leicht darüber.
Die kleineren CPUs supporten ja auch nur AVX2 und nicht AVX512. Daher fallen die Ergebnisse nicht ganz so stark aus, wie bei CPUs, welche auch noch AVX512 supporten. Dies hat also nichts damit zu tun, dass
die an ihre TDP gebunden werden.
Schwacher Versuch. Du bist immer noch den Beweis schuldig, dass Anandtech bei dem Bench, welchen ich verlinkt hatte, die Einstellungen so verändert hat, dass die Offsets ignoriert werden und die CPUs nicht den Takt abgesenkt haben. Danach hatte ich dich ja auch explizit gefragt.
Wie will Intel das lösen? Mit einem I/O-Chip auf dem Package?
Die werden sich das bei AMD jetzt erst einmal in Ruhe ab/nschauen und wenn das fruchtet, warum nicht?
Andere Möglichkeiten wäre noch am Mesh und den Caches zu schrauben.
Das Bandbreiten-Problem entsteht, weil in der "realen Welt" das AVX natürlich auch zum Tragen kommt - aber so eine Maschine niemals alle Ressourcen einzig und allein für die AVX-Anwendung freihält. Sobald auf dem Server mehr los ist als diese eine AVX-Anwendung, geht die Bandbreite in die Knie und AVX bringt dir nur noch einen Bruchteil der Leistung.
Soll ich dir ein kleines Geheimnis verraten?
Wenn nicht alle Kerne mit AVX belastet werden, dann taktet die CPU auch nicht so stark herunter. Also brauchst du dir nicht mehr so viel Sorgen um den Takt machen, welcher in den Keller geht.
Diesen ganzen Benchmark-Kiddies wie dir zu zeigen, dass die Benchmarks in der "realen Welt" für die Füße sind, weil diese Idealbedingungen niemals zutreffen. Die Benchmarks sind eine schöne, graue Theorie. Aber die Realität sieht eben anders aus.
Du bist doch derjenige, der hier ständig versucht Leute zu mit realitätsfernen Benchmarks und Rosinenpickerei zu bekehren, wenn du nicht gerade auf Sicherheitsexperte machst und ein Märchen nach dem anderen erfindest.