Und nein @Opteron, die Liste der supporteten CPUs sagt dazu nichts aus - denn es besteht kein Grund, warum auch auf einer zum Release noch nicht bekannten CPU bestimmte, grundsätzlich unterstützte, SSE-Modi nicht genutzt werden sollten. Andernfalls hätten ja unzählige, stark von SSE profitierende Programme arge Performanceprobleme auf neuen, zum Erscheinungszeitpunkt noch nicht bekannten, CPUs.
Bei SSE hast du prinzipiell recht ... wobei da wieder das bekannte Intel Compiler Problem zuschlägt .. ausser Maxon hat das rausgepatcht .. das weiss aber keiner.
Ansonsten bezog sich meine "Optimierung" u.a. auf die angesprochene Architekturoptimierung. Man muss immer zw. Befehlssatz- und Architekturtuning unterscheiden.
So wie ich das sehe, jonglierst Du nur mit den unterschiedlichen SSEx Versionen. Da reden wir quasi aneinander vorbei. Dachte das wäre oben schon mit meiner Cache Bemerkung genügend konkretisiert gewesen, aber jetzt sollte es wirklich deutlich sein
Nochmals anders formuliert. Falls AMD den (echten) Intel SSE2 Codepfad (mit 128bit MOVx) *ohne* K8 Optimierungen bekommt, dann sollte das ganz gut laufen.
Das dürfte aber unwahrscheinlich sein, da da sicher ne CPUID Abfrage nach AuthenticAMD im Code ist.
In dem Fall reduziert sich die Wahrscheinlich auf guten (Intel) SSE2 Code für den K10 auf den Fall, dass Maxon gar nichts extra für den K8 optimiert hat.
Auch nicht sooo unwahrscheinlich ;-)
Der i7 läuft natürlich mit den neusten SSEx Versionen, das regelt der Intel Compiler, aber architekturbedingte Optimierungen, z.B. auf den kleineren L2 und den größeren, shared L3, oder den verbesserten LoopCache kannst Du nicht erwarten
Da liegt ggf. noch i7 Leistung brach, je nachdem wieviel Cache Misses der aktuelle Code mit dem kleinen L2 produziert.
ciao
Alex