Das zeigt nur das Paradoxon, in dem Intel festhängt.
Sie machen groß Werbung mit AVX512, aber keiner interessiert sich dafür.
Das ist eindeutig falsch. Im HPC Umfeld ist AVX512 sehr wichtig. Allerdings hat Intel momentan das Problem, dass AMD sowohl bei der AVX2 Implementierung wie auch bei der Zahl der Cores deutlich besser geworden ist. D.h. wenn man die theoretische Leistungssteigerung von EPYC zu EPYC2 betrachtet, hat sich die Leistung vervierfacht. Einmal durch die Verdoppelung der Cores, einmal durch die bessere Implementation von AVX2, d.h. ein AVX2 Befehl pro Takt anstatt einen pro zwei Takte. Das bringt je Faktor zwei. Dadurch ist AMD nun im Bereich von Intel vorgestoßen. Da durch die höhere Corezahl AMD bei Integerrechnungen Vorteile hat, ist es unterm Strich zurzeit so, dass AMD das bessere Angebot macht. Allerdings muss man das ganze komplett durchrechnen. Hier im Forum wird gerne nur der CPU-Preis genommen, der ist aber nahezu unwichtig, weil man immer komplette Knoten benötigt. Braucht man viel RAM, spielt der CPU Preis faktisch keinerlei Rolle mehr.
Und von der GPU-Seite kommt auch Gegenwind. Und eine RTX8000 mit ihren 48GB hat trotz "RAM-Limit" eine brutale Geschwindigkeit bei wissenschaftlichen Berechnungen.
Eine RTX8000 ist extrem langsam bei HPC Rechnungen, man kann nur bestimmte HPC-Rechnungen darauf ausführen, die mit einfacher oder halber Genauigkeit laufen. Für etliche Problem bräuchte man aber QuadruplePrecision (128Bit), die gibt es aber bisher nur in Software für CPUs, wenn man einmal von den alten HP-PAs absieht, die QuadruplePrecision in Hardware rechnen konnten. Für DoublePrecision (das ist der Standard im HPC) muss man die nVidia GV100 nehmen. Wenn man das RAM Problem in Zusammenhang mit den GP100 bzw. GV100 verringern will, muss man zu einer POWER9 Maschine greifen, weil bei der es möglich ist die CPU und die GPU per NVLink zu koppeln und so deutlich mehr Bandbreite zwischen Hostspeicher und GPU-Speicher bekommt.
GV100 (NVLink) DP: 8,7TFlops; SP: 15,7TFlops; HF (ich habe keine Zahlen auf die schnelle gefunden, es müsste aber das doppelt der SP Leistung sein)
RTX8000 DP: 0,5TFlops; SP 16,3TFlops; HP 32,6TFlops
Nachtrag: Die RTX Karten sind im Gegensatz zu früher bei DP nicht verkrüppelt, die Karte haben nur sehr wenige DP Einheiten drauf.
- - - Updated - - -
@fortunes
Nicht um sonst möchte Intel im HPC GPU Bereich mitmischen!
Aber der Holt512 weiß das besser....
Nicht nur Intel denkt so.
- - - Updated - - -
Ich wetter der hat nie Leben eine Zeile Quellcode für GPUs geschrieben, sonst wäre ihm der nächste Nachteile nämlich auch sofort aufgefallen, denn während man AVX512 durch Compilerflags aktivieren kann, geht dies bei der GPU Programmierung nicht so einfach.
Man merkt in diesem im Forum stark an, dass die meisten keinerlei Erfahrung mit HPC Programmierung haben, und wohl mit Programmierung im allgemeinen auch nicht. Dazu wissen sie nicht wie man HPC-Knoten kauft, und überbewerten die CPU-Preise maßlos. Ich kann mich an ein Gespräch mit einem Admin aus einer Arbeitsgruppe eines MPIs erinnern, in dem dieser erklärte weshalb sie Quadsocket Opterons gekauft hatten, obwohl die damaligen Xeon E5 drastisch schneller gerechnet haben. Diese Gruppe machte Gensequenzierung und musste anschließend die Gene mit einer Datenbank abgleichen. Die Opterons konnten ausreichend RAM (1TB!) aufnehmen, so dass die komplette DB im RAM gecached werden konnte. Das lief dann trotz der deutlich langsameren AMD CPU Faktor 50 o.ä. schneller als auf den Xeon E5, weil in die nicht ausreichend RAM reinpaßte und die Festplatten zu langsam waren. Das sind aber so Dinge, die hier keiner verstehen will. Wichtig ist nur AMD gut, Intel schlecht.