TEST

#Intel #Xeon-w9-3495X #Sapphire-Rapids #LGA4677 #Test

Intel Xeon w9-3495X im Test

56 P-Cores am Limit - Workstation-Benchmarks: Unreal Engine 5, DaVinci und Stable Diffusion

Von Andreas Schilling
Donnerstag, 06.04.2023 um 13:29 Uhr

Seite 18: Workstation-Benchmarks: Unreal Engine 5, DaVinci und Stable Diffusion

DaVinci Resolve

4K Export mit Filtern

Intel Xeon w9-3495X @ Octa-Channel DDR5-6400

61 XX

Intel Xeon w9-3495X @ Quad-Channel DDR5-6400

61 XX

AMD Ryzen Threadripper PRO 5995WX

69 XX

AMD Ryzen Threadripper PRO 5975WX

152 XX

Intel Xeon W-3175X

155 XX

Intel Xeon W-3275

161 XX

Sekunden

Weniger ist besser

Unreal Engine 5

Shader Compile

AMD Ryzen Threadripper PRO 5995WX

218 XX

Intel Xeon w9-3495X @ Octa-Channel DDR5-6400

222 XX

Intel Xeon w9-3495X @ Quad-Channel DDR5-6400

235 XX

AMD Ryzen Threadripper PRO 5975WX

245 XX

Intel Xeon W-3175X

280 XX

Intel Xeon W-3275

306 XX

Sekunden

Weniger ist besser

Unreal Engine 5

Lightning Build

AMD Ryzen Threadripper PRO 5995WX

104 XX

AMD Ryzen Threadripper PRO 5975WX

125 XX

Intel Xeon w9-3495X @ Octa-Channel DDR5-6400

129 XX

Intel Xeon w9-3495X @ Quad-Channel DDR5-6400

136 XX

Intel Xeon W-3175X

201 XX

Intel Xeon W-3275

214 XX

Sekunden

Weniger ist besser

Im Vergleich zu den bisher maximalen 28 Kernen sind die 56 Kerne des Xeon w9-3495X natürlich ein deutlicher Schritt nach vorne. Je nach Anwendung reicht es aber auch dann nicht gegen die Ryzen-Threadripper-PRO-Modelle. Im Falle der Unreal Engine 5 sogar noch nicht einmal gegen das Modell mit 32 Kernen beim Aufbau der Beleuchtungs-Situation.

Aktuell sind Stable Diffusion und ChatGPT in aller Munde. Theoretisch lassen sich beide AI-Systeme auch lokal ausführen. Bei ChatGPT ist dies per Alpaca/LLaMA möglich. Wie dies funktioniert haben die Kollegen von der c't erst kürzlich gezeigt.

Für Stable Diffusion gibt es bestimmte Voraussetzungen die geschaffen werden müssen, damit das Inferencing auf heimischer Hardware läuft. Für NVIDIA wird CUDA als Schnittstelle verwendet, AMD-GPUs konnten wir gar nicht dazu bewegen zu arbeiten und Intel CPUs und GPUs arbeiten mit Stable Diffusion von OpenVINO. Den Sapphire-Rapids-Prozessoren sollten an dieser Stelle die AMX-Einheiten zur Hilfe kommen, die BF16-Berechnungen beschleunigt ausführen können.

Stable Diffusion

Inference-Latenz

NVIDIA GeForce RTX 4090

4.53 XX

Intel Xeon w9-3495X (BF16)

6.70 XX

Intel Xeon w9-3495X (FP32)

28.53 XX

Sekunden

Weniger ist besser

Das Inferencing auf AI-Modellen ist ein Aspekt, bei dem Intel mit seinen Prozessoren zukünftig eine größere Rolle spielen will. Entsprechend hat man die AMX-Einheiten in den CPU-Architekturen untergebracht. Auch wenn eine GeForce RTX 4090 wie in diesem Beispiel wesentlich schneller aus dem Prompt ein Bild erzeugt, so können wir doch ganz gut sehen, welche Vorteile die Nutzung von BF16 und die Beschleunigung seitens der Hardware bietet.

Seite 17: Spiele-Benchmarks: Cyberpunk 2077 Seite 19: Power- und DDR5-Skalierung

Quellen und weitere Links