Als Treiber haben wir den NVIDIA Quadro-Treiber R384 U4 bzw. den GeForce 388.59 und AMD Radeon Pro Software 17.Q4.1. Für die Render-Benchmarks haben wir zudem die dazugehörigen Software-Pakete wie den Radeon ProRenderer installiert, um die volle Potenzial der Hardware auch umsetzen zu können. Gleiches gilt für die entsprechenden NVIDIA-Pakete.
Luxmark 3.0
Den Anfang macht der Luxmark in der Version 3.0, den wir für die Messung der OpenCL-Leistung verwendet haben. Wir haben die drei Presets für alle getestet und die Samples pro Sekunde als Wert genommen.
Werbung
Blender
Als zweiten Benchmark haben wir Blender gewählt. Hier haben wir den bekannten Blender-Benchmark genommen, also eine vom Entwickler zur Verfügung gestellte 3D-Szene, die berechnet werden muss. Damit Blender auch die GPU für das Rendering verwendet, muss in den Einstellungen die dazugehörige Hardware in Form der GPU ausgewählt werden. Auch in den Render-Einstellungen ist die Auswahl der GPU als Rechenhardware notwendig. Zudem haben wir die Batch-Size, also die Größe der Kachel die pro Thread berechnet wird, von 16 auf 256 Pixel erhöht. Dies kommt der Vorgehensweise einer GPU mit mehreren hundert oder gar tausend Shadereinheiten entgegen. Aufgenommen haben die Dauer in Sekunden, um die Szene vollständig zu berechnen.
Adobe After Effects
Adobe After Effects haben wir verwendet, um unser Intro für die Videos in 4K-Auflösung mit Alphakanal zu rendern. Üblicherweise rendern wir das Intro für die Messen einmal neu und verwenden dann für alle zukünftigen Videos eben dieses Pre-Rendered-Intro. Aufgenommen haben wir die Dauer in Sekunden, um die Szene vollständig zu berechnen.
V-Ray Benchmark
Weiter geht es mit dem V-Ray Benchmark. Dabei handelt es sich um einen synthetischen Benchmark der Chaosgroup, die als Macher des Plugins V-Ray für zahlreiche 3D-Render-Pakete bekannt sind. Auch hier wird wieder die Dauer in Sekunden zur Fertigstellung der Szene aufgenommen.
Unreal Engine Infiltrator Rendering
Eine weiterer, eher praxisorientierter Vergleich ist sicherlich das Rendering der Infiltrator-Demo in der Unreal Engine 4. Die Infiltrator-Demo wurde von NVIDIA häufiger bei Produktpräsentationen gezeigt und konnte lange Zeit nicht in Echtzeit ausgeführt werden. Um alle Assets und 3D-Modelle in einer lauffähigen Demo zu aus dem Unreal-Engine-Editor zu starten, benötigt viel Rechenleistung. Wir haben wieder die Zeitdauer aufgenommen.
[h3]GPUPI[/h3]
GPUPI verwendet die OpenCL-Schnittstelle, um per Bailey-Borwein-Plouffe-Formel eine Berechnung der Kreiszahl ? (Pi) durchzuführen. Die eigentliche Berechnung wird in einzelne Batches aufgeteilt und das Ergebnis im hexadezimalen Format ausgegeben. Die Batches bestehen wiederum aus einzelnen Berechnungen der BPP (Bailey-Borwein-Plouffe-Formel). Diese können als hunderte oder gar tausende Threads auf die einzelnen Shader einer GPU aufgeteilt werden. Der Benchmarks bzw. die Berechnung ist stark von der FP64-Leistung der GPU abhängig – zeigt also auch die entsprechenden Vor- und Nachteiler einer Architektur auf.