TEST

Sparsam aber nur knapp voraus

Founders Edition und ASUS Prime der GeForce RTX 5070 im Test - KI- und Compute-Benchmarks

Portrait des Authors


Bevor wir zu den Sondertests und vor allem den DLSS- und Frame-Generation-Benchmarks kommen, wollen wir noch einen Blick auf die KI- und Compute-Benchmarks werfen.

ON1 Resize AI 2023

Image-Upscaling auf 400 %

in ms
Weniger ist besser

Werbung

Einer dieser KI-unterstützten Benchmarks ist der ON1 Resize AI 2023. Hier skaliert eine KI ein Bild mit 5.712 x 4.284 Pixel um 400 % auf 22.848 x 17.136 Pixel. Der Vorsprung von 10 % gegenüber dem Vorgänger besteht auch zwischen der GeForce RTX 5080 und 4080, aber das KI-Segment in diesem Workload beschreibt auch nicht den kompletten Zeitraum von sieben Sekunden.

Topaz Video AI 6

Benchmark, Artemis x1 Modell

in FPS
Mehr ist besser

Mit Topaz Video AI 6 haben wir zum Start einer neuen Karte immer wieder das gleiche Problem: Offenbar wird das Artemis-Modell von der GeForce RTX 5070 noch nicht unterstützt bzw. die Schnittstelle fehlt. Sollte dies nachgebessert werden, reichen wir die Ergebnisse nach.

Procyon (AI Text Generation Llama 3.1)

Time to first Token (TTFT)

in ms
Weniger ist besser

Procyon (AI Text Generation Llama 3.1)

Output Token Speed (OTS)

in Tokens/s
Mehr ist besser

Der AI-Text-Generation-Test von Procyon zeigt sich da schon deutlich besser angepasst an die neue Hardware. Mit Llama 3.1 als Basismodell, liefert die GeForce RTX 5070 nach dem High-End-Modellen auch der vorherigen Generation die geringsten Latenzen (Time to first Token), aber nicht den analog hohen Durchsatz an Token (Output Token Speed). Hier drückt sich dann eventuell das geringe Speicherinterface aus, welches für ein Inferencing nicht unwichtig ist. Besitzer einer GeForce RTX 5070 sehen sicherlich das Gaming als primäre Anwendung.

Procyon FLUX.1

Image Generation (FP8)

Sekunden / Bild
Weniger ist besser

Procyon FLUX.1

Image Generation (FP4)

Sekunden / Bild
Weniger ist besser

Analog zur Textgenerierung haben wir auch die Bildgenerierung unter die Lupe genommen. Die GeForce-RTX-50-Serie unterstützt nativ FP4, eine niedrigere Quantisierungsmethode, die mit einer Dateikomprimierung vergleichbar ist und Modellgrößen reduziert. Im Vergleich zu FP16, dem Standard vieler Modelle, benötigt FP4 weniger als die Hälfte des Speichers und ermöglicht auf dem Papier eine bis zu doppelt so hohe Leistung im Vergleich zu FP8. Dank der zusätzlichen Quantisierungsmethoden des NVIDIA TensorRT Model Optimizers kann FP4 ohne größere Qualitätsverluste angewendet werden.

Für die GeForce RTX 5070 konnten wir den Test mit FP8 nicht laufen lassen. Es kam immer zu einem Absturz und nur mit den FP4-Daten sind wir zu einem Ergebnis gekommen. Somit fehlt uns der Vergleich zwischen FP8 und FP4, aber immerhin sehen wir, dass die GeForce RTX 5070 für FP4 im erwarteten Leistungsbereich liegt.

Compute-Benchmarks

Aufgrund der knappen Zeit mit der Hardware haben wir uns bei den Compute-Benchmarks auf ein V-Ray konzentriert.

V-Ray 6

CUDA

in Punkten
Mehr ist besser

V-Ray 6

RTX

in Punkten
Mehr ist besser

Über die CUDA-Schnittstelle angesprochen, fehlt es hier offenbar noch an der notwendigen Optimierung auf die Blackwell-Architektur. Schon deutlich besser sieht es im RTX-Test aus, wo die GeForce RTX 5070 dann vor einer GeForce RTX 4070 Super liegt, deren GPU-Ausbau ja deutlich größer ausfällt.

DaVince Resolve

AV1 in 4K Decoding

in s

Zum Abschluss der Workstation-Benchmarks schauen wir uns noch DaVinci Resolve Studio 19 an. Hier wird eine 4K-Videodatei-Rohdatei als im AV1-Codec in 4K-Auflösung überführt und die Zeit gemessen. Während die Radeon-RX-7000-Karten hier sogar schneller als die Modelle der GeForce-RTX-40-Serie waren, sind nur die beiden schnellsten Modelle der GeForce-RTX-50-Serie mit ihren Dual-Encodern an der Spitze zu finden. Eine GeForce RTX 5070 benötigt hier einiges mehr an Zeit, ist aber deutlich schneller als eine GeForce RTX 4070.

Back to top