Multi Frame Generation ist beeindruckend Die GeForce RTX 5090 Founders Edition im Test - KI- und Compute-Benchmarks

5270XX

5753XX

8101XX

8268XX

8782XX

9615XX

9966XX

10358XX

10464XX

10686XX

10745XX

13449XX

in ms

Weniger ist besser

Einer dieser KI-unterstützten Benchmarks ist der ON1 Resize AI 2023. Hier skaliert eine KI ein Bild mit 5.712 x 4.284 Pixel um 400 % auf 22.848 x 17.136 Pixel. Die GeForce RTX 5090 ist schneller als der Vorgänger, aber nicht so schnell, wie sich viele dies erwarten würden in diesem Segment.

Topaz Video AI 6

Benchmark, Artemis x1 Modell

49.1XX

47.58XX

32.95XX

32.73XX

28.08XX

25.4XX

24.17XX

23.47XX

22.52XX

21.37XX

19.61XX

14.06XX

in FPS

Mehr ist besser

Mit einer angepassten Version des Topaz Video AI 6 erreicht die GeForce RTX 5090 die erwartete Leistung, wenngleich auch hier der Vorsprung nicht ganz so groß ist, wie man dies erwarten würde.

Procyon (AI Text Generation Llama 3.1)

Time to first Token (TTFT)

0.2XX

0.26XX

0.32XX

0.34XX

0.36XX

0.37XX

0.37XX

0.41XX

0.47XX

0.85XX

0.93XX

1.36XX

in ms

Weniger ist besser

Procyon (AI Text Generation Llama 3.1)

Output Token Speed (OTS)

208.62XX

142.55XX

125.4XX

116.53XX

114.63XX

112.74XX

108.6XX

103.45XX

102.39XX

94.44XX

82.63XX

77.51XX

in Tokens/s

Mehr ist besser

Der AI-Text-Generation-Test von Procyon zeigt sich da schon deutlich besser angepasst an die neue Hardware. Mit Llama 3.1 als Basismodell, liefert die GeForce RTX 5090 die geringsten Latenzen (Time to first Token) und auch den höchsten Durchsatz an Token (Output Token Speed). Für das Ausführen lokaler KI-Modelle bietet die GeForce RTX 5090 nicht nur die höchste Rechenleistung, sondern dank 32 GB und 1,8 TB/s auch schnellen Speicher auch damit die weiteren Grundlagen.

Procyon FLUX.1

Image Generation (FP8)

6.42XX

10.812XX

15.459XX

Sekunden / Bild

Weniger ist besser

Procyon FLUX.1

Image Generation (FP4)

3.807XX

17.187XX

28.935XX

Sekunden / Bild

Weniger ist besser

Analog zur Textgenerierung haben wir auch die Bildgenerierung unter die Lupe genommen. Die GeForce-RTX-50-Serie unterstützt nativ FP4, eine niedrigere Quantisierungsmethode, die mit einer Dateikomprimierung vergleichbar ist und Modellgrößen reduziert. Im Vergleich zu FP16, dem Standard vieler Modelle, benötigt FP4 weniger als die Hälfte des Speichers und ermöglicht auf dem Papier eine bis zu doppelt so hohe Leistung im Vergleich zu FP8. Dank der zusätzlichen Quantisierungsmethoden des NVIDIA TensorRT Model Optimizers kann FP4 ohne größere Qualitätsverluste angewendet werden.

Compute-Benchmarks

Aufgrund der knappen Zeit mit der Hardware haben wir uns bei den Compute-Benchmarks auf ein V-Ray konzentriert.

V-Ray 6

CUDA

7745XX

5109XX

5086XX

4891XX

4286XX

3661XX

3622XX

3475XX

3037XX

in Punkten

Mehr ist besser

V-Ray 6

RTX

14764XX

11000XX

7629XX

7594XX

6478XX

5512XX

5288XX

5011XX

4388XX

in Punkten

Mehr ist besser

Über die CUDA-Schnittstelle angesprochen fehlt es hier offenbar noch an der notwendigen Optimierung auf die Blackwell-Architektur. Schon deutlich besser sieht es im RTX-Test aus, wo die GeForce RTX 5090 etwa 33 % vor der GeForce RTX 4090 liegt.

DaVince Resolve

AV1 in 4K Decoding

118XX

151XX

154XX

155XX

186XX