TEST

Multi Frame Generation ist beeindruckend

Die GeForce RTX 5090 Founders Edition im Test - KI- und Compute-Benchmarks

Portrait des Authors


Bevor wir zu den Sondertests und vor allem den DLSS- und Frame-Generation-Benchmarks kommen, wollen wir noch einen Blick auf die KI- und Compute-Benchmarks werfen.

ON1 Resize AI 2023

Image-Upscaling auf 400 %

in ms
Weniger ist besser

Werbung

Einer dieser KI-unterstützten Benchmarks ist der ON1 Resize AI 2023. Hier skaliert eine KI ein Bild mit 5.712 x 4.284 Pixel um 400 % auf 22.848 x 17.136 Pixel. Allerdings erledigt die GeForce RTX 5090 diesen Prozess offenbar noch nicht beschleunigt, denn mit etwas über sechs Sekunden ist sie langsamer als eine GeForce RTX 4090. Hier müssen wir laut NVIDIA noch auf eine angepasste Variante der Software warten und testen dann erneut.

Topaz Video AI 6

Benchmark, Artemis x1 Modell

in FPS
Mehr ist besser

Ähnlich auch der Benchmark in Topaz Video AI 6, für den wir uns auch bessere Werte als bei einer GeForce RTX 4080 Super erwartet hätten, diese aber nicht geliefert bekommen. Auch hier fehlt es noch an der Tensor-RT-Unterstützung der Blackwell-Architektur in der Software.

Procyon (AI Text Generation Llama 3.1)

Time to first Token (TTFT)

in ms
Weniger ist besser

Procyon (AI Text Generation Llama 3.1)

Output Token Speed (OTS)

in Tokens/s
Mehr ist besser

Der AI-Text-Generation-Test von Procyon zeigt sich da schon deutlich besser angepasst an die neue Hardware. Mit Llama 3.1 als Basismodell, liefert die GeForce RTX 5090 die geringsten Latenzen (Time to first Token) und auch den höchsten Durchsatz an Token (Output Token Speed). Für das Ausführen lokaler KI-Modelle bietet die GeForce RTX 5090 nicht nur die höchste Rechenleistung, sondern dank 32 GB und 1,8 TB/s auch schnellen Speicher auch damit die weiteren Grundlagen.

Procyon FLUX.1

Image Generation (FP8)

Sekunden / Bild
Weniger ist besser

Procyon FLUX.1

Image Generation (FP4)

Sekunden / Bild
Weniger ist besser

Analog zur Textgenerierung haben wir auch die Bildgenerierung unter die Lupe genommen. Die GeForce-RTX-50-Serie unterstützt nativ FP4, eine niedrigere Quantisierungsmethode, die mit einer Dateikomprimierung vergleichbar ist und Modellgrößen reduziert. Im Vergleich zu FP16, dem Standard vieler Modelle, benötigt FP4 weniger als die Hälfte des Speichers und ermöglicht auf dem Papier eine bis zu doppelt so hohe Leistung im Vergleich zu FP8. Dank der zusätzlichen Quantisierungsmethoden des NVIDIA TensorRT Model Optimizers kann FP4 ohne größere Qualitätsverluste angewendet werden.

Compute-Benchmarks

Aufgrund der knappen Zeit mit der Hardware haben wir uns bei den Compute-Benchmarks auf ein V-Ray konzentriert.

V-Ray 6

CUDA

in Punkten
Mehr ist besser

V-Ray 6

RTX

in Punkten
Mehr ist besser

Über die CUDA-Schnittstelle angesprochen fehlt es hier offenbar noch an der notwendigen Optimierung auf die Blackwell-Architektur. Schon deutlich besser sieht es im RTX-Test aus, wo die GeForce RTX 5090 etwa 33 % vor der GeForce RTX 4090 liegt.

DaVince Resolve

AV1 in 4K Decoding

in s

Zum Abschluss der Workstation-Benchmarks schauen wir uns noch DaVinci Resolve Studio 19 an. Hier wird eine 4K-Videodatei-Rohdatei als im AV1-Codec in 4K-Auflösung überführt und die Zeit gemessen. Während die Radeon-RX-7000-Karten hier sogar schneller als die Modelle der GeForce-RTX-40-Serie waren, ist die GeForce RTX 5090 Founders Edition nun wieder einige Sekunden schneller.

Back to top