TEST

NVIDIA GeForce RTX 4090 Laptop

Das neue Mobile-Flaggschiff im Test - Technik und Features

Portrait des Authors


Werbung

Den neuen mobilen GeForce-Chips dient die Ada-Lovelace-Architektur als Basis, die NVIDIA bereits im Oktober des vergangenen Jahres für den Desktop einführte. Im Vergleich zur Ampere-Generation wurde sie in einigen Details optimiert, die überwiegend die RT und Tensor Cores, mithilfe derer NVIDIA Techniken wie Raytracing oder DLSS erst möglich macht, betreffen. 

Beim Aufbau selbst hat sich wenig getan. Es gibt weiterhin FP64- und FP32/INT32-Recheneinheiten, die Anzahl wurde jedoch deutlich aufgebohrt. Grundsätzlich unterteilt NVIDIA seine Chips in Graphics Processing Cluster (GPC), die wiederum weitere Funktionseinheiten wie die bekannten Streaming-Multiprozessoren (SMs), Textur-Processing-Cluster (TPCs), Geometrie-Einheiten und Raster-Operation-Units (ROPs) beinhalten. In den einzelnen SMs werden 64 dedizierte FP32- und 64 geteilte FP32/INT32-Recheneinheiten genutzt.

Im Vollausbau bietet Ada Lovelace zwölf GPCs, statt wie bisher sieben bei Ampere, womit sich die Zahl der SMs von 84 auf maximal 144 erhöht, was theoretisch in bis zu 18.432 sowie 144 RT-Cores und 576 Tensor-Cores resultieren kann. Der L1-Cache ist weiterhin 128 kB groß, der L2-Cache wächst je nach Konfiguration auf eine Kapazität von bis zu 98.304 kB und kann somit fast 100 MB groß ausfallen. 

Die RT Cores kommen nun in der dritten Generation zum Einsatz und sollen einen doppelt so hohen Durchsatz wie ihre Vorgänger erreichen können, womit die Rechenleistung auf dem Papier um bis zu 2,8x gesteigert werden kann. Zudem bieten sie neue, spezielle Hardwareeinheiten für besonders anspruchsvolle Raytracing-Workloads. Die Tensor-Cores gehen sogar in die vierte Generation und versprechen einen bis zu 5-fach höheren Durchsatz und sogenannte Optical-Flow-Beschleuniger, die speziell bei DLSS 3 zum Einsatz kommen. Ansonsten nutzt NVIDIA einen dualen AV1-Encoder, der bis zu 40 % effizienter als bei H.264 arbeiten soll.

Ausführlichere Details zur Ada-Lovelace-Architektur gibt es in unserem Launch-Artikel zur NVIDIA GeForce RTX 4090 Founders Edition aus dem Desktop.

Abseits von Gerüchten haben wir den Vollausbau in der Praxis bislang noch nicht gesehen und vor allem im Notebook-Segment greift NVIDIA ohnehin zum Rotstift, um mit Blick auf die Limitierungen bei der Stromversorgung und Kühlung ein ausgeglichenes Verhältnis bieten zu können. 

So ist bei der NVIDIA GeForce RTX 4090 Laptop bereits bei 76 SMs und damit bei 9.728 Shadereinheiten sowie 304 Tensor Cores und 76 RT Cores Schluss. Während die Ada-Chips im Desktop ein Speicherinterface von bis zu 384 Bit bieten und obendrein bis zu 24 GB an schnellen GDDR6X-Speicher bereitstellen, bietet das Mobile-Flaggschiff eine auf 256 Bit beschränkte Speicheranbindung und beschränkt sich auf 16 GB GDDR6, wobei NVIDIA nun auf besonders sparsame Ultra-Low-Voltage-Chips setzt, um die Leistungsaufnahme für den mobilen Einsatz weiter zu drücken. 

Damit entspricht die NVIDIA GeForce RTX 4090 Laptop in etwa einer NVIDIA GeForce RTX 4080 aus dem Desktop, wobei im Vergleich dazu auch die Taktraten etwas abgesenkt werden. NVIDIA spezifiziert einen Boosttakt von etwa 1.455 bis 2.040 MHz. Unser Testmuster erreicht rund 2.010 MHz. Im Desktop können es über 2.500 MHz sein. Die kleineren Ableger machen weitere Einschnitte bei der Anzahl der Recheneinheiten, den Taktfrequenzen und dem Speicherausbau.

Max-Q geht in die fünfte Generation

Der neue Ultra-Low-Voltage-GDDR6-Speicher ist Teil der fünften Max-Q-Generation. Fasste NVIDIA zur Einführung von Max-Q noch speziell selektierte Chips zusammen, die auf Sparsamkeit und Effizienz getrimmt wurden, gelten die Funktionen unlängst für alle Chips und lassen sich entweder von den Boardpartnern entsprechend konfigurieren oder können über die GeForce Experience aktiviert und eingestellt werden.

So werden auch bereits bekannte Features wie der Whisper Mode und der Battery Boost unterstützt. Dabei wird jedoch die Bildfrequenz automatisch begrenzt, um so die Last auf der Hardware zu reduzieren und somit die Kühlung leiser zu machen und den Akku zu schonen. Resizable BAR, bei der die CPU Zugriff auf den gesamten Videospeicher erhält, um so die Performance in Spielen weiter zu erhöhen, ist ebenfalls wieder mit von der Partie. Gleichzeitig kann die TDP von CPU und GPU intelligenter aufgeteilt werden: Bei geringer CPU-Auslastung und hoher GPU-Last kann das System der Grafikkarte etwas mehr Headroom zur Verfügung stellen, um so kurzfristig höhere Geschwindigkeiten und damit eine bessere Performance abrufen zu können, während die ohnehin nicht benötigte Leistung für den Prozessor abgesenkt wird. 

Datenschutzhinweis für Youtube



An dieser Stelle möchten wir Ihnen ein Youtube-Video zeigen. Ihre Daten zu schützen, liegt uns aber am Herzen: Youtube setzt durch das Einbinden und Abspielen Cookies auf ihrem Rechner, mit welchen Sie eventuell getracked werden können. Wenn Sie dies zulassen möchten, klicken Sie einfach auf den Play-Button. Das Video wird anschließend geladen und danach abgespielt.

Ihr Hardwareluxx-Team

Youtube Videos ab jetzt direkt anzeigen

Bei der fünften Generation von Max-Q kommen vier wesentliche Punkte hinzu: DLSS 3, auf das wir auf der nachfolgenden Seite gesondert eingehen werden, High Efficiency On-Chip Memory, Ultra-Low-Voltage GDDR6 und Tri-Speed Memory Control. 

Letzteres ermöglicht dem Grafikprozessor dynamisch in einen neuen Stromsparstatus wechseln zu können, während Ersterer obendrein bei Lastwechseln mehr als zehn Mal so schnell auf Änderungen bei den Stromanforderungen reagieren kann. Vor allem sollen dadurch Lastspitzen, bei der die GPU auch mal deutlich mehr Energie als im Schnitt aufnehmen darf, vorgebeugt werden, wie dies noch bei Ampere häufig der Fall sein konnte. Das gilt gleichzeitig für die Taktraten. Während man seine Desktop-Chips mit schnellen GDDR6X-Speicherchips kombiniert, setzt man bei der mobilen GeForce-RTX-40-Riege auf Ultra-Low-Voltage GDDR6, der obendrein leicht im Takt abgesenkt ist, um geringere Spannungen erreichen zu können, was ebenfalls die Effizienz im Sinne von Max-Q verbessern dürfte. 

Offener wird NVIDIA bei den TGP-Werten. So kann die GeForce RTX 4090 Laptop von den Partnern im Bereich von 80 bis 150 W konfiguriert werden, während man bei der GeForce RTX 4080 Laptop auf bis zu 60 W herunter gehen darf und alle anderen Modelle sogar mit nur 35 W konfiguriert werden können. Das macht die Ada-Lovelace-Generation zwar äußerst flexibel und somit selbst für sehr dünne Geräte einsetzbar, macht am Ende aber auch die Leistungseinschätzung komplizierter: Eine NVIDIA GeForce RTX 4080 Laptop mit 150 W kann eine namentlich schnellere GeForce RTX 4090 mit nur 80 W überholen. 

Eine Kennzeichnung der TGP-Werte bleibt aus Transparenzgründen weiterhin Pflicht – immer mehr Hersteller verpflichten sich zur Angabe dieser Kennzahlen.