GeForce RTX 4060 Ti und 4060

NVIDIA kündigt neue Mittelklasse-Karten an

Von Andreas Schilling
Donnerstag, 18.05.2023 um 15:00 Uhr

NVIDIA kündigt neue Mittelklasse-Karten an

111

NVIDIA hatte bereits im vergangenen Jahr damit begonnen, das Pferd sozusagen von hinten aufzuzämen und erweitert die GeForce-40-Serie nach den Enthusiasten- und Oberklasse-Modellen nun um die neue Mittelklasse. Gleich drei Karten kündigt man an, zwei sind jedoch bis auf den Speicherausbau nahezu identisch und erhältlich sein wird ab kommender Woche auch nur eines dieser Modelle.

Ab kommenden Dienstag erhältlich sein wird die GeForce RTX 4060 Ti – allerdings nur das Modell mit 8 GB Grafikspeicher. Die Variante mit doppeltem Speicher und demnach 16 GB, wird NVIDIA erst am Verlaufe des Julis auf den Markt bringen. Dann soll eine GeForce RTX 4060 folgen, die neben dem fixen Speicherausbau von 8 GB über weniger Funktionseinheiten verfügt.

Vorweg sei noch gesagt: Die GeForce RTX 4060 Ti mit 8 GB an Grafikspeicher soll 439 Euro kosten. Beim doppelten Speicherausbau sollen 549 Euro fällig werden. Während es von der 8-GB-Variante eine Founders Edition geben wird, ist dies bei der 16-GB-Variante nicht geplant. Damit kann NVIDIA für das kleinere Modell auch eine gewisse Preisvorgabe machen, da man die Founders Edition eben zu diesem Preis verkauft, während dies beim größeren Modell nur eine Preisempfehlung ist, an die sich die Hersteller nicht halten müssen.

Die GeForce RTX 4060 soll im Juli für 329 Euro folgen. Ab wann genau die GeForce RTX 4060 Ti mit 16 GB sowie die GeForce RTX 4060 verfügbar sein werden, soll im Verlaufe des kommenden Monats bekanntgegeben werden.

Bevor wir zu den ersten technischen Details kommen: NVIDIA kündigt die Karten heute nur an, die Tests wird es mit, bzw. kurz vor der Verfügbarkeit geben. Im Rahmen der heutigen Präsentation dürfen wir einige der technischen Details nennen, allerdings nicht alle. Schauen wir uns die neuen Karten im Vergleich zur GeForce RTX 4070 einmal an:

Gegenüberstellung der Karten
	GeForce RTX 4060	GeForce RTX 4060 Ti	GeForce RTX 4070
GPU	AD107	AD106	AD104
FP32-ALUs	3.072	4.352	5.888
INT32-ALUs	1.536	2.176	2.944
SMs	24	34	46
Tensor Cores	96	136	184
RT Cores	24	34	46
L1-Cache	3.072 kB	4.352 kB	5.888 kB
L2-Cache	24 MB	32 MB	36 MB
Basis-Takt	-	-	1.920 MHz
Boost-Takt	-	-	2.475 MHz
Speicherkapazität	8 GB	8 / 16 GB	12 GB
Speichertyp	GDDR6	GDDR6	GDDR6X
Speicherinterface	128 Bit	128 Bit	192 Bit
Speichertakt	1.065 MHz	1.125 MHz	1.313 MHz
Speicherbandbreite	272 GB/s	288 GB/s	504 GB/s
PCIe-Interface	PCIe 4.0 x8	PCIe 4.0 x8	PCIe 4.0 x16
TDP	115 W	160 W	200 W
Preis	329 Euro	439 Euro (8 GB) 549 Euro (16 GB)	659 Euro

Die GeForce RTX 4060 Ti verwendet – egal ob nun mit 8 oder 16 GB an Grafikspeicher – die AD106-GPU. Aus 34 aktiven Streaming Multiprocessoren (SM) ergeben sich die 4.352 FP32- und 2.176 INT32-Recheneinheiten sowie die 34 RT- und 136 Tensor-Kerne. Angaben zur Größe der AD106-GPU macht NVIDIA nicht, im Vorfeld wurden 190 mm² kolportiert. Nur noch die AD107-GPU, zu der wir gleich noch kommen werden, ist noch etwas kleiner. Die mobile Variante der GeForce-RTX-4070-Notebook-GPU verwendet die AD106-GPU Chip bereits. In der maximalen Ausbaustufe verfügt er über 36 SMs.

Das größte Augenmerk der AD106-GPU und damit der GeForce RTX 4060 Ti liegt sicherlich im Speicherausbau und dessen Anbindung. 8 GB an Grafikspeicher reichen für eine Karte, die 1080p-Spieler adressieren sollen, in 2023 noch aus. Zukunftsweisend ist dies sicherlich nicht. Eine 16-GB-Variante soll all diejenigen ruhigstellen, die in den 8 GB einen großen Kritikpunkt sehen.

Die Anbindung ist der zweite Punkt, der vielen böse aufstoßen wird. Ein nur 128 Bit breites Speicherinterface kennen wir in der XX60-Klasse noch nicht. Bei der GeForce RTX 3060 Ti war das Speicherinterface noch doppelt so breit und erreichte zudem mit 448 GB/s eine um mehr als 50 % höhere Speicherbandbreite als dies bei der GeForce RTX 4060 Ti der Fall ist. NVIDIA kontert dieses Argument mit dem größeren L2-Cache der Ada-Lovelace-GPUs. Dazu kommen wir gleich noch.

Die Total Graphics Power der GeForce RTX 4060 Ti liegt bei 160 W. Damit will NVIDIA hinsichtlich der Effizienz eines aufzubieten haben. Die GeForce-RTX-40-Serie hat sich – wenn man sie denn nicht über ihrem idealen Fenster betreibt – als sehr effizient erwiesen. Der AD106-GPU dürfte es auf der GeForce RTX 4060 Ti nicht anders ergehen. Die Anbindung erfolgt per PCI-Express 4.0, anders als bei den bisherigen Karten jedoch nur über acht anstatt 16 Lanes.

Daten zur GeForce RTX 4060

Während die GeForce RTX 4060 Ti in ihren zwei Ausbaustufen in der Leistung identisch sind, verwendet NVIDIA für die GeForce RTX 4060 die kleinere AD107-GPU. Diese kommt bisher nur für die GeForce-RTX-4060- und -4050-Laptop-GPU zum Einsatz und wandert nun ebenfalls in den Desktop. Mit vermutlich 146 mm² ist der Chip noch einmal deutlich kleiner. Auch hier stehen die von NVIDIA bestätigten Zahlen zur Größe und Anzahl der Transistoren noch aus. 3.072 FP32- und 1.536 INT32-Recheneinheiten werkeln in der GPU, die auf der GeForce RTX 4060 im Vollausbau zum Einsatz kommt. Organisiert sind diese in 24 SMs, nebst ebenso vielen RT- und 96 Tensor-Kernen.

Auch hier kommt ein 128 Bit breites Speicherinterface zum Einsatz, welches die 8 GB an Grafikspeicher anbindet und auf eine Speicherbandbreite von 288 GB/s kommt. Eine Variante mit 16 GB ist an dieser Stelle nicht geplant.

Eine Total Graphics Power von 115 W gibt NVIDIA für die GeForce RTX 4060 an. Ob noch kleinere Modelle geplant sind, ist nicht bekannt.

L2-Cache vs. Speicherbandbreite

Die geringe Speicherbandbreite der GeForce RTX 4060 (Ti) sind sicherlich ein Aspekt, den man sich noch einmal genauer anschauen sollte, denn 288 GB/s klingen nach sehr wenig – es ist auch vergleichsweise wenig an Bandbreite, die uns NVIDIA hier anbietet. Aber es gibt auch einige Argumente, die für eine solche Auslegung mit schmalem Speicherinterface sprechen:

Zunächst einmal hat auch AMD mit den Navi-2x-Chips erkannt, dass ein großer Grafikspeicher mit relativ schneller Anbindung durchaus ein Flaschenhals sein kann, den man anstatt mit einem noch breiteren Speicherinterface, besser mit einem zusätzlichen Cache löst. Der Infinity-Cache sitzt als weitere Speicherebene noch vor dem Grafikspeicher und ersparte es AMD somit von 512 Bit breites Speicherinterface zur GPU zu verpflanzen. Auch bei der Navi-3x-Serie sind 384 Bit das Maximum, was AMD umgesetzt hat – ebenso wie NVIDIA bei der Ada-Lovelace-Generation.

Aber der L2-Cache ist mit der Ada-Lovelace-Architektur deutlich größer geworden. Damit sollen Zugriffe auf den Grafikspeicher reduziert werden. Je mehr an Daten bereits im schnelleren L2-Cache liegen, desto weniger dieser Zugriffe müssen auf den Grafikspeicher erfolgen. Daher kam AMD an dieser Stelle auf den Infinity Cache.

In Performance-Analysen haben sich AMD und nun auch NVIDIA angeschaut, welchen Einfluss ein großer Cache auf die Leistung hat bzw. welche Datenmengen man hier abfangen kann, indem häufig genutzte Daten anstatt aus dem VRAM aus einem großen Cache bezogen werden.

Die Hit Rate, also die Anzahl der erfolgreichen Zugriffe auf Daten, die bereits im Cache liegen, steigt, wenn von den damals typischen 4 bis 6 MB im Endkundenbereich ausgehend, die Cache-Kapazität auf mehrere Dutzend Megabyte vervielfacht wird. Letztendlich ist man bei AMD bei einer Cache-Größe von 64 und 128 MB gelandet, die man in den GPUs umgesetzt hat. Je höher die Auflösung, desto größer sollte der Cache sein.

Auch NVIDIA hat die Kapazität des L2-Caches mit der Ada-Lovelace-Generation vervielfacht. Dies aber nicht nur um eine vermeintlich zu langsame Speicheranbindung zu kompensieren, sondern auch um die Raytracing-Leistung zu erhöhen. Im Falle der GeForce RTX 4060 Ti aber liegt der primäre Fokus des größeren Caches in der Kompensation der geringeren Speicherbandbreite.

NVIDIA hat die Möglichkeit, eine GeForce RTX 4060 Ti mit nur zwei anstatt der implementierten 32 MB an L2-Cache zu simulieren. Aufgrund des geringeren Caches ist das Interface zum VRAM immer ausgelastet, bzw. normiert werden für diesen Umstand die 100 % angegeben. Kann die GeForce RTX 4060 Ti mit ihren 32 MB an L2-Cache arbeiten, fällt der Datenverkehr zum VRAM mit etwa 50 % des ursprünglichen Wertes deutlich geringer aus.

Der größere L2-Cache kompensiert also die geringere Speicherbandbreite und ist für die Berechnungen der Raytracing-Effekte nicht unwichtig. Die Einsparung an Chipfläche ist laut NVIDIA einer der Hauptgründe, warum man ein nur 128 Bit breites Speicherinterface für die AD106- und AD107-GPU gewählt hat. Allerdings musste man dafür Platz für den größeren Cache auf dem Chip einplanen. Dort, wo jeder Quadratmillimeter an Platz- und damit Kosteneinsparung zählt, wird sich NVIDIA wohl genau überlegt haben, wie man den Chip nun final auslegt.

Inwieweit der größere L2-Cache bei AD104, AD103 und AD102 respektive der GeForce RTX 4070, GeForce RTX 4080 und GeForce RTX 4090 eine Rolle spielt, wäre sicherlich interessant. Dazu hat NVIDIA bisher keinerlei Zahlen veröffentlicht und für uns ist es nicht so einfach möglich, den Cache der GPU zu beschränken.

Reichen die 8 GB nun?

Wo sich die GeForce RTX 4060 Ti einordnet, was sie in 1080p und 1440p zu Leisten im Stande ist und ob die 8 GB an Grafikspeicher auch 2023 noch ausreichend sind – all dies wollen wir im Rahmen des Tests klären. Dieser wird einen Tag vor Verfügbarkeit der Karte, also am 23. Mai, erscheinen. Ab dem 24. Mai um 15:00 Uhr sollen die Karten erhältlich sein. Neben der Founders Edition wird es zahlreiche Custom-Designs geben, von denen wir uns mindestens eines anschauen werden.

Hersteller-Benchmarks

Natürlich liefert NVIDIA gleich ein paar Benchmarks und vergleicht darin die GeForce RTX 4060 Ti gegen die beiden Vorgänger-Karten GeForce RTX 2060 und GeForce RTX 3060.

Wie immer sollte man diese Benchmarks mit Vorsicht genießen, denn selbst wenn sie stimmen und sich in dieser Form nachvollziehen lassen, so hat der Hersteller natürlich ein Interesse daran, seine eigene Hardware bestmöglich darzustellen.

Gleiches gilt für die ersten Leistungsdaten der GeForce RTX 4060: