NEWS

128/256 Bit oder 192/384 Bit

Die Anbindung von GPU-Speicher im Detail erklärt

Portrait des Authors


Die Anbindung von GPU-Speicher im Detail erklärt
22

Werbung

Neben der GPU selbst bestimmt einerseits der Standard des GPU-Speichers, die Menge und zusätzlich auch deren Anbindung die Performance einer Grafikkarte. In den technischen Eigenschaften zu den verschiedenen Grafikkarten-Modellen liest man, dass der VRAM entweder mit 128, 192, 256 oder gar 384 Bit angebunden ist und gleichzeitig eine entsprechende Speicherbandbreite bereitstellen kann, die eine wichtige Rolle bei grafikintensiven Anwendungen und gerade in höheren Auflösungen spielt. Doch was bedeutet das im Detail und wie wird der Speicher auf dem Grafikkarten-PCB angebunden? Wie wird die Speicherbandbreite berechnet? Diese durchaus berechtigten Fragen wollen wir gerne für unsere Leser einmal im Detail erklären.

Es sollte eigentlich kein Geheimnis mehr darstellen, dass der Arbeitsspeicher (RAM) für das Mainboard zwar deutlich schneller als bisher jede erhältliche SSD ist (inklusive über PCIe 5.0 x4), allerdings dafür drastisch zu langsam für aktuelle, dedizierte Grafikkarten ist und somit einen Flaschenhals darstellt. Aus diesem Grund bringen die Grafikkarten seit unzähligen Jahren ihren eigenen Speicher mit, der autark arbeitet und nichts mit dem Hauptspeicher des Systems zu tun hat, der auf dem Mainboard seinen Platz einnimmt. Während der DDR5-Speicher etwa eine Speicherbandbreite zwischen 50 und 75 GByte/s auf die Waage bringt, kommen die High-End-Grafikkarten (Stand: 2022/2023) - wie NVIDIAs GeForce RTX 4090 (Hardwareluxx-Test) - auf beachtliche 1.008 GByte/s und damit auf knapp 1 TByte/s.

Um mal beim Thema Gaming zu bleiben: Reicht in kleineren Auflösungen, wie 1080p (1.920 x 1.080 Pixel) in der Regel eine Mittelklasse-Grafikkarte, wie eine GeForce RTX 3060 (Ti) (bald RTX 4060 Ti) oder eine Radeon RX 6600 (XT) bereits aus, wird gerade für die UHD-Auflösung (3.840 x 2.160 Pixel), sprich der vierfachen 1080p-Auflösung deutlich mehr Performance benötigt und dies trifft dabei nicht nur auf die GPU selbst zu, sondern auch auf die VRAM-Menge und deren Anbindung, die zu der Speicherbandbreite führt. Je höher die Speicherbandbreite ausfällt, desto mehr Daten lassen sich zur selben Zeit transportieren.

Speicheranbindung von 64 bis 384 Bit

Während eine VRAM-Speicheranbindung von 64 Bit nur wenig an Datendurchsatz ermöglicht, ist dieser bei 384 Bit eben sehr breitbandig. Doch eine höhere Speicheranbindung ist eben auch aufwendiger vom PCB-Design und von der Produktion selbst und demnach kosten Grafikkarten auch mehr, wenn das Speicherinterface sehr groß ausfällt. So bieten besonders Entry- und Low-Budget-Grafikkarten in der Regel ein Speicherinterface von lediglich 64 Bit. Dies reicht allerdings für das Ansteuern mehrerer Monitore samt einfacher Office-Nutzung völlig aus.

Die Einstiegs-Grafikkarten, die sich auch für das Gaming eignen, bieten oftmals ein 128-Bit-Speicherinterface, das auch vermehrt bei Mittelklasse-GPUs, wie bei der GeForce RTX 4060 (Ti), Verwendung findet. Kompensiert wird dies dann mit einem größeren L2-Cache der GPU. Mit 192 und 256 Bit ist das Speicherinterface dann schon bedeutend größer und eignet sich nicht nur für Full-HD-, sondern auch für WQHD-Gaming (2.560 x 1.440 Pixel) sowie eingeschränkt sogar UWQHD (3.440 x 1.440 Pixel) und UHD (3.840 x 2.160 Pixel). Generell kommt es auf das jeweilige Spiel und die gewünschte Framerate an.

Doch bei UWQHD und gerade bei UHD kann man nie genug GPU-Leistung bekommen. Dazu passende Oberklasse- und High-End-Grafikkarten stellen dafür im Regelfall eine Speicheranbindung von 320 und 384 Bit zur Verfügung. Die GeForce RTX 2080 Ti stellt mit dem 352-Bit-Interface eine Ausnahme dar. Zu früheren Zeiten existierten allerdings auch Grafikkarten mit einem Speicherinterface von sehr hohen 512 Bit. Beispielsweise die damalige ATI Radeon 2900 XT (Hardwareluxx-Test). Doch je höher die Speicheranbindung ausfällt, umso aufwendiger ist dies für die Grafikkarten-Hersteller, die passenden PCBs zu designen und dies würde sich auch beim Endkundenpreis widerspiegeln.

Speichermenge vs. Speicheranbindung

Viele PC-Begeisterte werden sich bestimmt schon einmal die Frage gestellt haben, warum Grafikkarten mit einem 6 oder 12 GB großen Grafikspeicher nicht auch mit 128 oder 256 Bit angebunden werden kann. Die Speichermengen 6, 12, 24 und 48 GB sind non-binär, wohingegen 4 , 8, 16 und 32 GB binärkonform sind. Die GPUs selbst bringen mehrere Speichercontroller mit jeweils 32 Bit mit, an denen die einzelnen VRAM-Chips mit gegenwärtig 1 oder 2 GB Kapazität angebunden werden können. Die Speichercontroller innerhalb der GPU sind dabei auch abwärtskompatibel und können auch im 16-Bit-Mode ans Werk gehen.

Als Beispiel-Grafikkarte nehmen wir die NVIDIA GeForce RTX 4070 (Hardwareluxx-Test): Die zum Einsatz kommende AD104-250-GPU wurde von NVIDIA mit sechs 32-Bit-Speichercontrollern ausgestattet. Auf den PCBs und dabei in Unabhängigkeit des Grafikkarten-Herstellers werden sechs VRAM-Chips (GDDR6X) von Micron mit einer Kapazität von jeweils 2 GB verlötet. In Summe sind es somit 12 GB an Grafikspeicher. Die sechs einzelnen Speichercontroller agieren dabei als Team und werden "zusammengebunden", sodass die 6x 32 Bit miteinander multipliziert werden müssen. Es kommt daher zu einer Speicheranbindung von 192 Bit. Rein theoretisch wären auch summiert 96 Bit möglich, sprich die Hälfte, wenn die Speichercontroller mit 16 Bit arbeiten würden.

Speicheranbindung bei der GeForce RTX 40 Serie
Modell L2-Cache VRAM-Menge Anzahl Chips Bit pro Chip Anbindung Bit gesamt Bandbreite
RTX 4090 72 MB 24 GB GDDR6X
12x 2 GB
21 GBit/s 12 x 32 Bit 384 Bit 1.008 GByte/s
RTX 4090D 72 MB 24 GB GDDR6X
12x 2 GB
21 GBit/s 12 x 32 Bit 384 Bit 1.008 GByte/s
RTX 4080 Super 64 MB 16 GB GDDR6X
8x 2 GB
23 GBit/s 8 x 32 Bit 256 Bit 736 GByte/s
RTX 4080 64 MB 16 GB GDDR6X
8x 2 GB
22,4 GBit/s 8 x 32 Bit 256 Bit 717 GByte/s
RTX 4070 Ti Super 48 MB 16 GB GDDR6X 8x 2 GB 21 GBit/s 8 x 32 Bit 256 Bit 672 GByte/s
RTX 4070 Ti 48 MB 12 GB GDDR6X 6x 2 GB 21 GBit/s 6 x 32 Bit 192 Bit 504 GByte/s
RTX 4070 Super 48 MB 12 GB GDDR6X
6x 2 GB
21 GBit/s 6 x 32 Bit 192 Bit 504 GByte/s
RTX 4070 36 MB 12 GB GDDR6X
6x 2 GB
21 GBit/s 6 x 32 Bit 192 Bit 504 GByte/s
RTX 4060 Ti 32 MB 8 / 16 GB GDDR6
4x 2 GB (8 GB)
8x 2 GB (16 GB)
18 GBit/s 4 x 32 Bit (8 GB)
8 x 16 Bit (16 GB)
128 Bit 288 GByte/s
RTX 4060 24 MB 8 GB GDDR6
4x 2 GB
17 GBit/s 4 x 32 Bit 128 Bit 272 GByte/s
Speicheranbindung bei der Radeon RX 7000 Serie
Modell L3-Cache VRAM-Menge Anzahl Chips Bit pro Chip Anbindung Bit gesamt Bandbreite
RX 7900 XTX 96 MB 24 GB GDDR6
12x 2 GB
20 GBit/s 12 x 32 Bit 384 Bit 960 GByte/s
RX 7900 XT 80 MB 20 GB GDDR6
10x 2 GB
20 GBit/s 10 x 32 Bit 320 Bit 800 GByte/s
RX 7900 GRE 64 MB 16 GB GDDR6
8x 2 GB
18 GBit/s 8 x 32 Bit 256 Bit 576 GByte/s
RX 7800 XT 64 MB 16 GB GDDR6
8x 2 GB
19,4 GBit/s 8 x 32 Bit 256 Bit 621 GByte/s
RX 7700 XT 48 MB 12 GB GDDR6
6x 2 GB
18 GBit/s 6 x 32 Bit 192 Bit 432 GByte/s
RX 7600 XT 32 MB 16 GB GDDR6
8x 2 GB
18 GBit/s 8 x 16 Bit 128 Bit 288 GByte/s
RX 7600 32 MB 8 GB GDDR6
4x 2 GB
18 GBit/s 4 x 32 Bit 128 Bit 288 GByte/s

Kommen stattdessen acht VRAM-Chips mit jeweils 2 GB zum Einsatz, wie bei AMDs Radeon RX 6800 (XT) (Hardwareluxx-Test), ergibt sich nicht nur eine Speichermenge von 16 GB, sondern auch ein Speicherinterface von 256 Bit (8x 32 Bit). auch hier bestünde die Möglichkeit, die 16 GB auch mit 128 Bit anzubinden, sofern jeder der acht Speicherchips mit 16 Bit angebunden wird.

Am Beispiel der GeForce RTX 3080 Ti (Hardwareluxx-Test) und der RTX 3090 (Hardwareluxx-Test) sieht es hingegen so aus: Beide Modelle bieten ein 384-Bit-Interface, doch die GeForce RTX 3080 Ti besitzt rein auf der PCB-Vorderseite 12 VRAM-Chips mit jeweils 1 GB Kapazität und kommt somit auf 12 GB Speicher. Um auf die 384 Bit an Speicherinterface zu kommen, müssen die 12 Speicherchips folgerichtig mit jeweils 32 Bit angebunden werden. NVIDIAs GeForce RTX 3090 hingegen bringt auch auf der Rückseite des PCBs 12 weitere VRAM-Chips mit je 1 GB mit, sodass summiert 24 GB bereitgestellt werden. Jeweils zwei Stück von den VRAM-Chips - und dabei jeweils ein Chip von der PCB-Vorder- und Rückseite - wird von einem 32-Bit-Kanal betreut und in zwei 16-Bit-Modes aufgeteilt. Auf diese Weise kommt ebenfalls ein 384-Bit-Interface zustande.

Speicheranbindungen mit 1 GB und 2 GB VRAM-Chips (Teilweise Theorie)
VRAM-Kapazität Anzahl VRAM-Chips Anbindung pro VRAM-Chip Interface
4 GB 4x 1 GB oder 2x 2 GB 16 / 32 Bit 32 / 64 / 128 Bit
6 GB 6x 1 GB oder 3x 2 GB 16 / 32 Bit 48 / 96 / 192 Bit
8 GB 8x 1 GB oder 4x 2 GB 16 / 32 Bit 64 / 128 / 256 Bit
10 GB 10x 1 GB oder 5x 2 GB 16 / 32 Bit 80 / 160 / 320 Bit
11 GB* 11x 1 GB 16 / 32 Bit 176 / 352 Bit
12 GB 12x 1 GB oder 6x 2 GB 16 / 32 Bit 96 / 192 / 384 Bit
16 GB 16x 1 GB oder 8x 2 GB 16 / 32 Bit 128 / 256 / 512 Bit
20 GB 20x 1 GB oder 10x 2 GB 16 / 32 Bit 160 / 320 / 640 Bit
24 GB 24x 1 GB oder 12x 2 GB 16 / 32 Bit 192 / 384 / 768 Bit
32 GB 32x 1 GB oder 16x 2 GB 16 / 32 Bit 256 / 512 / 1.024 Bit
40 GB 40x 1 GB oder 20x 2 GB 16 / 32 Bit 320 / 640 / 1.280 Bit
48 GB 48x 1 GB oder 24x 2 GB 16 / 32 Bit 384 / 768 / 1.536 Bit
* GeForce RTX 2080 Ti und GeForce GTX 1080 Ti (352 Bit)

Doch sowohl bei AMD als auch bei NVIDIA wird das in vielen Fällen niedrig erscheinende Speicherinterface mit einem größeren L2-Cache kompensiert. So bringt die GeForce RTX 4070 Ti (Hardwareluxx-Test) 48 MB und die GeForce RTX 4070 immerhin noch 36 MB mit. Nicht nur die GeForce RTX 4090, sondern auch die Radeon RX 7900 XTX (Hardwareluxx-Test) bringt einen 24 GB großen Speicher mit, wobei die L2-Cache-Menge bei der AMD-Grafikkarte bei 96 MB liegt. NVIDIAs AD102-300-GPU (RTX 4090) kommt hingegen auf einen 72 MB großen L2-Cache. Mit dem AD102-Vollausbau sind bis zu 96 MB drin.

Um als Paradebeispiel nochmal auf die GeForce RTX 2080 Ti (Hardwareluxx-Test) zurückzukommen: Die TU102-300- GPU wurde von NVIDIA mit 11 GB ausgestattet, genau wie die GTX 1080 Ti. Das Speicher-Interface beträgt hierbei ungewohnt 352 Bit. Die zum Einsatz kommenden elf 1-GB-VRAM-Chips werden mit 32 Bit angebunden. Multipliziert man also 11 mit 32, lautet das Ergebnis 352. 

Generell kommt es somit auf die Anzahl der zum Einsatz kommenden VRAM-Chips und deren Anbindung an, wie hoch das Speicherinterface ausfällt. Dies ist schlussendlich die logische Begründung, weshalb sich 8/16 GB VRAM nicht mit 192/384 Bit und 12/24 GB nicht mit 128/256 Bit anbinden lässt.

Berechnung der Speicherbandbreite

Die anfangs erwähnte Speicherbandbreite spielt also eine wichtige Rolle beim Thema Gaming. Doch wie genau wird die Speicherbandbreite einer Grafikkarte berechnet? Das werden sich sicherlich ebenfalls viele unserer Leser oftmals gefragt haben. Dabei ist dies recht einfach, die Bandbreite zu berechnen.

Die Speicherchips auf einer Grafikkarte stammen in der Regel von Micron oder von Samsung. Diese Chips werden mit einer Grund-Bandbreite spezifiziert und dieser Wert wird in GBit/s angegeben (nicht zu verwechseln mit GByte/s). Als Beispiel nehmen wir uns die GeForce RTX 4090 (Hardwareluxx-Test). Die dort 12 GDDR6X-Speicherchips mit jeweils 2 GB Kapazität wurden von Micron mit 21 GBit/s an Durchsatz vorgesehen und werden jeweils mit 32 Bit von der AD102-300-GPU angesprochen. So sind es also 384 Bit.

Berechnung der Speicherbandbreite:

X GBit/s (VRAM-Chip) / 8 (Bit) x Speicherinterface = Speicherbandbreite in GByte/s
Beispiel GeForce RTX 4090: 21 GBit/s / 8 = 2,625 GByte/s x 384 Bit = 1.008 GByte/s

Da die Speicherbandbreite in GByte/s angegeben wird, muss man die 21 GBit/s erst in GByte/s umrechnen. 1 Byte bringt 8 Bit unter einen Hut, sodass die 21 GBit/s mit der Zahl 8 dividiert werden muss. Das Ergebnis lautet 2,625 GByte/s. Nun muss dieser Wert schließlich noch mit dem vorliegenden Speicherinterface der Grafikkarte multipliziert werden. 2,625 x 384 ergibt 1.008 GByte/s.

Zusammenfassung

Seit etlichen Jahren kommen beim Thema Grafikkarten Angaben, wie 128 Bit, 192 Bit, 256 Bit oder auch 384 Bit zum Vorschein und dabei ist auf dem ersten Blick gar nicht klar, was genau damit gemeint ist. Da die dedizierten Grafikkarten besonders aus Performancegründen über einen eigenen Speicher (VRAM) verfügen, muss dieser Speicher auch irgendwie an die GPU selbst angebunden werden, damit die GPU mit dem Speicher arbeiten und wichtige Daten für die grafische Berechnung erhalten und auslagern kann. Mal von der Menge des Videospeichers abgesehen spielt dabei die Speicherbandbreite eine entscheidende Rolle, gerade in sehr hohen Auflösungen, wie UHD mit 3.840 x 2.160 Pixeln.

Um es abschließend kurzzufassen: Es hängt von der reinen Anzahl der verlöteten VRAM-Chips und von den Speichercontrollern der GPU ab, wie hoch das Speicherinterface ausfällt. Dabei ist es ausschließlich möglich, 6, 12, 24 oder 48 GB VRAM an ein Interface mit 48-, 96-, 192-, 384- oder (theoretisch) mit 768 Bit zu hängen. Dasselbe gilt für 4, 8, 16 und 32 GB mit einer 32-, 64-, 128-, 256- oder 512-Bit-Anbindung. Auch sind exotische Anbindungen, wie 352 Bit möglich, wie sie bei NVIDIAs GeForce GTX 1080 Ti und RTX 2080 Ti Verwendung findet. Oder aber ein 320-Bit-Interface, passend zu AMDs Radeon RX 7900 XT. Anhand der GBit/s-Angabe des Speicherchips selbst und dessen Speicheranbindung lässt sich zusätzlich die resultierende Speicherbandbreite berechnen, die im Gaming-Sektor, aber auch in anderen Anwendungsbereichen nicht ganz unwichtig ist.

Wir hoffen, dass wir dem einen oder anderen unserer Leser etwas Licht ins Dunkle bringen konnten. In Summe ist das Thema gar nicht so komplex und relativ einfach zu verstehen.