Über Vram (Grafikspeicher)

MOB²

Neuling
Thread Starter
Mitglied seit
24.05.2015
Beiträge
381
Moin,
ich wollte mal erst Fragen ob HBM mit 4GB eigentlich Sinn macht?
HBM wurde doch speziell für 4K bz High SSAA usw hergestellt, bei 1440p + Ultra kommt man schon an die 5.8GB Vram.
Bei Spielen die in 1080p und 1440p gespielt werden macht HBM kein wirklichen Sinn meiner Meinung da die GDDR5 Speicher es ohne Probleme packen.
Bei 4K sieht es schon anders aus, wird AMD in der zukünftigen Reihe HBM2 6GB+ verwenden und neue GPUs oder eher wieder ein Refresh mit HBM2 ?
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Mit der Auflösung hat HBM jetzt nicht so viel zu tun.

Schaffen tut 4K auch GDDR3 wenns sein soll.

Die Sache ist eher, wie schnell man bei HBM die Daten ein- und auslagern kann. Eine Fury X mit 4GB HBM kommt beim VRAM meist genauso gut über die Runden wie eine 980Ti mit 6GB GDDR5. Bei einer GDDR5 Karte braucht man (zumindest bisher) offenbar einfach mehr Speicher, da man nicht so schnell Daten swappen kann. Und da ist eigentlich egal welche Auflösung man nutzt. Ich kann mit dem richtigen Spiel oder Mods auch bei 1080p alles bis auf die Titan X beim VRAM in die Knie zwingen.

VRAM Verbrauch einer GDDR5 Karte kannst du deswegen auch nicht hernehmen, um 4GB HBM als zu wenig darzustellen. Denn eine HBM Karte würde in dem Szenario einfach weniger VRAM "verbrauchen".
 
MOB², ich habe doch in deinem anderen Thread die vermutlichen Gründe geschrieben, wieso ein Refresh der 28nm-GPUs stattgefunden hat. Wieso sollte AMD das für 14nm noch einmal tun? Die müssen die GPUs sowieso an die neue Strukturgröße anpassen, das ist ein Haufen Arbeit. Es wird mit sehr hoher Wahrscheinlichkeit höchstens 2 Refreshs geben: Fiji und Tonga. Oder auch keinen. (Kann aber sein, dass das Marketing verbietet, die Furys weiter unter dem bisherigen Namen zu verkaufen. Dann gibt es halt einen Refresh.)

@Powl
Schön dass du das noch einmal getippt hast, nur wird es wie immer keiner glauben. Wenn Nvidia irgendwo mehr RAM draufhaut ist das automatisch sinnvoll oder notwendig. Wenn wie fast immer weniger, dann reicht die geringere Menge.
 
Zuletzt bearbeitet:
Die Sache ist eher, wie schnell man bei HBM die Daten ein- und auslagern kann. Eine Fury X mit 4GB HBM kommt beim VRAM meist genauso gut über die Runden wie eine 980Ti mit 6GB GDDR5. Bei einer GDDR5 Karte braucht man (zumindest bisher) offenbar einfach mehr Speicher, da man nicht so schnell Daten swappen kann.
Nein, das ist nicht richtig.
Beim Swappen begrenzt nie die Geschwindigkeit des vRams, sondertn die Quelle der Daten und das ist im besten Fall der Arbeitsspeicher des rechners und im schlimmsten Fall, eine HDD (wobei es da auch Mechanismen gibt, die Daten vorsorglich in den Arbeitsspeicher zu laden).
An dieser Engstelle kann HBM nichts ändern. HBM hat nur die Verbindung zwischen vram und GPU beschleunigt.

Sache ist, vram wirkt wie ein Cache. Dort wird kurz gesagt, nur dann was gelöscht wenn der Speicher aus zu gehen droht.
D.h. es gibt immer einen unterschied zwischen der menge an tatsächlich belegtem Speicher und der Menge die tatsächlich notwendig ist damit das Spiel "perfekt" flüssig läuft und nicht vom vRam begrenzt wird..

Darum kann man nichts direkt aus einem Vergleich der Belegungswerte von Karten mit unterschiedlicher Speichermenge ableiten.
Das gilt völlig unabhängig von der Speichertechnologie.


@TE
Lies dem Oben verlinkten Artikel. Der erklärt alles sehr gut und mehr als den letzten Abschnitt dort kann man zu diesem Thema auch nicht sagen :)
 
Zuletzt bearbeitet:
Jop, denn lese ich mir durch ^.^ aber gleich.

So wie ich das jetzt verstanden hab verbraucht die Grafikkarte nur mehr Vram weil Sie einfach nicht schnell genug swappen kann und deswegen speichert die Graka das in den VRAM damit die nicht immer wieder swappen muss? Bei HBM wird weniger Vram gebraucht weil der Vram es schnell genug swappen kann und somit wird weniger gelagert?

So hab ich es mir quasi erklärt hehe :p
 
So wie ich das jetzt verstanden hab verbraucht die Grafikkarte nur mehr Vram weil Sie einfach nicht schnell genug swappen kann und deswegen speichert die Graka das in den VRAM damit die nicht immer wieder swappen muss? Bei HBM wird weniger Vram gebraucht weil der Vram es schnell genug swappen kann und somit wird weniger gelagert?

So hab ich es mir quasi erklärt hehe :p
Das hast du genau falsch rum verstanden o_O
Lies bitte nochmal die Abschnitte aus meinem Post.

Wie kommst du überhaupt darauf, dass man bei HBM weniger davon braucht?
Es hat aufgrund der Funktionsweise eines Caches, nur den Anschein, die Fury (X) käme mit 4Gb klar während die 980Ti 6Gb oder die 390X 8Gb "braucht".

Des weiteren, könnte man den Inhalt des vRams genau so schnell swappen, wie er gebraucht wird, dann bräuchte man garkeinen vRam ;) Dann würde die Grafikkarte ihre Daten direkt vond er Quelle beziehen. Da diese verbindung jedoch viel zu langsam ist, haben die Grafikkarten schon seit langer Zeit, eigenen Speicher der die Daten auf Vorrat hält.
 
Ein Großteil der des Vrams ist mit Texturen und Meshdaten belegt. Diese Daten müssen wenn in Verwendung immer im Speicher liegen und können nicht mal schnell ausgewechselt werden.
Zum Vergleich:
2133er DDR3 Ram hat in Dual Channel Betrieb eine Transferrate von 34GB/s
eine Geforce 980 kommt auf ca. 178 GB/s
der als unbrauchbar angesehende 0,5GB Teil der Geforce 970 kommt auf mickrige 2x GB/s

Man erkennt also das Swapping durch HBM keinen Vorteil hat, es wird immer der Arbeitsspeicher limitieren. Der Vorteil von HBM Speicher mit einer größeren Anbindung ist allein für die GPU. Wenn die GPU also Daten aus dem Vram abruft um ein Frame zu erstellen können Texturen und Meshdaten schneller importiert werden und das Bild könnte falls der Flaschenhals dort lag ein Bruchteil schneller fertiggestellt werden. Sollten die benötigten Daten jedoch nicht im Vram liegen hilft alles nix.

Der Vorteil von viel Vram ist das man relativ unempfindlich vom Speichermanagment eines Entwicklers ist. Wenn dieser jedoch seinen Job gut macht dürfte man eigentlich nichts merken. Es ist meist eine Optimierungsfrage und weniger ein echtes Hardwarelimit.

Der belegte Speicher gibt kein wirklichen Anhaltspunkt ob der Speicher auch gebraucht wird. Wenn ein Spiel 6GB belegt kann niemand den Schluss ziehen das diese auch benötigt werden. Das würde nämlich auch bedeuten das z.b. eine 4GB Karte ununterbrochen Daten aus den langsamen Arbeitsspeicher anfordern würde und dies durchgängig da die Daten ja nirgends abgelegt werden können, das Spiel müsste defakto nahezu unspielbar sein.
 
Zuletzt bearbeitet:
Also ist zurzeit der RAM am limit oder die SSD?
SSD 550mb/s, ddr3 34gb/s, GDDR5 178gb/s oder werden die meshes im Ram gespeichert(aka Map is loading) und die GPU holt sie nur aus dem RAM heraus?
 
Meshs und Texturen welche für ein Bild (frame) in "Echtzeit" benötigt werden liegen immer im Vram oder es fängt an zu ruckeln ohne Ende.
Daten welche das Spiel evtl. benötigen könnte würde eine intelligentes Speichermanagment schonmal im Arbeitsspeicher ablegen um dieses schneller Laden zu können.

Die Kunst beim Speichermanagment ist nicht den Vram einfach vollzuknallen sondern im "vorraus" Wissen wenn welche Informationen benötigt werden. Sobald dieses im vorraus denken nicht klappt ist es schon zu spät.

"Map is Loading" ist mit die älteste Form wo eine Karte geladen wird mit Ladebildschirm
Dann gabs irgendwann mal Übergangszonen ala 1 2 3 wo die Datensatz 1 im Bereich 2 gelöscht werden und Datensatz 3 geladen wird ohne Ladebalken, meist ein enger Gang oder Tunnel.
Heutzutage wird vieles wohl mit "Zellen" wie die Bethesda Games gemacht was Open World angeht oder über Entfernung.
Umso offener ein Spiel desto komplexer ist das Speichermanagment da das "vorraus" Denken immer schwieriger.
 
Zuletzt bearbeitet:
Also muss man den PCIE Port verbessern. Wieso machen die einfach nicht mehr Pins?
 
Also hängt die Auslastung des Vrams durch das zusammenspiel von der Festplatte(ssd) - Arbeitsspeicher - Memory clock der Graka ab? Je schneller die einzelnen Übertragungsgeschwindigkeiten, desto weniger Vram wird gebraucht?
 
Also hängt die Auslastung des Vrams durch das zusammenspiel von der Festplatte(ssd) - Arbeitsspeicher - Memory clock der Graka ab? Je schneller die einzelnen Übertragungsgeschwindigkeiten, desto weniger Vram wird gebraucht?
Theoretisch vieleicht - ABER die sind alle (besonders die SSD) so viele Größenordnungen langsamer dass kein Programm oder Treiber darauf Rücksicht nimmt. Deswegen wird der vRam so gut genutzt wie irgendwie möglich.

EDIT: Oder eigentlich, ein klares nein. Könnte man auch nur eine einzige Textur aus dem Speicher, in Echtzeit normal vom System-RAM oder der SSD beziehen, dann könnte man tatsächlich den gesamten vRam abschaffen. Zwischenschritte gibt es da nicht.
Aber wie gesagt, vorerst ist das undenkbar.


Btw. was relevant ist, ist auch nicht nur die mögliche Übertragungsrate sondern auch die Latenz - wenn in einem Frame ein neue Textur erscheinen soll, darf diese ja nicht erstmal mehrere Frames dauern bis diese bei der GPU angekommen ist.
Da ist der vRam der nur Zentimeter von der GPU (bei HBM nur Millimeter) auch erheblich im Vorteil gegenüber dem Systemspeicher oder den Massenspeichern (SSD/HDD).
Inzwischen sind wir schon in solche Bereiche vorgestoßen wo schon die physikalsiche Entfernung ein Limit darstellt.
In einer hochgetakteten 22nm CPU (z.B. Haswell) kann der Strom in einem Taktzyklus kaum mehr den DIE umrunden. Die Lichtgeschwindigkeit ist das Limit.
 
Zuletzt bearbeitet:
Dann hoffe ich mal das ein Sli 980ti system mit 6gb vram für 4k gaming noch ne weile reichen :d.. ansonsten müssen die pegler nach links
 
In Asus MoBos kann man RAM als Festplatte benutzen :d da braucht man aber 128gb um einfach nur AW oder Blackops3 zu installieren.
Ich hab mal BO3 mit 8GB Ram (nicht vram) gezockt hat geruckelt wie die sau... wo ich auf 16GB upgegraded hab war alles iwie besser. Jedoch war die RAM Ausnutzung bei 12gb/16gb o_O ich denke das die Ruckler enstehen weil die GPU voll ist und man zu wenig Ram hat damit das Spiel da die Daten abspeichern kann. Also mir hat es geholfen.
 
Sache ist, vram wirkt wie ein Cache. Dort wird kurz gesagt, nur dann was gelöscht wenn der Speicher aus zu gehen droht.

Nicht nur. Wenn die GPU etwas hochrechnen muss(z.B. AA), muss sie logischerweise auch Zwischenergebnisse speichern. Insofern ist die Geschwindigkeit des VRAM für die GPU so ähnlich wie der RAM für die CPU in SuperPI. Und diese temporären Daten können durch die schnellere Anbindung kürzer im VRAM verweilen. Zusätzlich lässt sich schneller Platz schaffen, sodass man nicht ab 3,6GiB Belegung schon die seltenst genutzten Texturen vorsichtshalber wieder rausschmeißen muss. Hinzu kommt die Texturenkompression von AMD. Alle Faktoren zusammen sorgen dafür, dass die Grafikkarte nur noch in seltenen Fällen schlechtere Ergebnisse als die 6GiB- 980Ti liefert, die auch tatsächlich auf einen unzureichenden VRAM hinweisen.

Edit: @MOB²: Ich schätze mal, du meinst im Taskmanager mit 12GiB das, was aktuell "Benutzt" wird, bei mir verbraucht CoD:BO3 fast meine gesamten 32GiB, wenn man den RAM- Cache(Standby) dazuaddiert.(Edit2: Falls ja, dann hättest Du vielleicht noch 4GiB Cache übrig, während mein RAM- Cache mit 32GiB RAM 4-5mal so groß ist. Da kann es eventuell schon mal vorkommen, dass Daten gebraucht werden, die leider nicht mehr reingepasst haben und somit auf der SSD gelandet sind.)
Aber echt ein gut programmiertes Game, unterstützt viele Kerne und läuft selbst mit Supersampling auf 4K mit allen Reglern auf Max. auf meinem System ohne CF schon mit ca. 45FPS. Dass die Grafikqualität mit viel Speicherauslastung erkauft wird, haut vielleicht den einen oder anderen um, aber wenn andere es vorher schon richtig gemacht hätten, wären 32GiB Auslastung heute Standard. Diese haben aber leider auf Kosten der Rechenleistung mit Effekten den Speicher gespart und so das Zocken in 4K mit einer einzelnen Karte sehr erschwert. Edit2: Wobei das auch klar ist - extra bessere Texturen für den PC machen, wenn die meisten die Games auf einer PS3 zocken, ist auch nicht so wirtschaftlich.
 
Zuletzt bearbeitet:
Die Pascal und die Polaris kommen doch ende 2016 oder doch 2017 ?
 
Nicht nur. Wenn die GPU etwas hochrechnen muss(z.B. AA), muss sie logischerweise auch Zwischenergebnisse speichern. Insofern ist die Geschwindigkeit des VRAM für die GPU so ähnlich wie der RAM für die CPU in SuperPI.
Glaube dafür haben die GPUs inzwischen auch noch eigenen, internen Cache, genau so wie CPUs...
Aber grundsätzlich hast du sicher Recht.

Die Pascal und die Polaris kommen doch ende 2016 oder doch 2017 ?
Es gibt Gerüchte (besonders bei AMD) dass die Karten durchaus auch schon Mitte des jahres zu erwarten sind. Allerdings ist es wahrscheinlich dass zuerst die kleineren Karten dran kommen und die großen Monate später.
 
Mit Polaris rechne ich so Anfang Herbst. Wenn Nvidia strategisch intelligent ist, bringen sie Pascal auch relativ gleichzeitig. Davor würde ich aber nicht damit rechnen und manche spekulieren auch eher auf Ende Herbst, weil noch was dazwischen kommen kann. Die überwiegende Mehrzahl geht davon aus, dass erstmal nicht der Vollausbau kommt, sondern erst 2017 erscheint. Da wäre ich mir aber nicht so hundertprozentig sicher, weil zumindest AMD Boden gut machen muss und es Sinn machen könnte, ein Angebot auf dem Markt zu haben, wo die Leute erstmal nicht nein sagen können. Denn die meisten, die sich erst eine neue Karte gekauft haben, kaufen nicht gleich 2 Monate später wieder eine neue von der Konkurrenz.

Edit:
Glaube dafür haben die GPUs inzwischen auch noch eigenen, internen Cache, genau so wie CPUs...
Das könnte durchaus sein - weiß ich jetzt nicht mal aus dem Stegreif. Da durch heftige Anti Aliasing Einstellungen sich der VRAM- Verbrauch in manchen Games sogar verdoppeln kann(Bspw. GTA V), glaube ich, dass der Cache, wenn er vorhanden ist, zumindest für AA nicht ganz reichen könnte ;)
 
Zuletzt bearbeitet:
Gut zu wissen, kleiner Offtopic, ich teste jetzt mein neuen ungeköpften 4790k.
Ich benutze Intel XTU und bei 1.209v mach ich bei 4.4Ghz diese Intel XTU Benchmarks und Stress Tests.
Ich weiß das man erst in Spielen weißt ob irgendwas stabil ist aber kann man den Benchmarks und Tests von Intel XTU glauben und bis man ans limit kommt mit den Stress tests und benchmarks von Intel XTU das man dann die Stabilität ingames testet?
 
Machst du Untervolting oder Übertaktung? 4.4Ghz ist ja nichts besonders für die CPU.
Intel XTU ist schonr echt heftig - teilweise heizt es sogar mehr ein als Prime95 (wobei dies möglicherweise inzwischen wieder anders ist).
Das Standardwerkzeug zum Prüfen ist aber Prime95. Da nutzt ganz klar definierte und bekannte Algorithmen und ich hab noch von keinen Fällen gehört wo eine CPU Prime Stable aber nicht game Stable wäre.
 
GIMPS - Free Prime95 software downloads - PrimeNet
Unbenannt.png für VCore (Edit: Bei Threads in Deinem Fall natürlich 8)
Das gleiche mit 1K FFT Min/Max für Temperatur. Temperatur in HWMonitor oder CoreTemp ablesen. Würde ich bei der Spannung unter 75 °C lassen(Edit: Natürlich umso niedriger, je mehr Spannung!). Rest ist Spielerei. Wenn Du fertig bist, gibst Du einfach noch 20-40mV mehr drauf. Eigentlich müsste das reichen.

Edit: Sorry für den OC- Guide ;) Dein 4790K hat ja sowieso einen 4,4GHz Turbo. Also macht es Sinn, nur die Stabilität und die Temperatur mit den genannten Settings zu testen, weil OC da nicht wirklich was bringt.

wird AMD in der zukünftigen Reihe HBM2 6GB+ verwenden und neue GPUs oder eher wieder ein Refresh mit HBM2 ?

GPUs werden in 14nm FinFET(AMD) bzw. 16nm(Nvidia) gefertigt. Effizienz und somit auch theoretische Leistungsfähigkeit wird sich mindestens verdoppeln. Die ersten GPUs werden aber wahrscheinlich nicht gleich 2,5 mal so schnell ;). Speicher wird zumindest bei AMD nach meinen Infos 8GiB/16GiB HBM2 für den Mainstream und 32GiB für die FirePro- Karten. Edit: Bei Nvidia wohl auch.
 
Zuletzt bearbeitet:
lies dir folgendes mal durch ... dann wirst du schon weniger fragen haben AMD Radeon R9 Fury X im Test (Seite 11) - ComputerBase
Da wird eigentlich alles erklärt, sogar mit VRAM Mengen Messungen.

HBM wird benötigt um die Bandbreite (in Bit) für Zukünftige GPUs zu ermöglichen.
Fiji hat z.B. 4x 1024Bit (4096Bit)
GDDR5 ist bei 512Bit.

Hinzu kommen noch komprimierte Datenströme und Echtzeit Farbraumkompression.
Zip und RAR sollte jeder kennen, das selbe wird auch bei 3D Engines gemacht um die Datenströme so klein wie möglich zu halten.

Etwas exklusiv sind wohl die HSA Feature in Fiji wie z.B. ZeroCopy (VRAM <-> RAM) ;)
 
Zuletzt bearbeitet:
hbm"2" sollen ja mit 16-32gb kommen :d sprich -> spiel starten -> kurz warten -> zack is das GANZE spiel im vram :d
 
hbm"2" sollen ja mit 16-32gb kommen :d sprich -> spiel starten -> kurz warten -> zack is das GANZE spiel im vram :d
Eine gute 3D Engine nistet sich im VRAM ein. Möglich wäre es schon das Spiel komplett in VRAM zu laden aber ob das Sinn macht? Keine Ahnung.
Für VR und 3D-Brillen bei 4K sind potentere Pixelschubser dringend notwendig, wenn die Bildqualität besser werden soll.
Das wäre geil :d Maps loading 3-5s :d Aber ich wette das es auch ZACK und dein Geldbeutel ist leer wird :d
So lang kann es nicht mehr dauern: Samsung announces mass production of next-generation HBM2 memory | ExtremeTech
Seit einer Woche läuft bei Samsung die Massenproduktion von HBM2. :d
 
momentan gehts da echt drunter und drüber hbm/hbm"2"/gddr5/gddr5x/polaris/pascal/dx12 und was nich all da rauskommen soll ... ich denke das wird sich erst in der übernächsten generation alles gefestigt haben ... oder es knallt dieses jahr noch ordentlich was die leistung angeht aber das bezweifle ich irgendiwe
 
@MOB²
Aus meiner Sicht, macht es immer nur Sinn, genau die Daten in den VRAM zu laden, die nicht später noch rechtzeitig nachgeladen werden können. Sonst sitzt man eben nicht nur mal so 2 Sekunden am Ladebildschirm, weil die Daten immer noch auf der langsamen Festplatte(SSD) erst mal liegen. Alte Games sind ja bereits geschrieben und somit wird sich deren Ladeverhalten dadurch nicht ändern. Die neuen werden eher von den neuen Features durch das genannte VR in 4K, mehr Supersampling/AA oder noch bessere Texturen Gebrauch machen können.
Bei 4 Karten hätte theoretisch jetzt schon die Titan X mit 12GiB Sinn gemacht. Das Problem ist nur, dass die Spiele in der Regel keine solchen Einstellungen haben, wo du AA oder Supersampling so weit hochschrauben kannst, dass die ausgelastet werden. Ist auch verständlich, weil viele Gamer das Prinzip verfolgen: "Mit der besten Karte am Markt, muss ich alles auf Ultra zocken können. Wenn nicht, heule ich die Entwickler voll, weil ich zu dumm bin, etwas runterzustellen."
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh