Warum HBM mehr als nur eine Erhöhung der Speicherbandbreite ist

wenn es ein voller Tonga chip ist, dann ist es auch KEIN rebrand...
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Schöner Artikel, nur wann kommt die schöne Technik. 2016, 2017 oder niemals.
In den nächsten Wochen AMD-GPUs; in Q3 Intels Xeon Phi More Knights Landing Xeon Phi Secrets Unveiled ; 16/17 Zen/AM4 und Skymont/Cannonlake

...und auch schön das AMD mal wieder treibende Kraft ist. Ich hoffe HBM findet bald auch bei nvidia einzug.
Beide Prozessorhersteller treiben das an, da (G)DDR3/4(5) zu lahm ist und die Speicherhersteller Jahre gepennt haben. Nvidia muss als dritter Hersteller nachziehen um nicht Marktanteile zu verlieren....
 
HMC ist teurer, war sicher ein grudn warum NVIDIA da pläne eingestampft hat.
und er ist mehr auf CPUs optimiert, weil Intel das wichtiger ist, war wohl für NVIDIA dann auch nicht mehr so ideal.

wird interessant wenn HBMv2 komtm udn der auch schlecht verfügbar ist, da wird dann NVIDIA im schlechtesten fall nicht ausreichend speicher bekommen, weil man AMD sicher vorrangig beliefern wird!
 
Ach hör mir auf mit dem, habe mich gestern so aufgeregt und nen leicht bleidigenden Beitrag an Ihn gerichtet... der war ruckizucki wegmoderiert! - Sein dämliches getrolle und gebashe lassen die Herren bei CB aber stehen...
Deswegen sind auch schon 17 Beiträge des Users entfernt wurden und davon 3 im besagten Thread ;)
 
aber nicht alle und gesperrt ist er auch noch nicht.

wenn man das selbe geflame in die andere richtugn abliefert, dann ist man bei CB SOFORT gesterrt, hab das mal weil mir sehr sehr fad war getestet!
ich durfte sogar alle AMD-Nutzer pauschal beleidigen^^
 
Bei CB wird vieles erst moderiert, wenn man es meldet. Ich denke das Problem ist hier eher, dass die Nutzer mehr zu Nvidia neigen und entsprechend vom Melden-Button Gebrauch machen. Aber genug dazu.
 
Und eben genau das stimmt einfach nicht. Wenn man das so herunterbricht werden einfach weite Teile der Speichertechnik und des Interfaces ignoriert, was Auswirkungen auf die Gesamtleistung haben kann. Ob das der Fall ist wissen wir einfach nicht, weil noch niemand die Daten kennt und vermutlich sind AMD und NVIDIA auch die einzigen beiden, die jemals genau wissen werden, wie viel schneller "Hawaii" und "Maxwell" mit HBM wäre und wie viel langsamer "Fiji" und "Pascal" mit klassischem GDDR5 wären.

In meinen Augen macht es einfach keinen Sinn so etwas simulieren zu wollen. Genauso wie es keinen Sinn macht eine neue GPU zu simulieren, in dem man den Takt so lange hochdreht, bis man auf die vermutete Rechenleistung einer Neuvorstellung kommt. Hier spielen dann einfach andere Faktoren auch noch eine Rolle und die kann ich nicht so einfach ausschalten.

HBM und GDDR5 sind tatsächlich schön vergleichbar. Die DRAM Speichertechnik ist gleich, Interface ist anders aber nicht wirklich effizienter. Alles bleibt dominiert bei klassischen DRAM-timings und der Gesamtparallelität für die Bandbreite. Der Rest ist gutes Marketing um die sau teure neue Technik an den Technikfreak zu bringen, ähnlich wie obenliegende Nockenwelle bei Autos. Deshalb darf das nicht den Blick verstellen und CB darf mal nachsehen inwieweit Hawaii von mehr Bandbreite profitiert, da Fiji auch noch im gleichen Prozess gefertigt wird. Natürlich wäre eine höhere Auflösung besser gewesen.
 
Bei CB wird vieles erst moderiert, wenn man es meldet. Ich denke das Problem ist hier eher, dass die Nutzer mehr zu Nvidia neigen und entsprechend vom Melden-Button Gebrauch machen. Aber genug dazu.
eben nicht, hab mich mit einem anderem account selbst gemeldet, es ist ihnen einfach egal!

gegen Intel/NVIDIA flamen ist dort nicht erlaubt, gegen AMD ist es ihnen egal.
es kann sogar passieren, daß man als neuer user gesperrt wird, wenn man AMD gegenüber positiv eingestellt ist und solche trolle mit fakten aufklären will!

ein mal wurde ich gesperrt, weil ich der meinugn bin das Intel mit 14nm arge probleme hatte, dabei hab ich meine behauptungen mit fakten belegt.
udn wenige tage danach hat mir ein artikel auf CB sogar recht gegeben^^^^

- - - Updated - - -

da Fiji auch noch im gleichen Prozess gefertigt wird. Natürlich wäre eine höhere Auflösung besser gewesen.
Fiji hat aber statt GCN2 schon GCN3 und 45% mehr shader, daß wurde komischerweise NICHT berücksichtigt.
bei Hawaii limitiert halt die rechenleistung der GPU...
 
Zuletzt bearbeitet:
ein mal wurde ich gesperrt, weil ich der meinugn bin das Intel mit 14nm arge probleme hatte, dabei hab ich meine behauptungen mit fakten belegt.
udn wenige tage danach hat mir ein artikel auf CB sogar recht gegeben^^^^
Nein,immernoch wirst Du überall gesperrt weil Du einfach nicht den guten Ton triffst.Für Meinungen wird man nicht gesperrt,sondern für die Art wie man sie vertritt.
 
HBM und GDDR5 sind tatsächlich schön vergleichbar. Die DRAM Speichertechnik ist gleich, Interface ist anders aber nicht wirklich effizienter. Alles bleibt dominiert bei klassischen DRAM-timings und der Gesamtparallelität für die Bandbreite. Der Rest ist gutes Marketing um die sau teure neue Technik an den Technikfreak zu bringen, ähnlich wie obenliegende Nockenwelle bei Autos. Deshalb darf das nicht den Blick verstellen und CB darf mal nachsehen inwieweit Hawaii von mehr Bandbreite profitiert, da Fiji auch noch im gleichen Prozess gefertigt wird. Natürlich wäre eine höhere Auflösung besser gewesen.

Es macht schon einen Unterschied wenn man über eine Schnellstraße den Verkehr schickt oder über eine Landtraße. Nichts anderes wird mit HBM Erreicht. Achja ich muss sagen, dafür dass du wohl noch weniger Ahnung als Don über die Materie hast, tönst du ziemlich laut.
 
War das absichtlich ein Seitenhieb an Don?
"noch" weniger... ich finde dein Ton bissl unangebracht, der Artikel liest sich fachlich sauber und inhaltlich finde ich Ihn verständlich.
Ahnung habe ich keine, die Tief genug geht um zu sagen dass das Falsch oder Richtig ist, jedoch kann ich sagen es klingt stimmig!

Wenn du hier so viel mehr weißt, würde ich dich bitten, belege es und bitte mit nachweisen.
Behaupten kann man nun mal sehr viel.
 
Ich weiß ziemlich genau worüber ich bei HBM spreche.
Ja, die Ansteuerung ist anders, aber nicht wirklich effizienter in Bezug auf DRAM Zugriff, nur angepasst an das physikalische Interface. Erst 'HBM2' kann mit Split Adressing effizienter werden, damit aber kann Fiji nix anfangen. Single Bank Refresh kann max 5% bringen – das war‘s dann auch. Niedrigere Latenzen gibt es nicht. Woher sollen die kommen, da wird nicht eine ns gespart. Bei Gddr5 müssen 256bit durch einen 8:1 Seralizer und bei HBM sind es 256bit durch den 2:1 Serializer plus Interface Die Rebuffering - ist Gleichstand. So wurde HBM auch erdacht damit es in den existierenden GPU Speichercontroller passt.
Ich sage ja nicht dass HBM nichts bringt. Durch die geringe Bauform, ist es möglich paralleler zu gehen. Das gibt dann die größere Bandbreite. Und Strom wird auch etwas gespart, nur eben nicht so Marketingvollmundig, zu viele Äpfel und Birnenvergleiche.

Sorry, aber du ziehst dir hier nur Argumente aus den Fingern ohne etwas darüber zu wissen. HBM ist absolut nicht mit GDDR5 vergleichbar sonnst hätte man es auch einfach GDDR6 nenne können !
HBM ermöglicht eine extreme Parallelisierung, daher skaliert die Bandbreite auch mit der menge an Speicher. Je mehr Speicherchips angebunden sind desto höher wird die Bandbreite. HBM1 erlaubt allerdings nur 4 Blöcke was man aber durch einen Trick verdoppeln möchte.
Eventuell leidet dadurch die Latenz, die aber durch die Parallelisierung trotzdem deutlich besser ist als beim herkömmlichen Speicherinterface. HBM ist Parallelisierung in allen Bereichen. Wer das nicht verstanden hat, der versteht HBM nie !
Da HBM so effektiv von statten geht, wird auch Energie gespart. Je effektiver etwas ist, desto weniger wird verbraucht.

Letztendlich ging es mir darum zu sagen, dass das Fazit des Artikels nicht stimmt. Es ist eben sehr wohl möglich Rückschlüsse vom Hawaii auf Fiji zu ziehen indem einfach die Bandbreite erhöht wird.

Seit wann kann man Architekturen miteinander gleichsetzten ? Über Fijis Aufbau ist kaum etwas bekannt, außer die Shaderanzahl und die ist nur ein Rad im Getriebe. Wie das Frontend durch HBM aufgebaut ist oder wie die Shader in ihre Leistung erhöht wurden ist nicht bekannt. Auch nicht wie die GCN-Architektur auf HBM reagiert ist auch nicht bekannt. Wie man mit den Treibern nun arbeitet kann ist auch nicht bekannt.
Also, wie kann man das nun mit einer einfachen Erhöhung der Bandbreite bei Hawaii mit GDDR5 simulieren ? Das ist doch eine Milchmädchenrechnung !

Ich sehe HBM als den richtigen Weg an und kann den Pessimismus nicht nachvollziehen.
 
Es macht schon einen Unterschied wenn man über eine Schnellstraße den Verkehr schickt oder über eine Landtraße. Nichts anderes wird mit HBM Erreicht. Achja ich muss sagen, dafür dass du wohl noch weniger Ahnung als Don über die Materie hast, tönst du ziemlich laut.

Den Daten ist es ziemlich egal wie sie von A nach B kommen, parallel und langsam (HBM) oder schnell und weniger parallel (GDDR5). Wenn das in gleicher Zeit passiert, wie bei GDDR5 und HBM, ist es für die Performance egal, Bandbreite und Latenz konstant. Nur braucht GDDR5 durch den höheren Takt und die Terminierung im Interface mehr Energie. Die gesparte Energie kann dann für noch parallele Interfaces genutzt werden, wie bei Fiji.
 
bei 4096bit anbindung, man dann den PHY aber auch einfach für mehr speicher auslegen, wird dann halt teurer.
Zudem gilt es als recht sicher dass AMD eine Technik entwickelt hat, um jeweils 2 der Stapel zu verbinden. Ob wir die in einer 8Gb Versions ehen werden, bleibt abzuwarten.

@ozMan: Du hast die Ahnung einer maus, über dieses Thema...
 
Den Daten ist es ziemlich egal wie sie von A nach B kommen, parallel und langsam (HBM) oder schnell und weniger parallel (GDDR5). Wenn das in gleicher Zeit passiert, wie bei GDDR5 und HBM, ist es für die Performance egal, Bandbreite und Latenz konstant. Nur braucht GDDR5 durch den höheren Takt und die Terminierung im Interface mehr Energie. Die gesparte Energie kann dann für noch parallele Interfaces genutzt werden, wie bei Fiji.

Deshalb hat HBM bei gleichem Speichertakt auch die doppelte Bandbreite... Und HBM2 wird die 4-fache Bandbreite haben... Theoretisch könnte man mit HBM den Speichertakt halbieren und somit extrem effizient agieren.
Muss man da noch mehr erklären ?
 
Seit wann kann man Architekturen miteinander gleichsetzten ? Über Fijis Aufbau ist kaum etwas bekannt, außer die Shaderanzahl und die ist nur ein Rad im Getriebe. Wie das Frontend durch HBM aufgebaut ist oder wie die Shader in ihre Leistung erhöht wurden ist nicht bekannt. Auch nicht wie die GCN-Architektur auf HBM reagiert ist auch nicht bekannt. Wie man mit den Treibern nun arbeitet kann ist auch nicht bekannt.
Also, wie kann man das nun mit einer einfachen Erhöhung der Bandbreite bei Hawaii mit GDDR5 simulieren ? Das ist doch eine Milchmädchenrechnung !

Ich sehe HBM als den richtigen Weg an und kann den Pessimismus nicht nachvollziehen.

Sorry performancetechnisch lässt sich HBM und GDDR5 sehr wohl vergleichen. Ein HBM Würfel enthält 4 DRAM Schichten mit jeweils 2 Kanälen, jeder der Bandbreite eines GDDR5. Daher 1 HBM1 entspricht genau 8 Stück GDDR5. Davon hat Fiji 4 äquivalent zu 32 GDDR5. Ist schon beeindruckend. Die CB Frage war doch, profitiert die Hawaii von der mehr Bandbreite. Wenn Fiji jetzt die doppelte Bandbreite hat, kann die überhaupt sinnvoll verwendet werden? Da Hawaii und Fiji im gleichen 28nm Prozess hergestellt werden, sind kein Wunder zu erwarten, mehr Shader mehr für das gesparte GDDR5 PHY.
 
Am Ende zählt was am Bildschirm ankommt .
Sollte AMD nicht an der TitanX vorbeiziehen mit all den tollen Innovationen bringt einem das alles am Ende auch nichts alls Kunde.
Hoffe das da wirklich GCN1.3 oder 2.0 Einzug hält und die Architektur deutlich besser skaliert als bisher.

Ich finde das HBM ein sehr guter Schritt ist jedoch hoffe ich auch das in der kommenden Gen dadurch die Speichergröße nicht bei 4GB limitiert .
Den das wiederum wäre für mich eine Art Stillstand und würde aus einem Vorteil zu einem Nachteil werden.
 
Die CB Frage war doch, profitiert die Hawaii von der mehr Bandbreite. Wenn Fiji jetzt die doppelte Bandbreite hat, kann die überhaupt sinnvoll verwendet werden? Da Hawaii und Fiji im gleichen 28nm Prozess hergestellt werden, sind kein Wunder zu erwarten, mehr Shader mehr für das gesparte GDDR5 PHY.

Die Doppelte Bandbreite wird wohl nicht voll und ganz ausgenutzt werden können, vorerst. Doch die Extrabandbreite wird definitiv nicht nutzlos sein und ausgenutzt werden können.

Viel interessanter wird es aber bei Mid Range GPU,s. Man stelle sich eine GTX960 mit HBM vor, das wäre an Effizienz einfach Klasse.
 
es ist wie auch bei Tonga GCN3
Hawaii = GCN2

Vorab wurde der Hawaii-Chip als "GCN 2.0" gehandelt, allerdings verwendet AMD diesen Begriff nicht und möglicherweise kommt später noch einmal eine offizielle GCN 2.0 Architektur. Aus diesem Grund – und weil die technologischen Änderungen außerhalb der höheren Einheiten-Zahl eher geringfügig sind – ist es wohl sinnvoller, den Hawaii-Grafikchip inoffiziell als "GCN 1.1" zu bezeichnen.
Habe das nur so in Erinnerung gehabt.
 
Sorry performancetechnisch lässt sich HBM und GDDR5 sehr wohl vergleichen. Ein HBM Würfel enthält 4 DRAM Schichten mit jeweils 2 Kanälen, jeder der Bandbreite eines GDDR5. Daher 1 HBM1 entspricht genau 8 Stück GDDR5. Davon hat Fiji 4 äquivalent zu 32 GDDR5. Ist schon beeindruckend. Die CB Frage war doch, profitiert die Hawaii von der mehr Bandbreite. Wenn Fiji jetzt die doppelte Bandbreite hat, kann die überhaupt sinnvoll verwendet werden? Da Hawaii und Fiji im gleichen 28nm Prozess hergestellt werden, sind kein Wunder zu erwarten, mehr Shader mehr für das gesparte GDDR5 PHY.

Bei CB werden immerhin 2-5% Mehr Performance bei ca. 400 GB/s attestiert !
Fiji hat alleine schon fast 50% mehr Shader. Da kommt man mit GDDR5 nicht mehr weit, da man nun mit hohen Taktraten hantieren müsste um alleine die Bandbreitenvorteile gegenüber HBM auszugleichen.
Fiji benötigt mehr Bandbreite als Hawaii !

Umgerechnet benötigt einen R9 295X2 ca. 500 Watt mit 5636 Shadern. Das wird durch zwei 512 bit Speicherkontroller (640 GB/s) an insgesamt 8GB-Speicher ermöglicht.
Fiji hat 4096 Shader und ebenfalls 640 GB/s Bandbreite an vermutlich 8 GB-Speicher. Was würde diese Karte also nun verbrauchen, wenn Fiji = Hawaii wäre mit GDDR5-Speicher ? 350-400 Watt ??

Laut Leaks sind es aber nur 250-280 Watt bei einem Coretakt von 1050 MHz.
Nun frage ich dich nochmals. Kann man Fiji mit Hawaii vergleichen ?
Wohl kaum. Daher sind Vergleiche mit Speicherbandbreiten von Hawaii komplett nichtssagend.
 
Zudem gilt es als recht sicher dass AMD eine Technik entwickelt hat, um jeweils 2 der Stapel zu verbinden. Ob wir die in einer 8Gb Versions ehen werden, bleibt abzuwarten.

@ozMan: Du hast die Ahnung einer maus, über dieses Thema...

Die Maus hat leider vom Thema keine Ahnung, aber die Verbindung 2er HBM's ist von JEDEC nicht vorgesehen, die haben ein Point_to_Point Interface. Sowas macht man nur aus Verzweiflung weil 4GB bei einer High-End Karte echt blöd kommen.
Point_to_2Point kann eventuell bei HBM1 noch gehen weil die IO Speed niedriger ist, aber die Signal-Integrität auf so einem doppelt so langen Silicon-Interposer-Kanal ist schon grenzwertig ( Silicon dämpft sehr stark im Vergleich zum FR4 einer Leiterplatte). Zusätzlich gibt es noch hässliche Data-Bubbles, Zeiten in denen gewartet werden muss, wenn von einem HBM zum 2. HBM am gleichen Kanal umgeschaltet wird. HBM1 und HBM2 haben bewusst keine DLL wie DDR3/4 zum Ausgleich Prozess Spannung Tempertur(PVT) bedingten Access-time Schwankungen, weil kein Busbetrieb geplant war, so muss dieses Manko mit Wartezeiten ausgebügelt werden - super effiziente Lösung. Fragen?
 
Naja,

wie es gelöst wird ist doch erst mal egal, wichtig bleibt am Ende, was kommt am Ende auf dem Bildschirm an!
Ob das jetzt wirklich so dramatisch ist oder nicht, wird sich ein hochbezahlter Ingenieur bei AMD schon vorher ausgedacht haben.
 
Hawaii profitiert nur wenig von mehr Bandbreite CB hat wohl wieder mal den Durchblick eingeflöst bekommen von NV echt lustig die Typen. :)
Mann darf gespannt sein was dann von denen kommt wen NV dann endlich mal HBM verbaut.:rofl:
 
Zuletzt bearbeitet:
Point_to_2Point kann eventuell bei HBM1 noch gehen weil die IO Speed niedriger ist, aber die Signal-Integrität auf so einem doppelt so langen Silicon-Interposer-Kanal ist schon grenzwertig ( Silicon dämpft sehr stark im Vergleich zum FR4 einer Leiterplatte).

Ja da hast du natürlich Recht. Das kann einfach nicht funktionieren und niemand ist in der Lage die Leiterlänge und die Lage der Leitung exakt so anzupassen und abzuschirmen, das sie ohne Problem ihren Dienst verrichten kann. Notfalls müsste man noch das Signal verstärken, was ja auch nicht funktionieren kann, da niemand weiß wie man das macht bzw. es vorher weniger abzudämpfen, was ja auch völlig unmöglich ist...

Wie haben die das nur vorher mit GDDR5 gemacht, als dieser noch viel weiter weg vom Speicherkontroller war mit teils bis zu 2000 MHz ? Hatte wohl nur Glück oder doch mehr Kenntnis darüber.

Zusätzlich gibt es noch hässliche Data-Bubbles,

Ja, diese Bubbles...ganz furchtbare Sache und erst diese Data-Rülpser sowie diese Data-Pupser sind wirklich sehr unangenehm. Da kann man wirklich nur hoffen, das AMD da noch einen guten Filter einbauen kann...

Zeiten in denen gewartet werden muss, wenn von einem HBM zum 2. HBM am gleichen Kanal umgeschaltet wird. HBM1 und HBM2 haben bewusst keine DLL wie DDR3/4 zum Ausgleich Prozess Spannung Tempertur(PVT) bedingten Access-time Schwankungen, weil kein Busbetrieb geplant war, so muss dieses Manko mit Wartezeiten ausgebügelt werden - super effiziente Lösung.

HBM arbeitet parallel. Wie oft eigentlich noch ? Das hat nix mit dem uralten DDR3 zu tun !
Bei HBM werden eben 2 x 4GB auf den Interposer verbaut. Alle Beide arbeiten unabhängig mit voller Bandbreite und können hin und her geschaltet werden. Wie man das nun bewerkstelligt und aufteilt, ist Treibersache und daher vermutlich die ganze Verzögerung.
Davon bekommst du als Spieler nix mit, da der Speicher deswegen nicht langsamer läuft. Klar ist das nur eine Notlösung bis HBM2 erscheint, aber immer noch besser als nur 4GB zu besitzen.


Nö. Das was du erzählst wissen wir schon aus dem Grundkurs. ;)
 
Zuletzt bearbeitet:
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh