NVIDIA beschleunigt den GPU-Interconnect und verdoppelt den HBM2-Speicher

Thread Starter
Mitglied seit
06.03.2017
Beiträge
114.153
nvidia.jpg
In diesem Jahr scheint sich NVIDIA auf der GPU Technology Conference auf einen Ausbau der bestehenden Produkte und Technologien zu konzentrieren. So präsentiert man eine Quadro GV100 mit 32 GB HBM2 und auch die Tesla V100 kann ab sofort mit der doppelten Speicherkapazität bestückt werden. Um diese schnelle GPU-Beschleuniger besser einsetzen zu können, muss aber nicht nur die einzelne Hardware schneller werden, sondern auch die Zusammenarbeit derselbigen.Die GV100-GPU verfügt über einen integrierten NVLink-Interconnect. NVLink 2.0 kann 50 GB/s in Sende- und Empfangsrichtung pro Link übertragen, da die Anzahl an Links mit der GV100-GPU auf sechs erhöht worden. Daraus...

... weiterlesen
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
und mit doppelter ungenauigkeit.

spass beiseite, klingt sehr interessant. dann dauert das remake vom barbie nussknacker nur mehr die hälfte der renderzeit.
 
ECC-Fehlerkorrektur heißt das Zauberwort im Gegensatz zur Titan V. So als kleiner Hinweis für die 3 Koryphäen über mir.

ich denke das mit der doppelten ungenauigkeit war eher auf fp8/16 bezogen da dass ja bei nvidia afaik eher ein Alleinstellungsmerkmal ist dass die da flexsibler sind und nicht nur 32 können bzw. das ungenauere halt schneller.

ansonsten hast schon recht die titan v hat kein ecc trotzdem ist halt die frage wieviel verrechnen man erwarten darf, bei -110% o.a. ist das schon ne harte Nummer, ich denke mal eher das 0.01% oder weniger ist üblich - und noch dazu wurde sie halt fürs wissenschaftliche arbeiten vom marketing beworben.
 
ECC kann lediglich Fehler im Speicher korrigieren oder zumindest identifizieren. Mit der eigentlichen Berechnung der Daten hat der Speicher aber nichts zu tun. Sollte es stimmen, dass in ausgewählten Szenarien bestimmte Ops im V100 zu falschen Ergebnissen führen, dann könnte auch ECC-RAM daran gar nichts ändern, weil bereits falsche Ergebnisse im VRAM abgelegt werden.
 
Evtl. solltest du nochmals den ursprünglichen Beitrag lesen und dann darüber nachdenken, warum ECC doch helfen kann.
 
holzmann hat hier recht. die ecc kann nur feststellen dass das was im ram ist nicht mit dem überenstimmt was die gpu gesendet uat. wenn die berichteten fehler aber durch ein designfehler entstehen nutzt dir auch der beste ecc ram nichts. die gpu sender das falsche ergebnis. die ecc stellt lediglich fest dass das was im speicher ist das ist, was von der gpu gesendet wurde.

du kannst mir ja gerne ein beispiel zeigen wo die gpu in den speicher schreibt 2+2=5 und der ecc das korrigiert.
 
Zuletzt bearbeitet:
ECC Speicher hat nichts direkt mit der Berechnung zu tun. Man kann damit einen Speicherfehler korrigieren, aber auf die errechneten Ergebnisse hat das keinen Einfluss.
 
wobei aleshondra auch das wort "kabn" verwendet hat. ach ich liebe das internetz
 
Es geht wohl eher darum, dass man direkt erkennt das was falsch läuft und nicht erst am Ende da steht und meint das Ergebnis sei richtig.

Bisher gibts diese Berichte auch nur von der Titan ... keine einzige Quadro hat sowas bisher produziert. Bleibt also abzuwarten an was es wirklich liegt. Wenn es zB die Tensor Cores sind am Ende dann werden auch die Quadros betroffen sein.
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh