Die GeForce RTX 2080 Ti leidet offenbar an erhöhter Ausfallrate (6. Update)

Zuletzt bearbeitet:
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Sagt er denn iwo, ob Samsung verbaut ist auf den Karten die er da gerade testet?
 
Mal eine Frage seitwärts... Kann man GPU-Z eigentlich vertrauen, welcher Speicherhersteller unter Memory Type angezeigt wird?
Hintergrund: Bei meiner MSI RTX 2080 (non-Ti) wird dort "GDDR6 (Samsung)" angezeigt.
 
Sagt er denn iwo, ob Samsung verbaut ist auf den Karten die er da gerade testet?
Alles Micron, denk mal nach, die ersten Samsung-Karten kamen letzte Woche in Umlauf, wie sollen die schon von Usern mit Defekten bei ihm sein?

Aber er sagt klar etwas zum Thema der Verwendung von Samsung-GDDR6 bei neueren Auslieferungen, genauso wie er Infos von verschiedenen Distributoren und AiBs weitergibt denen er vertraut.
Alles innerhalb der ersten 8min, sicher sinnvoll das anzuhören wenn einem das Thema interessiert.

@Laxer:
Ja, Karten werden inzwischen mit Samsung und Micron GDDR6 ausgeliefert.
Micron hatte nur Exklusivität für die ersten Batches.
 
Mal eine Frage seitwärts... Kann man GPU-Z eigentlich vertrauen, welcher Speicherhersteller unter Memory Type angezeigt wird?
Hintergrund: Bei meiner MSI RTX 2080 (non-Ti) wird dort "GDDR6 (Samsung)" angezeigt.

Du musst vorne auf der Startseite schauen, nicht unter Advanced. Da steht nur, was alles verbaut sein kann.
 
GPU-Z.gif
Okay, Danke für die Rückmeldungen.
Demnach sollte es wirklich Samsung sein...
 
Alles Micron, denk mal nach, die ersten Samsung-Karten kamen letzte Woche in Umlauf, wie sollen die schon von Usern mit Defekten bei ihm sein?

Aber er sagt klar etwas zum Thema der Verwendung von Samsung-GDDR6 bei neueren Auslieferungen, genauso wie er Infos von verschiedenen Distributoren und AiBs weitergibt denen er vertraut.
Alles innerhalb der ersten 8min, sicher sinnvoll das anzuhören wenn einem das Thema interessiert.

Vllt war auch ganz banal eine Charge Micron Ramchips fehlerhaft?

Man könnet sich natürlich noch fragen, ob die Karte im Video vorher schon defekt war. Aussagekraft hätte es nur wenn sie vorher noch nicht in Betrieb war, bzw. frisch aus der Packung.
Wenn wir Glück haben ist die Sache mit dem Samsung-Speicher jetzt erledigt, mal sehen ...
 
Alle Karten die er in dem Live Stream testet kommen von Usern die ihm die Karte als defekt zugeschickt haben.

Es geht mir eher darum dass er in seinen Tests zeigt dass es eben nicht direkt mit der VRAM oder VRM-Kühlung zu tun hat.
Die zweite verbaute Karte zeigt deutliche Artefakte bevor sie crasht, da sind auch Temp-fühler verbaut und er kommt nie höher als 75°C bei VRAM oder VRM.
 
Ich hatte schon Prozessoren, welche nach Jahren durch elektromigration nicht mehr so hoch übertaktet wurden konnten, wie anfänglich.

Wieso sollte ein geschädigter Speicher nicht nur noch bis 75 Grad fehlerfrei funktionieren?
 
Vllt war auch ganz banal eine Charge Micron Ramchips fehlerhaft?

Wenn die Chips fehlerhaft sind, würde es schon beim booten/in Windows Bildfehler geben. Die Artefakte scheinen bei den betroffenen Karten aber erst nach einer kurzen Aufwärmphase aufzutreten. Wenn der VRAM an der Ursache beteiligt sein sollte, dann wohl eher indirekt und sehr spezifisch. Ich sehe da jedenfalls im Moment kein grundsätzliches Problem mit Micron Chips.

Bin gespannt wie sich nun die neuen Karten mit Samsung VRAM verhalten werden.
 
Alle Karten die er in dem Live Stream testet kommen von Usern die ihm die Karte als defekt zugeschickt haben.

Es geht mir eher darum dass er in seinen Tests zeigt dass es eben nicht direkt mit der VRAM oder VRM-Kühlung zu tun hat.
Die zweite verbaute Karte zeigt deutliche Artefakte bevor sie crasht, da sind auch Temp-fühler verbaut und er kommt nie höher als 75°C bei VRAM oder VRM.

Stimmt hast du recht, demnach doch nicht der Speicher?

Kann natürlich trotzdem möglich sein das er defekt ist auch ganz unabhängig von seiner Temperatur ...
 
Ich hatte schon Prozessoren, welche nach Jahren durch elektromigration nicht mehr so hoch übertaktet wurden konnten, wie anfänglich.

Wieso sollte ein geschädigter Speicher nicht nur noch bis 75 Grad fehlerfrei funktionieren?

Naja, es besteht schon ein Unterschied zwischen defekt und gealtert.

Aber selbst wenn, sollten die Chips dann bei Taktreduzierung deutlich stabiler werden, was aber nicht der Fall zu sein scheint.
 
Takeaway von GamersNexus:

1. Die Karten die defekt sind, haben auch schon bei unter 70 Grad beim Speicher Probleme.
2. Karten die nicht defekt sind, hat er bei 100-105 Grad betrieben über Tage und es ging nichts kaputt.
3. Er hat nicht das entsprechende Zeug um auf Microebene den Chip zu untersuchen.
4. Seine Kontakte reden von RMA Quoten im Bereich von 0,2% teilweise, er schließt also ein größeres Problem komplett aus.
5. Das verschiedener Speicher benutzt wird sieht er als komplett normal an, weil das neu neuen Produkten immer so gemacht wird. Grund wäre das zu geringe Volumen, das ein Hersteller alleine liefern könne.
 
Takeaway von GamersNexus:

2. Karten die nicht defekt sind, hat er bei 100-105 Grad betrieben über Tage und es ging nichts kaputt.

Das hieße für mich es gibt auch Speicher, der auch gut mit höheren Temperaturen klar kommt. Eine neue Karte also erst mal schön auf voller Pulle im geschlossenen Gehäuse ohne Lüfter im Dauerstress laufen lassen. Lebt sie nach einer Woche noch, darf sie bleiben.

- - - Updated - - -

Naja, es besteht schon ein Unterschied zwischen defekt und gealtert.

Ach, wo denn genau in diesem Fall?

Beides mal hat sich die Güte verschlechtert (wenn die Grafikkarte bei 60 Grad noch einwandfrei funktioniert und erst bei 70 Grad Artefarkte bildet). Wobei es sich hier natürlich nicht um die Folgen von Elektromigration handelt! Dazu sind Zeit und Temperatur zu gering. Sondern um die Auswirkungen von über-/Belastung von Silizium.
 
Zuletzt bearbeitet:
Macht du so blödsinnige Stresstests mit jeder neuen Hardware?

Keiner sagt dass es nicht defekte RTX-Karten gibt, es geht doch darum ob es hier um ein generelles Problem mit diesen Karten gibt.
Da war eine der Mutmaßungen dass der VRAM aufgrund einer falschen Kühllösung zu heiß wird, diese These kann inzwischen verworfen werden.
 
Ach, wo denn genau in diesem Fall?

Beides mal hat sich die Güte verschlechtert (wenn die Grafikkarte bei 60 Grad noch einwandfrei funktioniert und erst bei 70 Grad Artefarkte bildet). Wobei es sich hier natürlich nicht um die Folgen von Elektromigration handelt! Dazu sind Zeit und Temperatur zu gering. Sondern um die Auswirkungen von über-/Belastung von Silizium.

Von welcher Überbelastung sprichst du hier? Der Speicher muss beim verlassen der Fabrik seine Spezifikation erfüllen. Tut er das nicht, gilt er als defekt. Sämtliche 2080Ti Karten halten im Betrieb diese Spezifikation auch ein. Eine Überbelastung findet also nicht statt.

Wenn du nun darauf hinaus willst, dass Micron hier ein paar schlecht gebinnte Chips rausgehauen hat, dann müssten die auffälligen Karten - wie bereits geschrieben - bei Taktreduzierung (oder niedrigeren Temperaturen) stabiler werden. Tun sie aber nicht! Insofern hat diese Theorie auch wenig Substanz.
 
Wenn das stimmt was dort einer schreibt, scheint Samsung noch nicht die Lösung zu sein :confused:

Was niemanden überrascht, bis auf die Leute die alles ignorieren was die letzte Woche getestet wurde.
Also quasi nur die, die fest an etwas glauben wollen, egal was die Realität dazu sagt. ;-)
 
Hab ich vorhin gelesen und bin eher skeptisch.
Ich weiß jetzt aber nicht sicher in welcher Form NVidia die Chips ausliefert an die Partner,... löten die selber?

Wenn ja, dann ist das natürlich eine Erklärung für die gehäuften FE Ausfälle. Wobei "gehäuft" ja auch eher geraten ist, da man das nicht bestätigen kann.
Wenn nein, dann ist die Theorie wohl direkt wieder zu verwerfen, weil die geringe Ausfallquote der Boardpartner auf keinen Fall für so einen gravierenden Fehler spricht.
 
Hab ich vorhin gelesen und bin eher skeptisch.
Ich weiß jetzt aber nicht sicher in welcher Form NVidia die Chips ausliefert an die Partner,... löten die selber?

Foxconn ist Nvidias OEM, dort werden die Packages ja auch auf die Referenzplatinen gebracht.
 
wenn es ein problem bei foxconn gab ist das natürlich arschig, weil es jede karte treffen kann, die den nvidia-schriftzug am peg-anschluss trägt. welche ironie!!! die letzten jahre habe ich auf diese PCBs geschworen und ausgerechnet bei der aktuellen generation setze ich auf ein custom-pcb und das war dann sogar richtig.. *gg*


(..)

mfg
tobi
 
Heißt das also, dass MSI, Asus und co nicht bei Foxconn diese Lötungen vornehmen?
Ich bin da echt unsicher in welcher Form NVidia die Chips an die Partner ausgibt. Ich dachte zuerst das die schon verlötet an die Partner gehen, bin aber jetzt gar nicht mehr so sicher.

Würde auf jeden Fall erklären wieso die RMA Rate bei Boardpartnern zwischen 0,1 und 1,4% nur liegt, aber trotzdem gefühlt eine Tonne an Leute meckern.
 
Heißt das also, dass MSI, Asus und co nicht bei Foxconn diese Lötungen vornehmen?
Ich bin da echt unsicher in welcher Form NVidia die Chips an die Partner ausgibt. Ich dachte zuerst das die schon verlötet an die Partner gehen, bin aber jetzt gar nicht mehr so sicher.

Würde auf jeden Fall erklären wieso die RMA Rate bei Boardpartnern zwischen 0,1 und 1,4% nur liegt, aber trotzdem gefühlt eine Tonne an Leute meckern.

Ich glaube alle platinen im Referenzdesign kommen vom gleichen Fertiger Foxconn, ganz sicher bin ich aber nicht.
 
Zum Update 5 ... kleiner Fehlerteufel oder?:

HardwareLUXX schrieb:
Nachdem es nun einige Tage still um das Thema geworden ist, gibt es dennoch weitere Ergebnisse. GamersNexus hat sich ein Dutzend Founders Editionen angeschaut und konnte das Problem nicht auf eine Komponente einschränken. Bei einigen Karten traten die Artefakte bereits bei 70 °C auf, andere liefen aber auch mit 100 °C am Speicher noch problemlos. Micron ist damit wohl vorerst aus dem Schneider – war nach genauerer Betrachtung aber auch nicht der alleinig Schuldige.
Bereits mehrfach wurden schlechte Lötstellen als Grund für den Fehler vermutet, denn auch hier spielen die Temperatur und eine Ausdehnung und das Zusammenziehen der Komponenten eine Rolle. Die GDDR6-Speicherchips und auch das (das Paket) GPU-Package selbst sind per BGA (Ball Grid Array) auf dem PCB verlötet. Die kleinen BGA-Balls werden mit den entsprechenden Pads auf dem PCB in Verbindung gebracht. Im Falle eines GDDR6-Speicherchips sprechen wir von 190 Kontakten. Beim GPU-Package dürften es einige tausend sein.

Sollte die Ausfallrate wirklich erhöht sein, ist das, gerade bei den veranschlagten Preisen, ein Unding.
 
ich frage mich eher wie nvidia das handeln wird.

entweder rückruf und geld zurück oder ewiges tauschen der karten? letzteres kann ja wohl nicht die lösung sein solange man nicht weiß woran es liegt.

traurig das ganze, aber noch viel ärgerlicher für die ganzen Käufer die so viel geld hingelatzt haben
 
ich frage mich eher wie nvidia das handeln wird.

Nvidia hat gesagt, dass sie keine Probleme sehen, sie sollten jetzt zu diesem Statement stehen, alles andere wäre zu peinlich. /:

Wenn die Verlötung das Problem ist, haben sie es bestimmt in laufender Produktion längst gelöst, die paar Karten aus den fehlerhaften Chargen die noch kaputt gehen, tauschen sie aus und gut ist.
 
ich frage mich eher wie nvidia das handeln wird.

Erstmal den Ball flach halten, bis wir überhaupt sicher sind, dass es ein Problem gibt.
Vermutungen, Theorien usw. hatten wir schon genug. Bisher wurden keine davon erfolgreich bewiesen, im Gegenteil sogar.

Ich frage mich, ab wann man sagen kann, dass die ganzen RMA Quoten, die man hört, halt doch nicht gelogen sind.
Klar, man kann jetzt auch jedes mal wenn eine Theorie nicht aufgeht, einfach ne Neue erfinden. Nur, wann hört das auf?
Sicher haben wir noch nichts Endlastendes für die FE Karten, aber für die Boardpartner Karten haben wir ja langsam genug.
Würde es da nicht zumindest Sinn ergeben die Theorien sein zu lassen, die nicht FE only sind? Da investieren Leute verdammt viel Energie in Etwas das schon von Anfang an nicht aufgehen kann.

Fände es deutlich besser, wenn diese Energie in Theorien gesteckt würde, die auch eine Chance haben valide zu sein.
 
Wer trägt denn die Beweislast bzw. ist in der Situation diese zu führen?
Käufer, Produzent, Lieferant des Bauteils x?
Aussagen von welcher Partei auch immer sind können auch erlogen sein.
Wenn Wenige am lautesten schreien muss es nicht unbedingt was heißen.

Solange umgetauscht wird ist noch alles i.O.
Kaufentscheidung trägt dennoch weiterhin der Käufer und bei Misstrauen wird einfach nicht gekauft.
 
Ich glaube alle platinen im Referenzdesign kommen vom gleichen Fertiger Foxconn, ganz sicher bin ich aber nicht.

Laut Ignor Wallossek ist das nicht 100% richtig / immer so.
Es gibt zwar Partner die direkt das Referenz 1:1 kaufen, aber normal wird wohl selbst das Referenz PCB vom Partner selber gemacht.
Wenn kein Referenzdesign vorliegt, wird definitiv selber gelötet.

Der SMT-Prozess erfolgt beim Boardpartner vor der manual insertion line, dem Wellenlötbad, der Reinigung und Endmontage.

Am Anfang kaufen viele AIC die fertigen Referenz-PCBs und pappen ihre Kühler drauf oder labeln die komplett zugekauften Referenzkarten

Damit haben wir also ein weiteres Indiz, dass dieses Problem wohl nur die FE und 100% zugekaufte Referenzdesigns betrifft.
Vorrausgesetzt das Problem wird so bestätigt weiterhin.

Käufer von custom PCBs sind, zumindest bei dieser Theorie, also save. Was auch die extrem geringe RMA Quoten erklärt, bzw. glaubwürdig macht.
Man kann natürlich alle Indizien, Aussagen und Tests als "gelogen" abstempeln und selektiv nur das glauben was einem ins Weltbild passt. Aber es sieht aktuell gut aus für die Boardpartner Karten, die ja bei den meisten Käufern eh bevorzugt werden.
 
Zuletzt bearbeitet:
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh