RX 5700XT Anniversary Edition sporadische Lockups sowohl auf Linux als auch auf Windows

Geschlossen

Profi
Thread Starter
Mitglied seit
04.04.2017
Beiträge
154
Hallo zusammen,

Habe eine 5700XT Anniversary Karte und diese bleibt unter Linux sporadisch hängen unter Teillast/Idle (bisher immer, wenn ein Spiel wie Minecraft im Hintergrund lief und im Vordergrund Firefox läuft und eine Seite geladen wird)

Zu beachten hier ist: Ja, mir ist der Fehler des Kernel Bugs (GPU Recovery failed) bekannt, und dieser lässt sich im Syslog auslesen.

Allerdings vermute ich einen weiteren Fehler, denn: Dieser komplette System-lockup wird im Sys-log Dokument nicht aufgeführt, stattdessen teilt mir der Syslog mit, dass unlesbare Zeichen im Log vorhanden sind, nämlich genau an der Stelle, an der der Fehler eigentlich eingetragen werden sollte. Kurzum: es handelt sich hier um einen kompletten System-Freeze unter Linux Mint 19.3 mit Kernel 5.3.046, während der Kernel Bug "nur" ein Abstürzen der Karte beschreibt, das Betriebsystem allerdings trotzdem zumindest noch mitloggen kann.

Soweit so gut, allerdings habe ich aus Neugierde, um festzustellen, ob es sich eventuell um einen Hardware Defekt handelt, auch ein Windows 10 auf meinem Rechner. Dieses Windows ist neu aufgesetzt mit allen aktuellen Treibern. Und auch hier kommt es sporadisch zu einem kompletten System-lockup.

Zusammengefasst:

-System-Lockups sowohl auf Linux als auch auf Windows (sporadisch)

-entstehen bisher immer unter Idle/Teillast, bevorzugt kurz nach dem Booten, unter Vollast läuft alles ohne Probleme, auch ein Anheben des Powertargets führt bei einem Stresstest wie Furmark zu keinen Problemen

-keine Temperaturprobleme, GPU bei unter 65 Grad, Speicher bei max. 80 Grad

-werden im Linux nicht im syslog aufgelistet, im Gegensatz zu dem schon bekannten Kernelbug, der Linux hängen lässt

-Zeichen deuten auf Probleme auf Hardware oder Bios Ebene hin, allerdings ist das Internet voll von Problemen der AMD Navi Generation, was mich an einem Hardware Problem noch zweifeln lässt

-Lockups auf verschiedenen Betriebsystemen mit Linux als auch mit Windows reproduzierbar

-System lief vorher komplett stabil (war eine GTX 1070), aktuellstes Bios (5220 bei meinem X370 Strix) ist drauf Netzteil ist ein Straight Power 10 mit 700 Watt, was ausreichen sollte für alle Komponenten

-Sowohl Linux als auch Windows wurden nach dem Grafikkartenwechsel neu aufgesetzt mit aktuellsten Updates

Das alles sind bisher meine Beobachtungen. Übrigens scheint das Problem mit den Navi Karten verstärkt AMD only Systeme zu betreffen, sprich das Nutzen eines Ryzen Systems auf der AM4 Plattform. Ebenso scheint das Bios einen großen Part zu spielen.

Es handelt sich bisher aber trotzdem nur um Vermutungen. Eben aufgrund der weitreichenden Probleme der Navi Karten könnte es sich um ein Treiber Problem handeln, die beide Systeme betrifft, ggf. noch mit einem Bug im Bios, was diese Ausfälle erklären könnte.



Nun meine Frage: Ich scheue offen gesagt eine Reklamation, da sich diese als schwierig erweist, da ich die AMD Karte mit einer Eiswolf wassergekühlt habe und somit meine Garantieansprüche fort sind.

Handelt es sich hier um ein Treiber/Bios Problem, das sich lösen lässt/noch gelöst wird, oder habe ich es hier mit einer defekten Karte zu tun?
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Edit: Der Thread ist übrigens NICHT geschlossen! Geschlossen ist mein Profilname.
 
Hm, es ist nur ein Schuss ins Blaue, weil das Problem heutzutage weniger (aber nicht überhaupt nicht) vorkommt: IRQ-Konflikt? Hast du noch andere ggf. exotische Hardware? Mal die Grafikkarte in einen anderen Slot stecken? Was sagt denn z.B. lsdev?

Hast du ansonsten mal zum Testen im BIOS/EFI alles auf default bzw. Timings eher konservativ eingestellt?

Die Karte in einem anderen System einbauen geht wahrscheinlich gerade nicht?

Wann und wie oft tritt das Problem denn auf? Immer nur im eher kalten Zustand oder lässt es sich eher durch das Idle reproduzieren? Ist natürlich nicht abwägig, dass die Karte im kalten Zustand physikalische Probleme hat und bei mehr Wärme ein gewisser Widerstandswert/Leitwert überwunden wird und der Fehler dann nicht auftritt.
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh