2Stoned
Enthusiast
Thread Starter
- Mitglied seit
- 15.12.2006
- Beiträge
- 272
- Ort
- Erde
- Laptop
- Lenovo ThinkPad X220
- Prozessor
- AMD Ryzen 3950X
- Mainboard
- Gigabyte X570 Aorus Ultra
- Kühler
- Noctua NH-D15
- Speicher
- Samsung M391A2K43BB1-CTD 4x 16GB, DDR4-2666, ECC
- Grafikprozessor
- EVGA RTX 3060 12GB
- Display
- Dell Alienware AW2521H (360 Hz)
- SSD
- 2x 1 Tb Samsung 970 Evo Plus (NVMe)
- Gehäuse
- Be Quiet! Silent Base 801
- Netzteil
- Fractal Ion+ Plantinum 560 Watt
- Keyboard
- RealForce R2 PFU US ANSI topre silent switches
- Mouse
- GLORIOUS Model D
- Betriebssystem
- arch Linux
- Webbrowser
- vivaldi
- Sonstiges
- Intel X550-T2, DELOCK 20 Gbps USB-C 3.2 2x2 PCIe-Karte mit ASM3242 Chip
- Internet
- ▼10 GBit ▲10 GBit
TL;DR: Plötzlich häuften sich Abstürze von Programmen oder vom ganzen System. Ein CMOS reset beseitigt diese, doch nun startet das System nicht immer sauber, wenn mehr als ein Bildschirm angeschlossen ist.
Dies könnte ein etwas längerer Text werden, doch versuche ich, die Situation möglichst vollständig wiederzugeben und darzulegen, was ich bisher versucht habe und was dabei herauskam.
System:
OS: Manjaro Linux (rolling release, basierend auf Arch aber mit eigenem Kernel und eigenen Repos).
Hardware:
Ursprünglicher Zustand:
Vor gut einem Jahr habe ich das System zusammengebaut (sprich, alle Komponenten haben noch Garantie ). Unter BIOS F11 habe ich den RAM übertaktet:
Die GDM off Werte habe ich beibehalten und bin damit nun 1 Jahr lang stabil gefahren.
Beginn (?) der Probleme:
Im November durfte ich hier im Forum die GLORIOUS Model D testen. Mit dieser habe ich wieder grossen Spass an Counter-Strike gefunden und spiele dieses nun auch wieder regelmässig. Zum Arbeiten nutze ich die Maus mit der linken Hand. Zum Zocken aber rechts. Mit der neuen Maus kam also ein weiteres USB-Gerät dazu. Manche hier im Forum berichten von Problemen mit USB am X570 Aorus Ultra Mainboard. Aufgefallen wären mir aber keine Probleme die unmittelbar auftraten.
Etwa im Dezember gab es ein Kernel Update 5.10.7 (glaube ich), welches Probleme mit meinem MDADM RAID10 aus zwei Samsung 970 Evo Plus (NVMe) SSDs verursachte: Die Platten synchronisierten nicht sauber. Dies ist mir nur deshalb aufgefallen, weil OneDrive Fehlermeldungen ausgespuckt hat, die darauf hindeuteten, dass die Datenbank und die Dateien nicht übereinstimmen. Mein OS hat nicht gemeckert. Mit Kernel 5.9 oder 5.4 tritt dieses Problem nicht auf, so blieb ich eine Weile bei 5.4 LTS.
Mit der Home-Office-Pflicht war bedarf an Arbeitsplätzen zuhause. So habe ich meinen 23'' Bildschirm von HP (der via DVI angeschlossen wird) weitergegeben und gegen einen Dell Alienware AW2521H (360 Hz) mit DisplayPort ersetzt. Im Multimonitor-Setup liefert dieser aber nur 300 Hz. Alleine aber 360 Hz. Dell will mir nicht helfen, da sie Linux nicht supporten dürfen.
Der Dell bietet einen USB-Hub. Der Anschluss des Hubs (ohne Anschluss irgendwelcher Geräte am Hub), sorgte aber für das Problem, dass manchmal keine USB-Geräte vorhanden waren, wenn ich den PC aus dem Schlafmodus weckte. Das Problem konnte ich aber lösen, indem ich 3 Geräte an den den USB-Hub des Dells anschloss, statt direkt am Mainboard.
Um mal dieses re-Bar zu testen, bin ich auf BIOS F30 gegangen und habe above 4G encoding aktiviert, habe aber erst dann gemerkt, dass rBar erst mit F32 implementiert wurde. Habe aber F30 mit above 4G encoding beibehalten, ohne unmittelbar Fehler zu bemerken.
Vergangene Woche kam dann Kernel 5.10.13, womit das MDADM Problem gefixed wurde. Ich habe also auf den neuen Kernel gewechselt. Einmal ist CSGO mitten im Spiel abgestürtzt und zwar so, dass das Spiel und Steam von einer Sekunde auf die nächste Weg waren. Es gab keinen Hänger oder so, mitten im Spielverlauf lande ich auf dem Desktop und steam und Spiel sind weg. Das war vor etwa 3 Tagen. Bis am Freitag Abend konnte ich aber noch normal weiterarbeiten. Einmal ist vivaldi (browser) abgestürzt, auf ähnliche Weise, plötzlich weg und die laufende Sitzung war auch nicht wiederherzustellen, sprich, alle offenen Tabs waren verschwunden und nur noch im Browserverlauf vorzufinden.
Ich möchte noch darauf hinweisen, dass mein System bis zum besagten Kernelupdate im Dezember (5.10.7) absolut stabil lief. Ich hatte nie Hänger oder Abstürze oder Datenverlust den ich bemerkt hätte.
Am Freitagabend aber häuften sich dann die Probleme:
Offensichtlich ist etwas gehörig faul imStaate Dänemark mit meinem System. Ich dachte, vielleicht ist es dennoch das MDADM RAID, welches vielleicht einfach nicht mehr unterstützt wird. Ich entschloss mich das System neu aufzusetzen und wollte ZFS nutzen. Doch soweit bin ich noch gar nicht gekommen.
Da ich alle meine Daten extern gesichert habe, habe ich alle 3 Festplatten formatiert. Die folgenden Zeilen beziehen sich also auf ein frisches System ohne Kernel, OS oder RAID.
Als erstes wollte ich Windows 10 auf die WD Green SSD installieren. Doch die Installation schlug etwa 5 Mal fehl. Ich erstellte also einen neuen USB-Stick. Auch mit diesem schlug die Installation fehl. Statt von UEFI: myUSB Part. 1 bootete ich versuchshalber von UEFI: myUSB Part. 2 (sonst bietet das BIOS noch GENERIC: myUSB an). Hiermit klappte die Installation.
Doch das frisch installierte Windows lief nicht stabil. Updates konnten nicht installiert werden (also einzelne, das Gros konnte problemlos installiert werden), und verschiedene BSoDs suchten mich heim, jeweils mit anderen Fehlermeldungen, aber alle deuteten auf Speicherfehler hin! Ich fürchtete um meinen RAM. Einerseits liess ich noch ein
laufen, um Probleme mit der Festplatte auszuschliessen, andererseite startete ich ein
. Dieses meldete sofort, dass Probleme mit dem RAM vorliegen. Also habe ich einen CMOS reset gemacht und mdsched und anschliessend noch Memtest86 laufen lassen. Beide meldeten keine Fehler.
Also gibt es plötzlich Probleme mit dem RAM OC, obwohl es wunderbar lief? Wieso?
Ich dachte mir also, nun gut, momentan halt kein OC. Ein anderes Problem zeigte sich nun aber. Für den CMOS reset trenne ich den PC vom Strom. Der darauffolgende Kaltstart funktioniert aber nicht immer zuverlässig, wenn beide Monitore angeschlossen sind. Wenn nur mein 2. Bildschirm (via HDMI) angeschlossen ist. Gibt es keine Startschwierigkeiten. Wenn der Dell aber auch angeschlossen ist, klappt es manchmal und manchmal nicht. Die Bildschirme bleiben einfach schwarz. Ein ähnliches Problem soll mit der SOC Spannung von fixen 1.05 V behoben worden sein.
Ich habe nun verschiedene BIOS Versionen ausprobiert (33a, 32, 20, 12), doch alle zeigen das gleiche Verhalten mit dem Kaltstart bei 2 Bildschirmen). Wenn ich nur den HDMI-Bildschirm anschliesse, habe ich aber komische Schneeflocken auf dem Bild. Sobald ich den zweiten Bildschirm anschliesse, gibt es keine Schneeflocken mehr.
Ist der erste Kaltstart überwunden, funktionieren weitere Reboots jedoch. Es kann sein, dass dieses Problem schon lange besteht, da ich den PC nie vom Strom trenne. Die Speicherprobleme sind aber erst kürzlich aufgetreten und haben sich quasi exponentiell vermehrt. Am Freitagabend konnte ich noch arbeiten. Am Samstag ging gar nichts mehr innert kürzester Zeit. Aber wenn der RAM defekt wäre, müsste memtest dann nicht einen Fehler ausspucken? Oder wieso laufen Werkseinstellungen, OC, dass ein Jahr lang stabil lief, aber plötzlich nicht mehr? Ich lasse gerade nochmals mdsched laufen, diesmal nachdem ich nach einem CMOS clear BIOS F32 installiert habe, nochmals einen CMOS reset gemacht habe und erst dann die optimised settings geladen habe und noch folgende Änderungen vorgenommen haben: CPPC (preferred cores) aktiviert, global C-States aktiviert und SVM mode ebenfalls aktiviert. Alles andere habe ich nicht angerührt.
Mögliche Defekte/Probleme:
Meine ursprüngliche Vermutung von wegen RAID und Kernel ist nun hinfällig, da die Speicherprobleme auch auf Windows auftreten. Dafür kamen jetzt die Kaltstartprobleme mit der GraKa zum Vorschein.
Kann ich irgendwie verlässlich auf Defekte testen? RAM / GraKa / Mainboard? Ersetzen kann ich spontan kein Bauteil, da ich nichts passendes zur Hand habe. :/
Oder kann am Ende doch der neue Bildschirm auslöser allen Übels sein, ohne, dass er selbst von Bildfehlern oder ähnlichem betroffen wäre?
Danke fürs Durchlesen und allfällig hilfreiche Gedanken dazu.
Dies könnte ein etwas längerer Text werden, doch versuche ich, die Situation möglichst vollständig wiederzugeben und darzulegen, was ich bisher versucht habe und was dabei herauskam.
System:
OS: Manjaro Linux (rolling release, basierend auf Arch aber mit eigenem Kernel und eigenen Repos).
Hardware:
CPU | AMD Ryzen 3950X |
Mainboard | Gigabyte X570 Aorus Ultra |
RAM | 4*16GB ECC Samsung M391A2K43BB1-CTD 2666 CL19 @3200 CL16 |
Storage | 2*1 Tb Samsung 970 Evo Plus (NVMe) WD Green 120 GB SSD (SATA-III) |
GPU | Sapphire RX580 Nitro+ 4GB |
NIC | Intel X550-T2 |
PSU | Fractal Ion+ Plantinum 560 Watt |
Case | BeQuiet! Silent Base 801 |
Fans | 4*Noctua NF-A14 3* BeQuiet! Pure Wings 2 |
Ursprünglicher Zustand:
Vor gut einem Jahr habe ich das System zusammengebaut (sprich, alle Komponenten haben noch Garantie ). Unter BIOS F11 habe ich den RAM übertaktet:
Setting | GDM on | GDM off | stock |
---|---|---|---|
Takt | 3400 MHz | 3400 MHz | 2667 MHz |
CL | 16 | 16 | 20 |
tRCD | 17 | 18 | 19 |
tRP | 15 | 16 | 19 |
tRAS | 48 | 50 | 43 |
tRC | 64 | 66 | 61 |
tRFC | 425 | 425 | |
tRW | 12 | 12 | |
tFAW | 16 | 16 | |
Read (MB/s) | 51725 | 52540 | 41420 |
Latency (ns) | 72.4 | 71.3 | 93 |
PowerDown | enabled | enabled |
Die GDM off Werte habe ich beibehalten und bin damit nun 1 Jahr lang stabil gefahren.
Beginn (?) der Probleme:
Im November durfte ich hier im Forum die GLORIOUS Model D testen. Mit dieser habe ich wieder grossen Spass an Counter-Strike gefunden und spiele dieses nun auch wieder regelmässig. Zum Arbeiten nutze ich die Maus mit der linken Hand. Zum Zocken aber rechts. Mit der neuen Maus kam also ein weiteres USB-Gerät dazu. Manche hier im Forum berichten von Problemen mit USB am X570 Aorus Ultra Mainboard. Aufgefallen wären mir aber keine Probleme die unmittelbar auftraten.
Etwa im Dezember gab es ein Kernel Update 5.10.7 (glaube ich), welches Probleme mit meinem MDADM RAID10 aus zwei Samsung 970 Evo Plus (NVMe) SSDs verursachte: Die Platten synchronisierten nicht sauber. Dies ist mir nur deshalb aufgefallen, weil OneDrive Fehlermeldungen ausgespuckt hat, die darauf hindeuteten, dass die Datenbank und die Dateien nicht übereinstimmen. Mein OS hat nicht gemeckert. Mit Kernel 5.9 oder 5.4 tritt dieses Problem nicht auf, so blieb ich eine Weile bei 5.4 LTS.
Mit der Home-Office-Pflicht war bedarf an Arbeitsplätzen zuhause. So habe ich meinen 23'' Bildschirm von HP (der via DVI angeschlossen wird) weitergegeben und gegen einen Dell Alienware AW2521H (360 Hz) mit DisplayPort ersetzt. Im Multimonitor-Setup liefert dieser aber nur 300 Hz. Alleine aber 360 Hz. Dell will mir nicht helfen, da sie Linux nicht supporten dürfen.
Der Dell bietet einen USB-Hub. Der Anschluss des Hubs (ohne Anschluss irgendwelcher Geräte am Hub), sorgte aber für das Problem, dass manchmal keine USB-Geräte vorhanden waren, wenn ich den PC aus dem Schlafmodus weckte. Das Problem konnte ich aber lösen, indem ich 3 Geräte an den den USB-Hub des Dells anschloss, statt direkt am Mainboard.
Um mal dieses re-Bar zu testen, bin ich auf BIOS F30 gegangen und habe above 4G encoding aktiviert, habe aber erst dann gemerkt, dass rBar erst mit F32 implementiert wurde. Habe aber F30 mit above 4G encoding beibehalten, ohne unmittelbar Fehler zu bemerken.
Vergangene Woche kam dann Kernel 5.10.13, womit das MDADM Problem gefixed wurde. Ich habe also auf den neuen Kernel gewechselt. Einmal ist CSGO mitten im Spiel abgestürtzt und zwar so, dass das Spiel und Steam von einer Sekunde auf die nächste Weg waren. Es gab keinen Hänger oder so, mitten im Spielverlauf lande ich auf dem Desktop und steam und Spiel sind weg. Das war vor etwa 3 Tagen. Bis am Freitag Abend konnte ich aber noch normal weiterarbeiten. Einmal ist vivaldi (browser) abgestürzt, auf ähnliche Weise, plötzlich weg und die laufende Sitzung war auch nicht wiederherzustellen, sprich, alle offenen Tabs waren verschwunden und nur noch im Browserverlauf vorzufinden.
Ich möchte noch darauf hinweisen, dass mein System bis zum besagten Kernelupdate im Dezember (5.10.7) absolut stabil lief. Ich hatte nie Hänger oder Abstürze oder Datenverlust den ich bemerkt hätte.
Am Freitagabend aber häuften sich dann die Probleme:
- Der Browser blieb mehrmals hängen, zunächst nur einzelne Webseiten, die nicht geladen werden konnten und nur einen toten Vogel auf grauem Grund zeigten
- Nach einer Weile oder mehreren solchen nicht-funktionierenden Seiten stürtze dann der Browser komplett ab und liess sich nicht mehr öffnen. Auch nicht nach einem Neustart des Systems.
- Ich wollte den Browser neu installieren, doch nach der Deinstallation wurde er mir über den Paketmanager nicht mehr angeboten. Es war, als wäre er nicht in den Repos. Aber Vivaldi ist in den offiziellen Manjaro repos drin!
- Auch Thunderbird liess sich nicht mehr starten.
- Dateien, welche ich auf einen USB-Stick kopierte, liessen sich auf meinem Ubuntu Laptop nicht lesen.
- Mehrere Systemabstürzte innert Stunden, einmal sogar das graue Bild mit dem Hinweis, ich solle mich an den Systemadministrator wenden.
Offensichtlich ist etwas gehörig faul im
Da ich alle meine Daten extern gesichert habe, habe ich alle 3 Festplatten formatiert. Die folgenden Zeilen beziehen sich also auf ein frisches System ohne Kernel, OS oder RAID.
Als erstes wollte ich Windows 10 auf die WD Green SSD installieren. Doch die Installation schlug etwa 5 Mal fehl. Ich erstellte also einen neuen USB-Stick. Auch mit diesem schlug die Installation fehl. Statt von UEFI: myUSB Part. 1 bootete ich versuchshalber von UEFI: myUSB Part. 2 (sonst bietet das BIOS noch GENERIC: myUSB an). Hiermit klappte die Installation.
Doch das frisch installierte Windows lief nicht stabil. Updates konnten nicht installiert werden (also einzelne, das Gros konnte problemlos installiert werden), und verschiedene BSoDs suchten mich heim, jeweils mit anderen Fehlermeldungen, aber alle deuteten auf Speicherfehler hin! Ich fürchtete um meinen RAM. Einerseits liess ich noch ein
Bash:
chkdsk /f /r
Bash:
mdsched.exe
Also gibt es plötzlich Probleme mit dem RAM OC, obwohl es wunderbar lief? Wieso?
Ich dachte mir also, nun gut, momentan halt kein OC. Ein anderes Problem zeigte sich nun aber. Für den CMOS reset trenne ich den PC vom Strom. Der darauffolgende Kaltstart funktioniert aber nicht immer zuverlässig, wenn beide Monitore angeschlossen sind. Wenn nur mein 2. Bildschirm (via HDMI) angeschlossen ist. Gibt es keine Startschwierigkeiten. Wenn der Dell aber auch angeschlossen ist, klappt es manchmal und manchmal nicht. Die Bildschirme bleiben einfach schwarz. Ein ähnliches Problem soll mit der SOC Spannung von fixen 1.05 V behoben worden sein.
Ich habe nun verschiedene BIOS Versionen ausprobiert (33a, 32, 20, 12), doch alle zeigen das gleiche Verhalten mit dem Kaltstart bei 2 Bildschirmen). Wenn ich nur den HDMI-Bildschirm anschliesse, habe ich aber komische Schneeflocken auf dem Bild. Sobald ich den zweiten Bildschirm anschliesse, gibt es keine Schneeflocken mehr.
Ist der erste Kaltstart überwunden, funktionieren weitere Reboots jedoch. Es kann sein, dass dieses Problem schon lange besteht, da ich den PC nie vom Strom trenne. Die Speicherprobleme sind aber erst kürzlich aufgetreten und haben sich quasi exponentiell vermehrt. Am Freitagabend konnte ich noch arbeiten. Am Samstag ging gar nichts mehr innert kürzester Zeit. Aber wenn der RAM defekt wäre, müsste memtest dann nicht einen Fehler ausspucken? Oder wieso laufen Werkseinstellungen, OC, dass ein Jahr lang stabil lief, aber plötzlich nicht mehr? Ich lasse gerade nochmals mdsched laufen, diesmal nachdem ich nach einem CMOS clear BIOS F32 installiert habe, nochmals einen CMOS reset gemacht habe und erst dann die optimised settings geladen habe und noch folgende Änderungen vorgenommen haben: CPPC (preferred cores) aktiviert, global C-States aktiviert und SVM mode ebenfalls aktiviert. Alles andere habe ich nicht angerührt.
Mögliche Defekte/Probleme:
- RAM
- OC
- Windows meldet Speicherfehler in Bluescreens
- mdsched meldet sofort Fehler
- Default
- keine Fehler mehr
- OC
- Grafikkarte
- Schneeflocken bei nur einem Bildschirm / Probleme beim Kaltstart mit 2 Bildschirmen
- Mainboard
- Andere User berichten von ähnlichen Kaltstartproblemen, die mit CPU Spannungssettings behoben wurden
- Vielleicht doch above 4G encoding in Zusammenspiel mit defektem(?) VRAM der GraKa und übertaktetem RAM
Meine ursprüngliche Vermutung von wegen RAID und Kernel ist nun hinfällig, da die Speicherprobleme auch auf Windows auftreten. Dafür kamen jetzt die Kaltstartprobleme mit der GraKa zum Vorschein.
Kann ich irgendwie verlässlich auf Defekte testen? RAM / GraKa / Mainboard? Ersetzen kann ich spontan kein Bauteil, da ich nichts passendes zur Hand habe. :/
Oder kann am Ende doch der neue Bildschirm auslöser allen Übels sein, ohne, dass er selbst von Bildfehlern oder ähnlichem betroffen wäre?
Danke fürs Durchlesen und allfällig hilfreiche Gedanken dazu.