Festplatten defekt??

oTTze

Enthusiast
Thread Starter
Mitglied seit
04.09.2012
Beiträge
50
Ort
Rodgau
Hi Leute,
ich bin absolut am Ende meines Lateins und hoffe ihr habt noch eine Idee was zu den gleich geschilderten Problemen führt bzw. geführt hat.

Zuerst einmal die aktuelle Hardware Übersicht:

CPU: Intel Core I5-6600K
Kühler: Scythe Mugen 4
MB: Asrock Z170 Extreme 7+ (FW 2.00)
RAM: 2x8GB GSkill 3000 CL15
Controller: LSI MegaRaid 9260-16i (neueste FW)
HDDs: 8x 6TB WD Red 6TB (Raid6), 8x 3TB Hitachi (Raid6), 2x SSD für OS und Games
Netzteil: Enermax Modu 87 800W


Die Chronologie der Ereignisse:

10.12.15: Gelesen dass der Anpressdruck des Mugen 4 zu hoch ist -> Nachrüstset bei Scythe bestellt
23.12.15: Kühler demontiert und Nachrüstset installiert
26.12.15: Während eines Kopiervorgang geht eine der 6TB (PD6 in VD0, 2. Festplatte in der 2. 5-fach Backplane) auf faulty, mit dem Fehler Timed Out - Error8 (laut Megaraid Log). Ein Anschließender Reboot bringt die Festplatte zurück in den Normalzustand, der Controller hat den Status auf non-faulty zurückgesetzt.
27.12.15: Im Leerlauf geht eine 6TB Festplatte (PD7 in VD0, 3. Festplatte in der 2. 5-fach Backplane) auf faulty, selbes Fehlerbild wie am Vortag mit PD6. Einige Minuten später folgt ebenfalls PD6. Ein anschließender Reboot bringt beide Festplatten ohne Fehler zurück. Erster Gedanke, eventuell hat die Backplane ein Problem. Dementsprechend baue ich alle Festplatten dieser Backplane aus und legen sie ausreichend gekühlt neben das Gehäuse und schließe sie außerhalb des Gehäuses mit ausreichend langen Kabeln an. Um ein neues Delta für mein Backup zu ziehen schließe ich ebenfalls 3x 8TB Seagate Archive HDDs direkt an das Mainboard an und beginne mit einem Backup der VD0.
02.01.16: Während der letzten Kopiervorgänge (unattended copy, von daher unklar wann der Fehler auftrat) steigt eine der 8TB Seagate HDDs aus, ist nicht mehr sichtbar im Datenträgermanagement von Windows. Etwa zur gleichen Zeit geht eine 6TB Festplatte (PD4 in VD0, jetzt außerhalb des Gehäuses) und eine 3TB HDD (PD8 in VD1, 1. Festplatte in der 3. 5-fach Backplane) beide mit dem Fehler Timed Out - Error8 auf faulty. PD8 wird weiterhin im MegaRaid faulty angezeigt, PD4 fliegt komplett aus der Übersicht.


So, das ist Stand der Dinge. Ich habe genügend Spare Platten da, und ein nahezu vollständiges Backup aller Daten. Aber ich habe keinen blassen Schimmer was dieses Massensterben verursacht. Meine ursprüngliche Vermutung, dass es sich um die Backplane handelt, würde ich ausschließen. Aber das ist nun auch fast das Einzige was sich ausschließen lässt. Meiner Vermutung geht nun in Richtung des Mainboards / CPUs, da die Fehler erst nach dem Kühlertausch auftraten. Allerdings ist mir absolut unbekannt ob MB / CPU ein solches Fehlerbild hervorrufen können? Meine zweite Vermutung ist das mittlerweile ca 4 Jahre (oder sogar 5) alte Netzteil. Vor ca 2 Monaten wurde eine neue Graka verbaut (AMD 290x OC), welche auch mehr Strom verbrauchen dürfte als die alte (AMD 5870). Könnte ein zu schwaches, oder eventuell im Sterben liegendes Netzteil dieses Fehlerbild verursachen? Auf CPU und MB habe ich noch Garantie, einschicken wäre also kein Problem. Beim Netzteil wäre ein Neukauf in Richtung 1000W wohl erforderlich).


Ich hoffe ihr habt ein paar Ideen und könnt mir weiterhelfen.

Beste Grüße
oTTze
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Meine zweite Vermutung ist das mittlerweile ca 4 Jahre (oder sogar 5) alte Netzteil. Vor ca 2 Monaten wurde eine neue Graka verbaut (AMD 290x OC), welche auch mehr Strom verbrauchen dürfte als die alte (AMD 5870). Könnte ein zu schwaches, oder eventuell im Sterben liegendes Netzteil dieses Fehlerbild verursachen?
Schon möglich. Ist ja nicht so, daß die +12V bei dir nix zu tun hätte. (Staggered Spinup aktiv?) Mit der Onboardgrafik prüfen wäre mal gut gewesen, aber ich weiß nicht, wie sinnvoll das jetzt noch ist (das Kind ist ja quasi schon in den Brunnen gefallen). Was sagen eigentlich die SMART-Werte der rausgeflogenen Platten?

Übrigens, wenn ich hier mal RAID6 mit 1 Gruppe à 8 Platten à 6 TB und LSE = 1e-14 und MTBF = 750000h eintrage, dann bekomme ich eine "Probability of read error during rebuild" von 0.94... - also fast 100%. Ein RAID10 mit 2 Gruppen à 4 Platten liefert dagegen 38% (und hat natürlich die weit bessere Schreibperformance, weil der Overhead bei RAID6 noch größer ist als bei RAID5) - allerdings fällt die "Probability of data loss over time" glatt 1000mal so hoch aus, und die Nennkapazität ist natürlich nur 50% statt 75%. Vielleicht wäre ein RAID50 (60) was?
 
eine "Probability of read error during rebuild" von 0.94... - also fast 100%.
Das kann so nicht stimmen, denn es passt zwar zu einem Fehler auf einer Platte, aber das wäre ja nur bei einem RAID 5 relevant, der Werte kommt auch raus wenn man ein RAID 5 mit einer Platte weniger eingibt. Aber beim RAID 6 sollte das Rebuild ja passieren, solange nur eine Platte ausgefallen ist und nicht erst wenn schon zwei ausgefallen sind. Da hat die Steite entweder einen Fehler in der Berechnung oder berücktichtigt eben einfach nicht, dass ein Fehler ja tolerierbar ist, solange die Paritydaten noch passen. Ein RAID 6 mit einer ausgefallenen Platte ich ja ein RAID 5 und erst wenn es auf zwei Platten im gleichen Bereich Fehler gibt, hat man ein Problem und die Wahrscheinlichkeit ist nun einmal weit geringer also 0,94 irgendwas, die ist fast 0.
 
Also 94% halte ich für äußerst unwahrscheinlich. Zumal ein defekter Sektor nicht das Raid zerschießt beim Rebuild. Aber ich bekomme wahrscheinlich übermorgen ein neues Mainboard und einen neuen CPU, dann werde ich ausgiebig testen. Wenn der Fehler nochmal auftritt kommt ein neues Netzteil rein. Wenn der Fehler dann noch auftritt wird der Raid Controller replaced. Wenn es dann immer noch nicht geht baue ich die Platten in meinen neuen Dell R710 mit Expander ein und pinkle in den alten Rechner rein.... :wut:
 
Das mit 94% Wahrscheinlichkeit ein Fehler auftritt, halte ich durchaus für realisitisch, aber dieser Fehler wird eben dadurch aufgefangen, dass beim RAID 6 nach Ausfall einer Platte ja noch "ein RAID 5 übrig" ist und nicht wie beim RAID 5 mit einer ausgefallenen Platten praktisch ein RAID 0, bei dem dann jeder Fehler fatal wäre.
 
Hallo, ich kämpfe seit 1 Woche mit einem ähnlichen Problem.
Habe einen Z170 Chipsatz (Asus Z170 deluxe) , 2 x WD Black 6TB, Intel i7 6700,
32GB ddr4 3000, Samsung SSD950 PRO am M2 Anschluss, 550W Netzteil.
Alles nagelneu.
Die beiden 6TB Platten als Raid 0
Bei Belastung des Raid (vornehmlich beim Lesen) fällt immer die gleiche Platte aus.
Wechsle ich die Anschlüsse, ist es die andere Platte!
Es muss also was mit dem Chipsatz oder Treiber zu tun haben...
 
Welche Anschlüsse wechselst du. Auch Strom. Ich hatte häufig Probleme, wenn Molex auf SATA Adapter verwendet wurden.
 
Hallo, ja habe auch den Strom gewechselt. Adapter gibt es keine. Aber ich meinte im ersten Beitrag natürlich die SATA Anschlüsse.
Ich habe auch die Kabel selber (Strom und SATA) gewechselt, Treiber, Windows 8.1 und 10.... alles durchprobiert.
letztendlich habe ich jetzt ein anderes Board (H170 Pro Gaming) bestellt. Und heute bekommen, Da habe ich zwar die 2133MHZ RAM beschränkung aber es läuft.
Nur ein Problem was ich beim Z170A Board irgendwie hinbekommen hatte:
Beim Kopieren von Daten von den Raid Platten auf die Samsung SSDPro 950 (System-Platte W10) schreibt diese nur mit 80 MB/s.
Ich habe auch den Samsung NVMe Treiber installiert, bewirkt aber nix. Im alten System hatte ich 440MB hinbekommen.
Hat da jemad einen Tipp?
 
Ich mache zu diesem Thema einen neuen Thread auf, ist wohl nicht mehr die richtige Abteilung...
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh