Grüßt euch,
ich habe seit vorgestern Probleme mit meinem NAS und mir fehlt es an Wissen eindeutig sagen zu können, welche Komponente der Übeltäter ist.
Daher erhoffe ich mir hier Hilfe zu bekommen <3
Jedenfalls, mein NAS ist selbsgebaut und besteht aus 5x 4TB HGST Deskstar NAS (H3IKNAS40003272SE) im RAID5-Modus.
Desweiteren ist ein Sockel 775 Mainboard "XFX nForce 680i LT SLI" (Abbildung nicht exakt) mit dem Prozessor "Intel E4500 2x2,2 Ghz" verbaut.
Als OS nutze ich OpenMediaVault (OMV).
Das NAS hat auch tadellos etwa 2 Wochen funktioniert, bis es vorgestern Abend beim Lesen plötzlich angefangen hat zu stottern und letztendlich komplett einfrohr.
Als ich mal ins NAS reingeschaut habe, habe ich bemerkt, dass eine Heatpipe auf dem Mainboard abartig heiß war. Der dafür montierte aktive Kühler funktionierte nicht mehr.
Ich habe also eine Zeit lang abkühlen lassen und einen zusammengepfuschten Notkühler montiert.
Danach fehlte das RAID in der WebGUI von OMV, Die Festplatten wurden jedoch richtig erkannt.
Anschließend habe ich mit "mdadm" und weiteren Befehlen herausgefunden, dass die Festplatte hinter sdf fehlte.
mit "mdadm --assemble" und "mdadm --add /dev/sdf" konnte ich mein NAS wiederherstellen. Meine Daten sind also bisher nicht verloren, jedoch friert mein NAS nun beim rebuild-Prozess jedes mal ein.
Das erste mal bei 50%, heute bei 99%.
Soweit ich die SMART-Werte interpretieren kann liegt das Problem nicht an den Festplatten - Nachdem irgendwas auf dem Mainboard überhitzt ist, liegt meine Vermutung nahe, dass der Sata-Controller nun eine Macke hat.
Aber bevor ich ein neues Mainboard(+CPU+RAM) kaufe, wollte ich hier nachfragen.
Hier mal ein Auszug der SMART-Werte von 2 Festplatten - die Werte von sd[bcd] sehen auch ungefähr so aus. (sde ist die OS-Platte).
Viele Dank fürs Lesen schonmal!
Ich hoffe mir kann jemand mit Gewissheit sagen, dass meine Vermutung richtig ist.
Was mich nur wundert ist, dass mein NAS vorrübergehend richtig funktioniert und später erneut fehlschlägt.
Die Temperatur der besagten Heatpipe habe ich von Hand desöfteren überprüft und war höchstens 'handwarm'.
Ich weiß leider nicht, wo oder ob es einen Temperatursensor für genau diese Stelle auf dem Mainboard gibt.
Nach der Überhitzung hätte ich allerdings erwartet, dass keine Festplatte richtig erkannt wird.
Grüßle
ich habe seit vorgestern Probleme mit meinem NAS und mir fehlt es an Wissen eindeutig sagen zu können, welche Komponente der Übeltäter ist.
Daher erhoffe ich mir hier Hilfe zu bekommen <3
Jedenfalls, mein NAS ist selbsgebaut und besteht aus 5x 4TB HGST Deskstar NAS (H3IKNAS40003272SE) im RAID5-Modus.
Desweiteren ist ein Sockel 775 Mainboard "XFX nForce 680i LT SLI" (Abbildung nicht exakt) mit dem Prozessor "Intel E4500 2x2,2 Ghz" verbaut.
Als OS nutze ich OpenMediaVault (OMV).
Das NAS hat auch tadellos etwa 2 Wochen funktioniert, bis es vorgestern Abend beim Lesen plötzlich angefangen hat zu stottern und letztendlich komplett einfrohr.
Als ich mal ins NAS reingeschaut habe, habe ich bemerkt, dass eine Heatpipe auf dem Mainboard abartig heiß war. Der dafür montierte aktive Kühler funktionierte nicht mehr.
Ich habe also eine Zeit lang abkühlen lassen und einen zusammengepfuschten Notkühler montiert.
Danach fehlte das RAID in der WebGUI von OMV, Die Festplatten wurden jedoch richtig erkannt.
Anschließend habe ich mit "mdadm" und weiteren Befehlen herausgefunden, dass die Festplatte hinter sdf fehlte.
mit "mdadm --assemble" und "mdadm --add /dev/sdf" konnte ich mein NAS wiederherstellen. Meine Daten sind also bisher nicht verloren, jedoch friert mein NAS nun beim rebuild-Prozess jedes mal ein.
Das erste mal bei 50%, heute bei 99%.
Soweit ich die SMART-Werte interpretieren kann liegt das Problem nicht an den Festplatten - Nachdem irgendwas auf dem Mainboard überhitzt ist, liegt meine Vermutung nahe, dass der Sata-Controller nun eine Macke hat.
Aber bevor ich ein neues Mainboard(+CPU+RAM) kaufe, wollte ich hier nachfragen.
Hier mal ein Auszug der SMART-Werte von 2 Festplatten - die Werte von sd[bcd] sehen auch ungefähr so aus. (sde ist die OS-Platte).
Code:
sda ---------------------------------------------------------------------
ID# ATTRIBUTE_NAME FLAGS VALUE WORST THRESH FAIL RAW_VALUE
1 Raw_Read_Error_Rate PO-R-- 100 100 016 - 0
2 Throughput_Performance P-S--- 137 137 054 - 77
3 Spin_Up_Time POS--- 155 155 024 - 381 (Average 615)
4 Start_Stop_Count -O--C- 100 100 000 - 118
5 Reallocated_Sector_Ct PO--CK 100 100 005 - 0
7 Seek_Error_Rate PO-R-- 100 100 067 - 0
8 Seek_Time_Performance P-S--- 121 121 020 - 34
9 Power_On_Hours -O--C- 100 100 000 - 423
10 Spin_Retry_Count PO--C- 100 100 060 - 0
12 Power_Cycle_Count -O--CK 100 100 000 - 118
192 Power-Off_Retract_Count -O--CK 100 100 000 - 130
193 Load_Cycle_Count -O--C- 100 100 000 - 130
194 Temperature_Celsius -O---- 166 166 000 - 36 (Min/Max 22/54)
196 Reallocated_Event_Count -O--CK 100 100 000 - 0
197 Current_Pending_Sector -O---K 100 100 000 - 0
198 Offline_Uncorrectable ---R-- 100 100 000 - 0
199 UDMA_CRC_Error_Count -O-R-- 200 200 000 - 0
sdf ---------------------------------------------------------------------
ID# ATTRIBUTE_NAME FLAGS VALUE WORST THRESH FAIL RAW_VALUE
1 Raw_Read_Error_Rate PO-R-- 100 100 016 - 0
2 Throughput_Performance P-S--- 136 136 054 - 81
3 Spin_Up_Time POS--- 244 244 024 - 249 (Average 386)
4 Start_Stop_Count -O--C- 100 100 000 - 232
5 Reallocated_Sector_Ct PO--CK 100 100 005 - 0
7 Seek_Error_Rate PO-R-- 100 100 067 - 0
8 Seek_Time_Performance P-S--- 121 121 020 - 34
9 Power_On_Hours -O--C- 100 100 000 - 415
10 Spin_Retry_Count PO--C- 100 100 060 - 0
12 Power_Cycle_Count -O--CK 100 100 000 - 219
192 Power-Off_Retract_Count -O--CK 100 100 000 - 240
193 Load_Cycle_Count -O--C- 100 100 000 - 240
194 Temperature_Celsius -O---- 193 193 000 - 31 (Min/Max 21/49)
196 Reallocated_Event_Count -O--CK 100 100 000 - 0
197 Current_Pending_Sector -O---K 100 100 000 - 0
198 Offline_Uncorrectable ---R-- 100 100 000 - 0
199 UDMA_CRC_Error_Count -O-R-- 200 200 000 - 0
Viele Dank fürs Lesen schonmal!
Ich hoffe mir kann jemand mit Gewissheit sagen, dass meine Vermutung richtig ist.
Was mich nur wundert ist, dass mein NAS vorrübergehend richtig funktioniert und später erneut fehlschlägt.
Die Temperatur der besagten Heatpipe habe ich von Hand desöfteren überprüft und war höchstens 'handwarm'.
Ich weiß leider nicht, wo oder ob es einen Temperatursensor für genau diese Stelle auf dem Mainboard gibt.
Nach der Überhitzung hätte ich allerdings erwartet, dass keine Festplatte richtig erkannt wird.
Grüßle