[Behoben] HP Proliant Microserver Gen8 HDD fallen sporadisch aus

coolioo · 06.10.2021

Hallo,

ich bin doch so langsam ein bisschen überfragt. Ich habe mir im Mai 2020 4 nagelneue Festplatten vom TYP ST8000NM0075 für meinen HP Proliant Microserver Gen8 die ich in einem Raid 5 verwende an einem HP P222 Raid Controller.

Heute Mittag ist die HDD1 ausgefallen, zwei Stunden später HDD3, heute Abend dann HDD2. Ich habe zwar noch Gewährleistung auf die HDD´s aber ich bin doch ein bisschen verwirrt.

Starte ich den Server neu, wird die oder zwei HDD´s als fehlerhaft angezeigt und ich kann über "wieder aktiveren" die HDD´s bei Booten wieder aktivieren.

Der Server läuft dann wieder ca. 5 - 120 Min, dann fällt wieder random eine Platte aus.

Witzigerweise sind die Platten am Port 1 nicht betroffen, nur die Internen im Server, die über Port2 angeschlossen sind.

Wenn jemand einen Tipp hätte wäre ich sehr dankbar.

Vielen Dank

Hipiman · 07.10.2021

1. Der Plattentyp ist aus dem Jahr 2015.
Sicher das du neue Festplatten bekommen hast? Schau Mal nach dem Produktionsjahr.

2. Die Platten sollten dauerhaft laufen und nicht in einem sleep Mode versetzt werden.
Ist das so? (Welches OS - Raid ?)

3. Was sagen denn die SMART Werte der Platten?

4. Temperaturen von HP P222 überprüfen. Der MicroServer ist nicht für gute Kühlung bekannt.

5. Firmware vom Server aktualisieren (p222 primär)

coolioo · 07.10.2021

Hallo @Hipiman ,

vielen Dank für die Antwort. Zu deinen Fragen:

1. Da muss ich leider abwarten, bis die Dateisystemüberprüfung fertig ist liefer ich nach.

2. Ich setze Windows Server 2019 ein. Laut Energiesparplan werden die Festplatten nicht im Sleep Mode versetzt. Hier wird ein Raid 10 eingesetzt.

3. Lauf dem Smart Storage Administrator sind die Platten in Ordnung. Siehe angehängte Zip Datei.

4. Die Temperaturen sind soweit ich das beurteilen kann in Ordnung. Ich habe auch einen Lüfter auf den Raid Controller gesetzt.

5. Firmware sollte soweit aktuell sein.

Ich habe den Server heute Nacht ausgelassen. Heute Morgen hat er wieder normal funktioniert.

Was ich noch festgestellt habe: Im ILO Event Log: On-board clock set; was 01/01/1970 01:03:21. Ist hier die Bios Batterie leer?

Vg

konfetti · 07.10.2021

6. Sitzt das Kabel richtig? - SAS als auch Strom!

7. 5-120 Minuten - was passiert in der Zeit? - sprich fallen die Platten erst bei Zugriff aus, oder auch Idle?

8. Schwingt sich ggf. mit den Platten das Gehäuse etwas auf?

Beitrag automatisch zusammengeführt: 07.10.2021

coolioo schrieb:
Was ich noch festgestellt habe: Im ILO Event Log: On-board clock set; was 01/01/1970 01:03:21. Ist hier die Bios Batterie leer?

Sieht danach aus, oder das Bios wurde resettet

coolioo · 07.10.2021

Hallo @konfetti ,

6. Ich habe heute Morgen den Server aufgeschraubt und die Verkabelung überprüft. Kabel aus und eingesteckt, sowie den Server gereinigt. Sollten dann bei einem nicht korrekt sitzenden Kabel nicht alle Platten ausfallen? Es ist ja nur ein Molex Kabel für die Backplane vorhanden.

7. Die Festplatten fallen erst nach Zugriff aus, sobald ich zum Beispiel eine Datei entpacke.

8. Der Server steht in einem Regal, das an der Wand hängt. Ich würde sagen Nein.

Vielen dank für eure Hilfe

konfetti · 07.10.2021

Das Netzteil ist aber groß genug?

coolioo · 07.10.2021

Ich habe das Standard HP 200 Watt Netzteil verbaut. Das sollte eigentlich langen, besonders nachdem der Server nun über ein Jahr so lief oder sehe ich das falsch?

Zuvor hatte ich 4TB SAS HDD´s verbaut.

konfetti · 07.10.2021

macht bei 4 Platten schon ~40W -> bleiben für RAM und restliches System nur noch knapp 160W übrig.

Ich weiß ja nicht, was Deine alten Platten für welche waren und welchen Verbrauch die hatten, aber ja, das kann schon knapp werden.

coolioo · 07.10.2021

Laut meinem Stromzähler verbraucht der Server aber nur ca. 130 Watt maximal. Reichen die 70 Watt Reserven nicht aus? (150 Watt maximal aber hier muss man die 3 Platten in einem externen Gehäuse mit extra Netzteil mitzählen)

Ich habe vier mal die ST8000NM0075 und eine 500GB Samsung EVO 860 direkt in dem Server verbaut. CPU ist ein Xeon E3-1265L v2.

Hipiman · 07.10.2021

Xeon E3-1265L v2 (45 W) + H222 (10-15 W)+ 4x SAS 7.200K (40 W) Platten werden bei 200Watt schon eng.

Der RaidController P222 unterstützt nur 6Gb/s SAS und die HDDs sind 12Gb/s
Offiziell waren beim Controller auch nur 3TB HDDs möglich. (wenn ichs nicht falsch gesehen habe)

Der MicroServer gen8 ist ja auch schon 7-8 Jahre auf dem Markt.

Das kann jetzt viele Gründe haben.

Beim belasten der Pools entstehen folgende Belastungen:
1: CPU (Software Raid)
2: HDD ( Stromverbrauch & Vibrationen
3. Backplane: (Stromverbrauch & Datenkabel)
4. Netzteil (erhöhter Stromverbrauch)

konfetti · 07.10.2021

Ne Größenbeschränkung hab ich jetzt nicht gesehn, aber ja, das kann Eng werden mit dem Netzteil, einfach weil ggf. auf der 12V Schiene zu viel verbraucht wird.

der G8 scheint ja normale ATX-Stecker zu haben.
Du könntest ja ggf. mal mit einem anderen Netzteil schauen, ob es stabil läuft.

coolioo · 07.10.2021

Wie gesagt, ich messe mit meiner USV und meinem Strommessgerät maximal 130 Watt.

Momentan funktioniert ja wieder alles, wie ich schrieb, das verstehe ich nicht.

Sollte es wirklich an dem Netzteil liegen verstehe ich ehrlich gesagt nicht, warum es über ein Jahr funktioniert hat mit der gleichen Belastung.

Vorher hatte ich viermal die hier verbaut Seagate Constellation ES.3 ST4000NM0023. Die verbrauchen sogar mehr Strom und diese hatte ich über 4 Jahre in Betrieb.

Meinst du wirklich es liegt am Netzteil?

konfetti · 07.10.2021

d.h. Dein Netzteil hat jetzt schon 4 Jahre auf dem Buckel?
Die Elkos werden darin nicht besser - vorallem, waren das 4 Jahre Dauerlauf?

Es kann am Netzteil liegen, muss aber nicht - wie schon oben geschrieben, schau mal nach den SMART-Werten der Platten.

coolioo · 07.10.2021

Hallo @konfetti,

das habe ich doch schon getan in Beitrag 3 steht, dass die Werte in Ordnung sind. Wie gesagt, ich werde gerne ein anderes Netzteil testen. Aber kannst du mir vielleicht bitte erklären, warum erst ein Ausfall eintritt und jetzt wieder alles funktioniert?

Ich verstehe es leider nicht.

katzenhai · 08.10.2021

Laut Quickspecs ist der Controller für max 3TB große Platten zertifiziert. Der P420 für 4TB.
Bei den Vorgängern des Kontrollers funktionierten z.B. nur die Plattengrößen, die in den Quickspecs drin standen, andere Größen wurden ignoriert. Beispielsweise ging eine 1,5 TB Platte, eine 750GB aus der selben Serie nicht. So wählerisch sind die "aktuellen" Kontroller nicht mehr.
Ich könnte mir allerdings vorstellen, das dem Kontroller einfach nur die Resourcen für die Berechnung der Paritätstabellen bei größeren Platten ausgehen, ich rede hier nicht von der Größe des Cache Speichers.

coolioo · 08.10.2021

Vielen Dank für euer Input und die Hilfe, ich konnte das Problem lösen, indem ich das SAS Kabel getauscht habe. Gut, dass ich hier noch eins herumliegen hatte. Der Server läuft jetzt wieder stabil und ohne Probleme.

Suche

[Behoben] HP Proliant Microserver Gen8 HDD fallen sporadisch aus

coolioo

Enthusiast

Hipiman

Experte

coolioo

Enthusiast

Anhänge

konfetti

Urgestein

coolioo

Enthusiast

konfetti

Urgestein

coolioo

Enthusiast

konfetti

Urgestein

coolioo

Enthusiast

Hipiman

Experte

konfetti

Urgestein

coolioo

Enthusiast

konfetti

Urgestein

coolioo

Enthusiast

katzenhai

Enthusiast

coolioo

Enthusiast

Ähnliche Themen