[Behoben] HP Proliant Microserver Gen8 HDD fallen sporadisch aus

coolioo

Enthusiast
Thread Starter
Mitglied seit
17.07.2013
Beiträge
9
Hallo,

ich bin doch so langsam ein bisschen überfragt. Ich habe mir im Mai 2020 4 nagelneue Festplatten vom TYP ST8000NM0075 für meinen HP Proliant Microserver Gen8 die ich in einem Raid 5 verwende an einem HP P222 Raid Controller.

Heute Mittag ist die HDD1 ausgefallen, zwei Stunden später HDD3, heute Abend dann HDD2. Ich habe zwar noch Gewährleistung auf die HDD´s aber ich bin doch ein bisschen verwirrt.

Starte ich den Server neu, wird die oder zwei HDD´s als fehlerhaft angezeigt und ich kann über "wieder aktiveren" die HDD´s bei Booten wieder aktivieren.

Der Server läuft dann wieder ca. 5 - 120 Min, dann fällt wieder random eine Platte aus.

Witzigerweise sind die Platten am Port 1 nicht betroffen, nur die Internen im Server, die über Port2 angeschlossen sind.

1633547764799.png


Wenn jemand einen Tipp hätte wäre ich sehr dankbar.

Vielen Dank
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
1. Der Plattentyp ist aus dem Jahr 2015.
Sicher das du neue Festplatten bekommen hast? Schau Mal nach dem Produktionsjahr.

2. Die Platten sollten dauerhaft laufen und nicht in einem sleep Mode versetzt werden.
Ist das so? (Welches OS - Raid ?)

3. Was sagen denn die SMART Werte der Platten?

4. Temperaturen von HP P222 überprüfen. Der MicroServer ist nicht für gute Kühlung bekannt.

5. Firmware vom Server aktualisieren (p222 primär)
 
Hallo @Hipiman ,

vielen Dank für die Antwort. Zu deinen Fragen:

1. Da muss ich leider abwarten, bis die Dateisystemüberprüfung fertig ist liefer ich nach.

2. Ich setze Windows Server 2019 ein. Laut Energiesparplan werden die Festplatten nicht im Sleep Mode versetzt. Hier wird ein Raid 10 eingesetzt.

3. Lauf dem Smart Storage Administrator sind die Platten in Ordnung. Siehe angehängte Zip Datei.

4. Die Temperaturen sind soweit ich das beurteilen kann in Ordnung. Ich habe auch einen Lüfter auf den Raid Controller gesetzt.

5. Firmware sollte soweit aktuell sein.

Ich habe den Server heute Nacht ausgelassen. Heute Morgen hat er wieder normal funktioniert.

Was ich noch festgestellt habe: Im ILO Event Log: On-board clock set; was 01/01/1970 01:03:21. Ist hier die Bios Batterie leer?

Vg
 

Anhänge

  • Firmware.PNG
    Firmware.PNG
    8 KB · Aufrufe: 131
  • Temp.PNG
    Temp.PNG
    50,9 KB · Aufrufe: 135
6. Sitzt das Kabel richtig? - SAS als auch Strom!

7. 5-120 Minuten - was passiert in der Zeit? - sprich fallen die Platten erst bei Zugriff aus, oder auch Idle?

8. Schwingt sich ggf. mit den Platten das Gehäuse etwas auf?
Beitrag automatisch zusammengeführt:

Was ich noch festgestellt habe: Im ILO Event Log: On-board clock set; was 01/01/1970 01:03:21. Ist hier die Bios Batterie leer?

Sieht danach aus, oder das Bios wurde resettet
 
Hallo @konfetti ,

6. Ich habe heute Morgen den Server aufgeschraubt und die Verkabelung überprüft. Kabel aus und eingesteckt, sowie den Server gereinigt. Sollten dann bei einem nicht korrekt sitzenden Kabel nicht alle Platten ausfallen? Es ist ja nur ein Molex Kabel für die Backplane vorhanden.

7. Die Festplatten fallen erst nach Zugriff aus, sobald ich zum Beispiel eine Datei entpacke.

8. Der Server steht in einem Regal, das an der Wand hängt. Ich würde sagen Nein.

Vielen dank für eure Hilfe
 
Ich habe das Standard HP 200 Watt Netzteil verbaut. Das sollte eigentlich langen, besonders nachdem der Server nun über ein Jahr so lief oder sehe ich das falsch?

Zuvor hatte ich 4TB SAS HDD´s verbaut.
 
1633594589011.png


macht bei 4 Platten schon ~40W -> bleiben für RAM und restliches System nur noch knapp 160W übrig.

Ich weiß ja nicht, was Deine alten Platten für welche waren und welchen Verbrauch die hatten, aber ja, das kann schon knapp werden.
 
Laut meinem Stromzähler verbraucht der Server aber nur ca. 130 Watt maximal. Reichen die 70 Watt Reserven nicht aus? (150 Watt maximal aber hier muss man die 3 Platten in einem externen Gehäuse mit extra Netzteil mitzählen)

Ich habe vier mal die ST8000NM0075 und eine 500GB Samsung EVO 860 direkt in dem Server verbaut. CPU ist ein Xeon E3-1265L v2.
 
Xeon E3-1265L v2 (45 W) + H222 (10-15 W)+ 4x SAS 7.200K (40 W) Platten werden bei 200Watt schon eng.

Der RaidController P222 unterstützt nur 6Gb/s SAS und die HDDs sind 12Gb/s
Offiziell waren beim Controller auch nur 3TB HDDs möglich. (wenn ichs nicht falsch gesehen habe)


Der MicroServer gen8 ist ja auch schon 7-8 Jahre auf dem Markt.

Das kann jetzt viele Gründe haben.

Beim belasten der Pools entstehen folgende Belastungen:
1: CPU (Software Raid)
2: HDD ( Stromverbrauch & Vibrationen
3. Backplane: (Stromverbrauch & Datenkabel)
4. Netzteil (erhöhter Stromverbrauch)
 
Ne Größenbeschränkung hab ich jetzt nicht gesehn, aber ja, das kann Eng werden mit dem Netzteil, einfach weil ggf. auf der 12V Schiene zu viel verbraucht wird.

der G8 scheint ja normale ATX-Stecker zu haben.
Du könntest ja ggf. mal mit einem anderen Netzteil schauen, ob es stabil läuft.
 
Wie gesagt, ich messe mit meiner USV und meinem Strommessgerät maximal 130 Watt.

Momentan funktioniert ja wieder alles, wie ich schrieb, das verstehe ich nicht.

Sollte es wirklich an dem Netzteil liegen verstehe ich ehrlich gesagt nicht, warum es über ein Jahr funktioniert hat mit der gleichen Belastung.

Vorher hatte ich viermal die hier verbaut Seagate Constellation ES.3 ST4000NM0023. Die verbrauchen sogar mehr Strom und diese hatte ich über 4 Jahre in Betrieb.

Meinst du wirklich es liegt am Netzteil?
 
Zuletzt bearbeitet:
d.h. Dein Netzteil hat jetzt schon 4 Jahre auf dem Buckel?
Die Elkos werden darin nicht besser - vorallem, waren das 4 Jahre Dauerlauf?

Es kann am Netzteil liegen, muss aber nicht - wie schon oben geschrieben, schau mal nach den SMART-Werten der Platten.
 
Hallo @konfetti,

das habe ich doch schon getan in Beitrag 3 steht, dass die Werte in Ordnung sind. Wie gesagt, ich werde gerne ein anderes Netzteil testen. Aber kannst du mir vielleicht bitte erklären, warum erst ein Ausfall eintritt und jetzt wieder alles funktioniert?

Ich verstehe es leider nicht.
 
Laut Quickspecs ist der Controller für max 3TB große Platten zertifiziert. Der P420 für 4TB.
Bei den Vorgängern des Kontrollers funktionierten z.B. nur die Plattengrößen, die in den Quickspecs drin standen, andere Größen wurden ignoriert. Beispielsweise ging eine 1,5 TB Platte, eine 750GB aus der selben Serie nicht. So wählerisch sind die "aktuellen" Kontroller nicht mehr.
Ich könnte mir allerdings vorstellen, das dem Kontroller einfach nur die Resourcen für die Berechnung der Paritätstabellen bei größeren Platten ausgehen, ich rede hier nicht von der Größe des Cache Speichers.
 
Vielen Dank für euer Input und die Hilfe, ich konnte das Problem lösen, indem ich das SAS Kabel getauscht habe. Gut, dass ich hier noch eins herumliegen hatte. Der Server läuft jetzt wieder stabil und ohne Probleme.
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh