Benötige Hilfe - HP ProLiant MicroServer Gen8 - 1 Jahr später

DerDima

Experte
Thread Starter
Mitglied seit
03.06.2016
Beiträge
165
Hallo zusammen.

Nach einem Jahr mit dem HP ProLiant MicroServer Gen8 und bisher tadelloser Funktionalität blinkt er seit heute gelb, was ja einen Defekt einer der beiden verbauten Festplatten bedeutet.

Unbenannt.PNG

Ich nutze 2 Seagate Desktop ST2000DX001 SSHD 2TB Interne Hybrid-Festplatten im RAID 1 Verbund, was wohl mein erster Fehler ist (die Festplattenwahl betreffend).

Ich hatte den Server für kleinere HomeOffice Tätigkeiten verwendet. Er läuft nach wie vor, aber eben mit dem blinken.

Ich bin kein Profi, möchte mich aber gerne mit dem Thema näher beschäftigen.

Könnt ihr mir sagen, wie ich nun die Platte wechseln kann (im Betrieb, oder im ausgeschalteten Zustand)? Muss ich vor- oder nach dem Wechsel der defekten Platte irgendwelche Einstellungen vornehmen, damit der RAID Verbund wieder funktioniert, oder erledigt der Server dies von selbst?

Wie lange kann ich mir mit dem Wechsel der defekten Platte Zeit lassen?

Weiterhin habe ich gelesen, dass eine sogenannte SAS Platte besser für den Server Betrieb geeignet wäre. Könnt ihr dies bestätigen und kann ich eine solche Platte im ProLiant verbauen? Diese hat ja einen etwas anderen Anschluss.

Wenn es geht, kann die zweite oben genannte Seagate zunächst weiterhin in Betrieb bleiben? Hintergund ist der, dass ich mir gerne das Fomatieren bzw. Neu-Aufsetzen sparen möchte. Ich würde die zweite Seagate drinnen lassen, bis diese kripiert und dann die von euch favorosierte Platte einbauen. Danach hätte ich ja wieder zwei Platten der gleichen Sorte.

Ich würde mich freuen, wenn ihr mir einige Vorschläge machen könntet, welche Festplatte eurer Meinung nach am besten geeignet ist.

Vielen Dank im Voraus.

Gruß
Dima
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Wenn du den internen Controller verwendest,Server aus,kaputte Platte raus,neue Platte rein,replizieren lassen. Der interne Controller ist nämlich nicht hot swap fähig.benutzt du einen hot swap fähigen Controller kannst du die Platte im laufenden Betrieb austauschen.

Am besten ist es,wenn die neue Platte die gleiche ist wie vorher...

Ich empfehle für NAS-Betrieb 24/7 grundsätzlich WD-Red


Gesendet von iPhone mit Tapatalk Pro
 
Zuletzt bearbeitet:
Vielen Dank.

Ich habe ebenfalls viele Empfehlungen zu der WD Red erhalten. Diese habe ich nun bestellt.

Was genau ist mit "replizieren lassen" gemeint? Passiert das beim Bootvorgang automatisch? Wie finde ich heraus, ob ich einen HotSwap-Fähigen Controller besitze (Wobei das nicht wirklich ausschlaggebend ist, ich habe keine Probleme damit, den Rechner für den Austausch herunterzufahren)?
 
Replikation raid 1: Festplatte ist kaputt,wird durch funktionierende ausgetauscht,Raid 1 Verbund wird wieder hergestellt...der integrierte Controller vom MS kann kein hot swap...wenn du einen separaten verbeugt hast,könnte er das eventuell. Steht in der Beschreibung des Controllers.


Gesendet von iPhone mit Tapatalk Pro
 
Defekt einer der beiden verbauten Festplatten bedeutet.
Da steht aber bei beiden Platten Status OK. Poste doch bitte mal die Screenshots von CrystalDiskInfo für die beiden Platten und ggf. vorhandenen weitere Platten, ziehe aber bitte das Fenster soweit auf, dass alle Attribute und auch die Rohwerte vollständig sichtbar sind.

Ich nutze 2 Seagate Desktop ST2000DX001 SSHD 2TB Interne Hybrid-Festplatten im RAID 1 Verbund, was wohl mein erster Fehler ist (die Festplattenwahl betreffend).
Die sind nicht für den Dauerbetrieb geeignet, aber in den ersten beiden Jahren ist das meist auch kein Thema, wobei NAS Platten wie die WD Red, Seagate NAS/Ironwolf oder HGST Deskstar NAS (die gibt es erst ab 3TB, dafür aber mit 7200rpm) besser geeignet wären.

Muss ich vor- oder nach dem Wechsel der defekten Platte irgendwelche Einstellungen vornehmen, damit der RAID Verbund wieder funktioniert, oder erledigt der Server dies von selbst?
Du musst ggf. ein Resync anstoßen, ich weiß nicht ob der RAID Controller dies selbst übernimmt.

Wie lange kann ich mir mit dem Wechsel der defekten Platte Zeit lassen?
Bist die zweite Platte auch Probleme macht. Denke daran das RAIDs keine Backups ersetzen!

Weiterhin habe ich gelesen, dass eine sogenannte SAS Platte besser für den Server Betrieb geeignet wäre. Könnt ihr dies bestätigen und kann ich eine solche Platte im ProLiant verbauen?
Nein, dazu braucht man ein SAS HBA / RAID Controller, denn man kann zwar SATA Platten an SAS Controllern betreiben, umgekehrt jedoch nicht.
Wenn es geht, kann die zweite oben genannte Seagate zunächst weiterhin in Betrieb bleiben?
Tasuche die defekte Platten, dazu muss erstmal geklärt werden welche der beiden das ist, dann machen eine Resync des RAIDs und wenn das erfolgreich abgeschlossen ist, dann kannst Du die andere Platte tauschen und erneut ein Resync machen.
 
Vielen Dank.

Gerne würde ich dir das Ergebnis von CrystalDiskInfo zukommen lassen. Leider erkennt das Program auf dem Server die Festplatten nicht.
 
Dann stoße mal ein Rebuild an, da steht ja "Ready to Rebuild" hinter Degraded, denn wenn Du die falsche Platte zuerst rausnimmst, bekommst Du ein Problem, da die andere einen alten Datenstand hat und RAID Controller wenn sie ihre Sache ernst nehmen, ein RAID als Volumen begreifen dessen Daten konsistent sein müssen. Wurde dann ohne eine der HDDs schon auf das RAID geschrieben, beim Booten passiert das bei jedem OS schon wegen der logs, dann hat man ein Problem. Ich weiß nicht mehr ob hier oder in einem anderen Forum, aber irgendwo war mal ein Thread, da hatte einer einen hochwertigen RAID Controller und zwei Platten im RAID 1 und hat sich beschwert, dass es nicht funktionieren würde. Er hat folgenden Test gemacht:
1. RAID 1 eingerichtet und (meine ich) Windows installiert
2. HDD 1 abgezogen und getestet, Windows hat normal gebootet, wurde wieder runtergefahren.
3. HDD 1 wieder eingesteckt und dafür HDD 2 entfernt.
4. Rechner hat nicht gebootet und darin hat er einen Fehler gesehen.

Das war aber kein Fehler, denn es war ein Profi-RAID Controller und kein Billig-Spielzeug RAID Controller, der einfach nur spiegelt. Der Profi-RAID Controller hat gemerkt, dass das RAID nach den Abziehe von HDD 1 degradiert war und da sein Inhalt überschrieben worden ist, weil Windows wie jedes OS ja auch Logs führt und damit immer auch auf sein Systemlaufwerk schreibt. Damit entsprechen nur noch die Daten auf HDD2 den aktuellen Zustand des RAIDs. Durch den direkten Tausch der beiden HDDs gab es nun diesen aktuellen Zustand nicht mehr, da die HDD2 auf der er gespeichert war, ja nicht eingebaut war und HDD1 die letzten Änderungen nicht kannte, der Controller hat das RAID also als defekt gesperrt und das war richtig.

Warum war es richtig? Nun hier hätte bei einem einfach RAID Controller der sowas nicht beachtet und wie der Type sie wohl auch nur kannte, der Rechner auch im Schritt 4 gebootet, eben ohne die Änderungen vom letzten Booten, den z.B. den Eintrag Windows hat um 11:30 gebootet der nur auf HDD2 stand. Dann wäre auf HDD 1 nun z.B. 11:45 als letzter Zeitpunkts des Bootens vermerkt. Was kommt raus, wenn man nun beide HDD bei so einem RAID wieder einbaut? Hängt davon ab, ob die Datei von der einen oder von der anderen Platte gelesen wird. Die Daten stimmen auch beiden Platten nicht überein und das fällt bei solche Billiglösung auch nicht gleichen auf, den RAID lesen immer nur von einer Platten und erst wenn es dort einen Lesefehler gibt, von der anderen. Beide Daten sind aber korrekt lesbar, weichen aber voneinander ab und das darf eben bei Enterprise RAIDs nie passieren, da können wichtig Daten drauf liegen und bei einem Abgleich kann dann auch nicht mehr sagen, welche korrekt sind.

Daher wäre der korrekte Test in dem Fall gewesen, den Schritt 3. so zu gestalten, dass man erst die HDD 1 wieder einfügt, dem RAID Controller Zeit gibt das Resync der Daten von HDD 2 auf HDD 1 abzuschließen und dann erst HDD 2 zieht. Dann hätte HDD 1 den korrekten Datenstand des RAIDs enthalten und es hätte funktioniert. Hoffentlich wurde nun verständlich was ich damit sagen will, wenn ich sage, dass ein RAID eben ein logisches Volumen und mehr als nur die Summe der Platte ist und wieso es gut ist, wenn ein Controller das auch so handhabt.

Ob ein Intel Chipsatz RAID das macht, weiß ich nicht aber ich vermute es stark. Daher muss entweder das RAID vorher rebuildet worden sein oder die Platte zuerst getauscht werden die aus dem RAID geflogen war.
 
durchaus erkennt er gerade nicht welche Platte, darum erst einmal ein rebuild anstoßen

->neu booten und wenn er beim Init des B120 RaidCtl dir eine Auswahl anzeigt musst du F2 drücken, danach bootet er normal durch und macht im Hintergrund den resync

btw. neben den RED WD gibt es ja die Seagate IronWolf die etwas günstiger ist und als Alternative man in Betracht ziehen könnte
 
Zuletzt bearbeitet:
Vielen Dank für eure Antworten und eure Unterstützung.

Ich habe von HP folgende E-Mail Erhalten:

Unbenannt.PNG

Dieser Aussage nach ist die Platte in dem ersten Schacht defekt.

Merkwürdig ist, dass ich in der iLO 4 Oberfläche keinen Defekt der physischen Platte erkenne (Bild im ersten Beitrag). Lediglich das logische Laufwerk, also der RAID Verbund hat ein Problem, wenn ich es richtig verstehe?

Soll ich den Rebuild nun trotzdem anstoßen, wie von servermensch beschrieben?
 
Ich würde vorher noch ein Backup auf ein externes Medium machen


Gesendet von iPhone mit Tapatalk Pro
 
also die mail ist auch klasse, automatisch geht das leider nicht, man muss F1 drücken...mit F2 bootet der weiter ohne rebuild...oder kennt jemand einen Weg wie man das auf automatisch stellen kann ?
 
Zuletzt bearbeitet:
Daten sind gesichert. Ich habe zusätzlich ein Systemabbild gemacht, falls alles fehl schlägt. Die neue Platte ist auch da (WD Red 2TB).

Nun wollte ich mich an eure Vorschläge halten und sehe das hier in der iLO Remote Console:

Unbenannt.PNG

Es verwirrt mich etwas, dass ihr sagt, ich solle mit F2 den Rebuild anstoßen. Hier steht doch F1.

Wird die Auswahl hier getroffen, im Bootvorgang, oder meint ihr etwas ganz anderes?
 
Endlich bin ich mal dazu gekommen, mich der Sache anzunehmen.

Das ist schon sehr undurchsichtig, wenn man davon keine Ahnung hat.

Ich habe folgendes getan:

HP neu gestartet (mit den alten Platten) und F1 gedrückt, als ich das oben beschriebene Fenster bekam. Dann schien es so, als wenn ich mehrmals nach weiteren Eingaben aufgefordert wurde. Diese Menüs wurden aber so schnell hintereinander abgespielt, dass ich weder Zeit hatte, mir etwas durchzulesen, noch einen ScreenShot davon machen konnte oder etwas drücken konnte.

Der Rechner war schnell wieder hochgefahren. Die LED blinkte nach wie vor Orange/Gelb. Nun dachte ich mir, es kann ja nichts passieren. Ich habe ja alles gesichert. Also habe ich noch einen Ordner auf dem Desktop erstellt und einfach "Test" benannt. Ich fuhr den HP runter. Baute die Platte in Slot 1 raus und die neue WD Red ein.

Nach Einschalten des Rechners selbe vorgehensweise. Auch hier wieder F1 gedrückt etc. Der Rechner war genau so schnell wieder hochgefahren, die LED blinkte immer noch Orange. Der vorher erstellte Ordner mit der Bezeichnung "Test" war aber da. Jetzt war ich komplett verunsichert. Macht der Rechner irgendetwas im Hintergrund?

Ich startete den Rechner neu und wurde nicht mehr gefragt, ob ich ein Rebuild machen will oder überspringen möchte. Die LED blinkt nach wie vor Orange.

Nun habe ich wieder rebootet und diesmal per F10 den Smart Storage Administrator geöffnet. Da ich nicht wusste, was passiert war oder ob der HP überhaupt die neue Platte erkennt.

Hier habe ich dann folgendes Bild gesehen:

IMG_0159.jpg

Ist es so, dass der HP den Rebuild im Hintergrund ausführt und man hiervon nichts mitbekommt, wenn man den Rechner normal startet?

Habe ich alles richtig gemacht und soll ich einfach abwarten?
 
ja, er macht den rebuild im Hintergrund.

Wäre ja auch sinnfrei bei einem Server wenn er es nicht im laufenden Betrieb machen kann, es dauert halt nun mal sehr lange.

Im SSA kannst du ja die rebuild Priorität erhöhen wenn du es etwas beschleunigen willst (dafür sind aber laufende Applikationen langsamer da er mehr Prio den rebuild Prozess zuweist) du siehst ja das er bei >11% ist, also kann das noch sehr lange dauern.

ich habe mal zum Test nur für ca 10 Minuten mal eine Platte entfernt und die entfernte anschließend wieder eingesetzt, der anschließende rebuild Prozess obwohl es sicher nur einige hundert fehlende MB waren, hat ca eine 3/4 Stunde im laufenden betrieb gedauert
 
Bei einem reinen RAID ist es egal wie viel sich ändert, nur das Filesystem weiß dies und das liegt logisch auf eine höheren Ebene als das RAID und daher muss ein Rebuild immer alles erfassen. Bei Filesystemen mit eingebautem RAID wie ZFS ist dies anderes.

Eine Platte vor dem Abschluß des Rebuilds zu ziehen, etwas zu ändern und dann wieder einzustecken ist daher auch keine so gute Idee, zumal wenn das System dann das Rebuild nicht von vorne beginnt. Der Screenshot zeigt doch auch klar die Warnung: "Configuration changes to logical drives in the array are not allowed until rebuilding is complete." RAID1 sind keine Snapshots, siehe Post #7!
 
Zuletzt bearbeitet:
Also moment mal.

Jetzt mal wirklich für sehr dumme, wie mich (bitte entschuldigt, wenn ich euch schon auf den Kecks gehe):

Ich habe die "anscheinend defekte" Platte entfernt, da ich nicht wusste, ob nach Drücken der F1 Taste überhaupt etwas passiert war. Nun habe ich eine neue Platte reingesteckt und zunächst den Rebuild per wiederholtem Drücken auf die F1 Taste angestoßen (so hoffe ich). Da ich mir wieder unsicher war, ob überhault etwas geschieht (der Rechner fuhr ja normal hoch und es waren keine Daten verloren!), habe ich den Rechner neu gestartet und per Druck auf F10 Intelligent Provisioning aufgerufen. Hier ging ich dann auf den Storage Manager und hier entstand auch das oben gezeigte Bild.

Diesen Prozess habe ich nicht unterbrochen. Ich beließ den Rechner in dem Menü und nach ca. 3-4 Stunden war er fertig. Es wurde alles als OK angezeigt und die LED unten am Server leuchtete auch wieder dauerhaft blau.

Nun fuhr ich den Server normal hoch. Im Windows dann wieder die orangene blinkende LED. Ich habe den Neustart wiederholt, selbes Ergebnis.

Nun noch mehr verunsichert kontaktierte ich den Support.

Dessen Aussage nach Hochladen meiner Health Datei:


Sehr geehrter Herr Dering.

Dass die Festplatte in Bay 1 heute ausgefallen ist, und dass anschließend der Rebuild gestartet ist, sieht man:

Critical,550,630,Drive Array,01/18/2017 08:12:00,Internal Storage Enclosure Device Failure (Bay 1 Box 0 Port 1I Slot 0)

Caution,551,337,POST Message,01/18/2017 09:22:00,POST Error: 1786-Slot X Drive Array Recovery Needed
Caution,552,340,POST Message,01/18/2017 09:33:00,POST Error: 1778-Slot X Drive Array Resuming Automatic Data Recovery (Rebuild) process
Caution,553,326,POST Message,01/18/2017 09:37:00,POST Error: 1778-Slot X Drive Array Resuming Automatic Data Recovery (Rebuild) process
Caution,554,334,POST Message,01/18/2017 09:53:00,POST Error: 1778-Slot X Drive Array Resuming Automatic Data Recovery (Rebuild) process
Caution,556,328,POST Message,01/18/2017 15:32:00,POST Error: 1778-Slot X Drive Array Resuming Automatic Data Recovery (Rebuild) process
Caution,557,316,POST Message,01/18/2017 15:38:00,POST Error: 1778-Slot X Drive Array Resuming Automatic Data Recovery (Rebuild) process

[01/18 15:39:13] Array A Unit U00: RAID 1
[01/18 15:39:13] U00 from 2 drives: D000[R] D001
[01/18 15:39:13] stripsize=512 (256 KiB) volstate=REBUILDING datadrives=1 paritygroups=1 cache=enabled accel=disabled/disabled
[01/18 15:39:13] offset=0x0 logical_blocks=0xE8DF88B0 (1862 GiB)
[01/18 15:39:13] uf=0x0 srf=0x1 dt=3 pdm=0 psf=4 bd=0x0 naz=0x0 nwz=0x3BF0 bsf=512 muf=0x0
[01/18 15:39:13]
[01/18 15:39:13] Starting rebuild U00 D000 ibc=512

Auch, dass der Rebuild fortschreitet:

[01/18 15:49:14] Rebuild progress U00 D000: 0xE5B620B0 blocks remaining, 1.4% complete (will START OVER if reset)
[01/18 15:59:14] Rebuild progress U00 D000: 0xDD27F8B0 blocks remaining, 5.1% complete (will START OVER if reset)


Somit sieht eigentlich alles in Ordnung aus. Es könnte ziemlich lange dauern, bis der Rebuild abgeschlossen ist (bitte rechnen Sie ca. 15 Minuten pro GB).

Nur zur Information – die zwei Memory Module funktionieren normal, sind aber nicht für Server der Generationen 8 und 9 gemeint (kein Smart Memory).
Die zwei Festplatte scheinen auch keine Probleme zu haben, sind aber keine HP-Festplatten und somit auch nicht mit dem Controller getestet. (Wo HP auch Festplatten von Western Digital and Seagate anbietet, sind diese in der Regel speziell für HP hergestellt und mit einer HP-Firmware ausgestattet).

Zum Schluß schlage ich vor, dass wir ein paar Tage abwarten, ob der Rebuild normal zu Ende läuft.



15 Min. pro GB???!!! Das wären bei 2 TB mehr als 20 Tage... Ist das wirklich normal?

Wo kann ich den aktuellen Status des Rebuildes denn einsehen, wenn ich im Windows bin? Irgendwo in der iLO4 Weboberfläche vielleicht?
 
Zuletzt bearbeitet:
Das Rebuild läuft mit geringer Priorität ab, damit der Server weiterhin nutzbar bleibt, wie auch schon in Post #17 erklärt wurde. Bei HDD s bremsen parallele sich gegenseitig sehr stark aus, würde das Rebuild mit voller Leistung laufen, wäre der Rechner in der Zeit kaum zu benutzen.
 
Und gerade wegen dieser Verfügbarkeit hat man ja ein Raid.. sonst könnte man auch einfach ein Backup zurückspielen.
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh