Perc 5/i schaltet Array offline, nutzt Global Hotspare nicht + Plattenersatz

black-avenger

Enthusiast
Thread Starter
Mitglied seit
06.10.2006
Beiträge
4.560
Ort
Ba-Wü & WÜ
Ahoi,

habe jetzt nach stark 2 Jahren erstmal Probleme mit meinem Serverlein. Als Raidcontroller wird ein Dell Perc 5/i verwendet, die Platten stecken in Chieftech SST-3141SAS Backplanes. Und zwar scheint eine der drei Platten aus meinem Raid 5 Probleme zu haben. Zum einen hat die Chieftech Backplane Wärmealarm gegeben, der Jumper war auf 45°C. Ob das was mit dem Problem zu tun hat weiß ich nicht.
Jedenfalls hat der Perc aufgrund der Probleme mit der einen Platte im Verbund mein Raid 5 Array gedropped. Eigentlich hätte ich erwartet, dass er anstelle das Array rauszuwerfen die Global Hotspare reinnimmt? Ist nicht passiert. Oder muss ich das manuell auslösen? Wär mir aber im Raid Bios nicht aufgefallen dass das geht.
Foreign Configuration importieren ging im Raid Bios des Perc auch nicht, da eine Platte wohl beschädigt sei. Nun gut. Nachdem ich die Global Hotspare nicht zum Einspringen bewegen konnte hab ich die Holzhammermethode gewählt. Server wieder runter gefahren, die defekte Platte aus der Backplane genommen, die Hotspare physisch an deren Stelle gesetzt. Server angeschaltet, siehe da - Foreign Configuration kann geladen werden, eine Platte wird als Missing geflaggt, das Array fängt aber sofort an sich neu aufzubauen. Die leere Platte wird also integriert. Soweit so schön, Datenzugriff wieder problemlos möglich.

Was genau die Platte die aus dem Verbund geworfen wurde hat kann ich noch nicht sagen, ich kanns erst am Wochenende testen. Jedenfalls würde mich interessieren warum die Global Hotspare nicht automatisch als Ersatz ins Array gezogen wurde? Hat mir dafür jemand eine Erklärung, oder hab ich bereits von vorneherein eine falsche Vorstellung der Global Hotspare?


Dann - die defekte Platte soll ersetzt werden. Die verwendeten WD Black 500GB RE3 gibts nur kaum noch. WD Black 500GB RE4 sind dagegen verfügbar. Die Platten haben allerdings größeren Cache und sind allgemein schneller.
Kann ich eine neuere RE4 einfach so dazu setzen, oder gibt das Probleme aufgrund der unterschiedlichen Cachegröße/Geschwindigkeit? Hab eigentlich nur mäßig Lust für 350 Euro vier neue Platten zu kaufen nur weil eine sich nach 3 Jahren verabschiedet hat. Zum Glück ist noch Garantie drauf, mal sehen wie die Abwicklung läuft.


Hoffe es kann mir jemand ein paar Antworten geben.

Grüße
Thomas
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Hat der Perc die aktuellste Firmware? Bei nen Adaptec 5405 musste ich nen Update durchführen, um überhaupt eine Hotspare einstellen zu können. Mit der neuen Festplatte sollte keine großen Probleme geben. Sie arbeitet in ihrer Geschwindigkeit und die anderen in der jeweils eigenen. Korrigiert mich, wenn ich falsch liegen sollte ;)
 
Neja ich sag mal so, das was du schreibst, klingt für mich nicht wie ein typischer HDD defekt. Denn der ist idR so, das die Platte entweder gar nicht mehr geht (nicht mehr anfährt, beim Starten, Controllerseitig nicht mehr will, usw.) oder das die Platte zwar noch tut, aber es defekte Sektoren über einem gewissen Schwellwert gibt, welcher dann idR via SMART einen Alarm rauswirft, was wiederum den Controller dazu bringt, die HDD aus dem Array zu schmeißen...
Die Hotspare Platte (ähnlich verhällt es sich bei ner Coldspare Platte) springt aber erst dann als Ersatz rein, wenn die defekte HDD eindeutig bekannt ist und auch eindeutig aus dem Array gewurfen wurde.
Nach deinem Text klingt es nicht so, als wäre das schon der Fall. Sprich der Controller befindet die vermeindlich defekte HDD noch als gut und deswegen greift die Hotspare nicht.

Warum der Controller wie du sagst, das Array nun dropped, was für mich so klingt, wie das Array blockiert, kann man so ohne weiteres nicht orakeln. Da müsstest du mal gucken, ob dir der Controller irgendwas an Infos im Log ausspuckt usw.
Eventuell ist die HDD auch nichtmal defekt. Das lässt sich aber auch testen via Tools.


Ansonsten wie schon gesagt wurde, du kannst quasi problemlos die neue Platte mit ins Array einbinden. Auch neuere Modelle oder Modelle anderer Hersteller. Im dümmsten Fall passiert es dir, das du etwas Speed einbüßt. Wobei auch das eher theoretischer Natur ist. Zumal die neue Platte ja dann schneller sein dürfte als die alten RE3 Platten.
 
Danke für eure Einschätzungen. Aufgrund massivem Studienstress kann ich leider bis in zwei Wochen nicht an den Server, sobald ich wieder regelmäßig am Standort bin werd ich die Platte umgehend mal auf defekte Sektoren testen.

Jedenfalls im LSI MegaRaid Manager wurde die schuldige Platte ja eindeutig erkannt und auch als problembehaftet angezeigt. Ich wurde von meinem Bruder direkt angerufen als es Probleme gab. Wollte dann im Endeffekt noch versuchen ein Backup vom Array zu ziehen falls in der Zwischenzeit zum täglichen 2:00 Uhr Backup noch irgendwelche kleineren Änderungen an Word Dateien oder so sein sollten. Ging nicht. Das Array war kläglich langsam, Dateizugriffe wurden teilweise verweigert.
Nach dem Runterfahren wars dann gedropped und hat sich erst nach meinem holzhammermäßigen physischen Plattenwechsel wieder online laden und online schalten lassen. Hatte sich dann ja auch direkt ordnungsgemäß rebuilded. Bislang sind auch keine weiteren Probleme mehr aufgetreten.

Die Logfiles vom Controller kann ich auf Wunsch posten, müsste die irgendwo abgespeichert haben. Aber dass die Platte noch nicht eindeutig rausgeworfen wurde... Hm, möglich. Hab ich in der Eile und mangels Erfahrung wohl nicht einschätzen können wie weit die jetzt draußen ist, oder nur als problembehaftet geflagged wurde. Meine Frage wär aber, warum er das Array komplett rauswirft, sodass ich es erst unter Heiden Schweißausbruch als Foreigen Configuration wieder laden muss, anstelle die identifizierte Platte rauszuwerfen und einfach mit der Hotspare zu rebuilden. Mir scheint da der Sinn der Hotspare leicht verfehlt. Aber nun gut.

Zum Firmwareupdate und der Hotspare - ich kann im Perc Bios ja eindeutig eine Hotspare konfigurieren. Habe das bei Einrichtung des Servers ja auch so getan. Wenns eindeutig konfigurierbar war und ist sollte es doch daran nicht liegen dürfen, oder?


Grüße
Thomas
 
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh