Steggi
Enthusiast
Thread Starter
- Mitglied seit
- 31.12.2010
- Beiträge
- 3.483
Nabend,
seit etwas über zwei Wochen hab ich testweise die 4 kleinen SAS Platten in meinem Storage (siehe Signatur) durch 4 größere SATA Platten getauscht, da ich für ein kleines Projekt zum einen etwas mehr Platz als auch eine gute I/O Leistung brauche und das andere Array I/O mäßig schon recht stark belastet ist.
Also ein RAID 10 aufgebaut, initialisierung angestoßen und das Array über Nacht initialisieren lassen.
Das ganze lief so ein paar Tage, bis ich einige VMs auf die Platten geschoben hatte. Das Rüberschieben dauerte ne gefühlte Ewigkeit und auf dem Storage konnte man erkennen, dass das ganze System immer mal wieder kurz freezed. Ein Blick in die Ereignissanzeige brachte mir folgende Meldung (mehrfach)
Onboard hängt lediglich die Systemplatte, die laut Smart OK war. Auch ein Sektorscan zeigte keine Fehler.
Ein Blick in den Dell Storage Manager zeigte mir mehrfach folgende Fehlermeldungen, die nur wenige Stunden nach dem Start der Initialisierung der vier Platten geworfen wurde
An der betroffenen Schnittstelle hing eine der vier neuen Platten. Da der PERC keine Smart Werte weiterleitet, hab ich erst mal ein Patrol Read drüber laufen lassen, und als das fehlerfrei durch lief, die betroffene Platte offline genommen und die Smart Werte via USB Adapter und Crystaldiskinfo ausgelesen. Die Werte waren eigentlich noch recht normal. Platte wieder rein und das Raid rebuilded. Nachdem der Server wegen des Low Level Scans der Systemplatte einmal neu gestartet wurde, war auch wieder für ein paar Tage ruhe.
Ein paar Tage später, als ich auf dem betroffenen Array mal wieder viel Last erzeugte, meldete sich der megasas im Eventlog mit folgender Meldung zwei mal
Leider wurde dieses Mal im Storage Manager nichts geloggt, aber aufgrund des Verdachts, dass da wieder eine der Platten Probleme macht, hab ich jetzt erst mal das ganze Array aufgelost, und die Smartwerte via USB Adapter gescannt.
Die Werte und im Vergleich dazu die Platte Nummer 4, die ich vor ein paar Tagen schonmal geprüft hab.
Was mich etwas Wundert sind die Werte der Fehlerlesewiederholungsrate, die sich doch sehr verändert hat, und die Laufzeit der vierten Platte.
Hat sonst noch wer ne Idee, wo der Fehler sein könnte, oder mögen die Platten einfach nur kein RAID? Ich würd ja gerne größere SAS Platten nutzen, nur dafür fehlt im Moment mal wieder das nötige Kleingeld...
seit etwas über zwei Wochen hab ich testweise die 4 kleinen SAS Platten in meinem Storage (siehe Signatur) durch 4 größere SATA Platten getauscht, da ich für ein kleines Projekt zum einen etwas mehr Platz als auch eine gute I/O Leistung brauche und das andere Array I/O mäßig schon recht stark belastet ist.
Also ein RAID 10 aufgebaut, initialisierung angestoßen und das Array über Nacht initialisieren lassen.
Das ganze lief so ein paar Tage, bis ich einige VMs auf die Platten geschoben hatte. Das Rüberschieben dauerte ne gefühlte Ewigkeit und auf dem Storage konnte man erkennen, dass das ganze System immer mal wieder kurz freezed. Ein Blick in die Ereignissanzeige brachte mir folgende Meldung (mehrfach)
Das Gerät \Device\Ide\iaStor0 hat innerhalb der Fehlerwartezeit nicht geantwortet.
Onboard hängt lediglich die Systemplatte, die laut Smart OK war. Auch ein Sektorscan zeigte keine Fehler.
Ein Blick in den Dell Storage Manager zeigte mir mehrfach folgende Fehlermeldungen, die nur wenige Stunden nach dem Start der Initialisierung der vier Platten geworfen wurde
Controller-ID: 0 Unerwartete Feststellung Physische Festplatte = 0:7, CDB = 0x28 0x00 0x0e 0xa0 0xd6 0x7d 0x00 0x00 0x03 0x00 , Feststellen = 0xf0 0x00 0x03 0x0e 0xa0 0xd6 0x7d 0x0a 0x00 0x00 0x00 0x00 0x11 0x00 0x00 0x00 0x00 0x00
Controller-ID: 0 Hintergrundinitialisierung korrigierte Datenträgerfehler ( Virtuelle Festplatte 1 Standort 0xea0d678, Physische Festplatte 0:7 Standort 0xea0d678)
An der betroffenen Schnittstelle hing eine der vier neuen Platten. Da der PERC keine Smart Werte weiterleitet, hab ich erst mal ein Patrol Read drüber laufen lassen, und als das fehlerfrei durch lief, die betroffene Platte offline genommen und die Smart Werte via USB Adapter und Crystaldiskinfo ausgelesen. Die Werte waren eigentlich noch recht normal. Platte wieder rein und das Raid rebuilded. Nachdem der Server wegen des Low Level Scans der Systemplatte einmal neu gestartet wurde, war auch wieder für ein paar Tage ruhe.
Ein paar Tage später, als ich auf dem betroffenen Array mal wieder viel Last erzeugte, meldete sich der megasas im Eventlog mit folgender Meldung zwei mal
Ein Zurücksetzen auf Gerät "\Device\RaidPort0" wurde ausgegeben.
Leider wurde dieses Mal im Storage Manager nichts geloggt, aber aufgrund des Verdachts, dass da wieder eine der Platten Probleme macht, hab ich jetzt erst mal das ganze Array aufgelost, und die Smartwerte via USB Adapter gescannt.
Die Werte und im Vergleich dazu die Platte Nummer 4, die ich vor ein paar Tagen schonmal geprüft hab.
Was mich etwas Wundert sind die Werte der Fehlerlesewiederholungsrate, die sich doch sehr verändert hat, und die Laufzeit der vierten Platte.
Hat sonst noch wer ne Idee, wo der Fehler sein könnte, oder mögen die Platten einfach nur kein RAID? Ich würd ja gerne größere SAS Platten nutzen, nur dafür fehlt im Moment mal wieder das nötige Kleingeld...