LSI MegaRaid und Dell Perc5/i SAS/SATA PCIe [3]

Status
Für weitere Antworten geschlossen.
Von daher wohl in Zukunft bei 1 defekten Platten, das Raid nicht mehr benutzen und abklemmen, eine neue Platte besorgen installieren und rebuild mache, wobei es echt schon Pech ist wenn gleich im kurzen Zeitraum 2 Platten ausfallen.
 
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Von daher wohl in Zukunft bei 1 defekten Platten, das Raid nicht mehr benutzen und abklemmen, eine neue Platte besorgen installieren und rebuild mache, wobei es echt schon Pech ist wenn gleich im kurzen Zeitraum 2 Platten ausfallen.

Du, ich habe per Remote auf den Server geguckt und da waren gleich beide als Offline drinne.....

Mir ist das nur aufgefallen weil ich einige Daten nicht lesen konnte......

Ich konnte sie allerdings durch Replace....... zum Raid hinzufügen und die Daten lesen....

Mal sehen was der ESTOOL zur ersten Platte sagt....

---------- Beitrag hinzugefügt um 17:34 ---------- Vorheriger Beitrag war um 17:34 ----------

hier nochmal die stellen an denen du siehst dass es sich um die HDD am port 1 handelt:

DANKE !!!! Also weiß ich jetzt sicher das er mir auf Platte 0-2 also auf DREI von meinen VIER Fehler anzeigt....

---------- Beitrag hinzugefügt um 17:35 ---------- Vorheriger Beitrag war um 17:34 ----------

die einzige möglichkeit noch was zu retten besteht vielleicht darin die unten aufgelistete disk manuel mittels "replace missing drive" wieder ins array zu packen. ob das funzt sei noch dahin gestellt.

Wie etwas weiter oben gesagt half das gestern noch.....

---------- Beitrag hinzugefügt um 17:38 ---------- Vorheriger Beitrag war um 17:34 ----------

Ich werde jetzt den ESTOOL Test der ersten Platte abwarten und danach mal Platte 1 und 2 testen.....

Habe trotzdem nen haufen fragen,

1. Was mache ich wenn EINE HDD Defekt ist ? (Einfach meine übrige anschließen und Rebuild anwerfen?)
2. Was mache ich wenn der PERC weiter an mehr als eine Mekert ? (Auch meine übrige Platte anschließen und REBUILD anwerfen?)
3. Was mache ich wenn mehr als eine DEFEKT ist ? (Alle 4 anschließen und mit einer FÜNFTEN, trotzdem nen Rebuild anwerfen ?)
 
nochmal zur sicherheit:

port 0 im programm = anschluss 1 und somit hdd1
port 1 im programm = anschluss 2 und somit hdd2
port 2 im programm = anschluss 3 und somit hdd3

etc. anschlussbelegung siehe post 1 oder 2


da die fehlermeldungen im zweiten screen von dir als taget port 0 haben ist wohl hdd 1 fricke und auch als offline markiert. hdd 3 u 4 sind so wie es aussieht okay

k.a. wie die anderen es hier halten aber ich mache bei mir immer folgendes:

1. neues array wird erst nach einigen wochen testerei vollständig in den eigentlichen betriebszustand übernommen. erst dann kommen die daten drauf bzw ich seh die daten als sicher an. zuvor sollte man nen paar mal consitency check und patrol read durchschicken und den rechner auch mal mehrere tage laufen lassen. beim erstellen eines neuen arrays full init durchlaufen lassen! deluxe: platten vorher einzeln mit dem herstellertool überprüfen und 1-2x beschreiben lassen
2. config sichern oder sich zumindest merken!
3. nich vergessen haben auf GPT zu setzen
4. bei ner erweiterung sollte die zu erweiternde platte schon nebenbei als hot-spare gelaufen sein. consitency check und patrol read sind ebenso sehr sinnvoll. das prüft die platte mit
5. backup anlegen!!!!!!!! ich hab den gesamten datenbestand noch auf einzelnen hdds verteilt im schrank. ne ersatzdisk lässt sich u.U. auch erstmal fürs backup nutzen.
6. zusätzlich mindestens 1x hdd des raids im schrank für den ersatz haben. ne platte tauscht man idR auch nicht mal eben aus. das dauert eine woche oder länger (seagate ~ ne woche; WD deutlich länger; samsung k.a.)
7. die krönung: das ganze array nochmal an nem anderen controller haben. sprich quasi als backuparray fürs backup


somit zu den fragen:

1. genau. einfach nen ersatz an dem betroffenen anschluss anschließen oder an einen anderen noch freien und die alte platte abziehen (rechner aus)
2. andere platte anschließen wäre sinnvoll - für nen notbetrieb gehts aber auch mit den vorhandenen. er wirft die platten normal nur bei sehr vielen fehlern raus. das ist auch einstellbar (siehe einer der screens der letzten seiten hier)
3. versuchen daten noch zu sichern (alles was kleiner als die stripe war sollte vielleicht noch okay sein - aber das sind gewöhnlich nciht sehr viele daten die in frage kommen. deshalb: array plätten un mit hdds die in ordnung sind neu erstellen


wer WDs nutzt sollte vor einrichtung des raids den idle-timer anpassen und ggf/falls möglich TLER aktivieren. letzteres hab ich mit meinen 1TB Blacks aktiviert. die 640er hab ich lange vor der erkenntnis, dass sowas geht, eingerichtet und bisher noch nicht geändert. es geht natürlich auch noch nachträglich. bedingt durch die anzahl der platten und meine faulheit :-)fresse:) hab ichs aber noch nicht gemacht. bisher hatte ich noch nicht einen unexpected sense (TLER off) auf den Blacks (die 640er sind nun 1,5 jahre im betrieb - teils wochen 24/7). daher: super zufrieden damit :banana:
 
Zuletzt bearbeitet:
So Platte NULL ist OHNE FEHLER durchgelaufen, soll ich sonst vllt einfach nochmal das RAID Starten und meine übrige 1TB als Hotspare einrichten !?

Achja, auf dem Screen weiter unten meckert er doch auf wegen Platte 2 und 3.....
und auf nem andern Screen meckerte er auch wegen PD 1. Das würde ja heißen das alle einen weg haben...



oder ?

Kann ja garnicht sein das DREI DEFEKT SIND....
 
Zuletzt bearbeitet:
wenn es nur 1x vorkommt pro drive kanns auch an der verwaltungssoftware liegen. deshalb nutze ich immer noch ne uralt-version die dieses problem nciht zeigt. wenn es jedoch emhrmal kurz hintereinander vorkommt und dann die platte sogar gedroppt wird ists nen hdd-problem
 
wenn es nur 1x vorkommt pro drive kanns auch an der verwaltungssoftware liegen. deshalb nutze ich immer noch ne uralt-version die dieses problem nciht zeigt. wenn es jedoch emhrmal kurz hintereinander vorkommt und dann die platte sogar gedroppt wird ists nen hdd-problem

Was also tuhen ? Hotspare platte rein schmeißen ?
 
Sorry, evtl. hab ichs überlesen, aber wielange ist das Raid denn überhaupt schon gelaufen?
Vielleicht sind die Platten einfach nicht kompatibel wobei der Perc da recht pflegeleicht ist.
Andererseits sind Samsung Platten nicht so der Knüller bei Raid Sachen. Empfinde ich jedenfalls so wenn man schon ne Weile im Forum mitliest.
 
Hi,

das Problem das die Platten rausgeflogen sind, das hatte ich bei meinen WD-RE4-GP auch. Es wurde aber durch ein Firmwareupdate der Platten behoben.

Ich will damit sagen...
Eventuell sind die Platten nicht für ein Raid mit dem Perc geeignet.

Grüße
Jürgen
 
Zuletzt bearbeitet:
Das Raid lief so jetzt seit dem 22.03.2010...... Gestern kam das Problem das gleich 2Platten weg waren als ich zugegriffen habe, rausgeworfen hat der Perc die Platten während des Wöchentliche, "Patrol Read".
 
Ja gut aber wieviel Stunden? durchgelaufen?
Wenn bloß ein paar Std. täglich oder wöchentlich dann kann man nicht sagen das die Samsung und der Perc sich mögen.
 
Das ding lief 24/7

Habe aber vor ein paar Tagen die CPU getauscht......

Wenn die ne Macke hat, könnte das Einfluss nehmen !?
 
Naja ein Vorteil wäre das sicher nicht.
Aber andere CPU mit internem Ram Controller? Evtl. können da ja Probleme mit dem Ram auftreten der mit der alten CPU problemlos gelaufen ist.

Vielleicht können die anderen mal noch was dazu sagen.
 
Aber andere CPU mit internem Ram Controller? Evtl. können da ja Probleme mit dem Ram auftreten der mit der alten CPU problemlos gelaufen ist.

Genau dadran dachte ich, war vorher nen K8, jetzt nen K10,5
 
Code:
Controller ID:  0   Unexpected sense:   PD  
    =   0:3 - Power on, reset, or bus device reset occurred,   CDB   =    0x2a  0x00  0x00  0x06  0xaa  0x00  0x00  0x01  0x00  0x00     ,   Sense   =    0x70  0x00  0x06  0x00  0x00  0x00  0x00  0x0a  0x00  0x00  0x00  0x00  0x29  0x00  0x00  0x00  0x00  0x00

Kabel kaputt? Kam bei der neuen HDD, während des Rebuilds.
 
Schaut mal, wenn man die Fehler Meldungen gegenüberstellt.

Controller ID: 0 Unexpected sense: PD
= --:--:0 - Invalid field in CDB, CDB = 0x4d 0x00 0x4d 0x00 0x00 0x00 0x00 0x00 0x20 0x00 , Sense = 0x70 0x00 0x05 0x00 0x00 0x00 0x00 0x0a 0x00 0x00 0x00 0x00 0x24 0x00 0x00 0x00 0x00 0x00

Controller ID: 0 Unexpected sense: PD
= --:--:4 - Invalid field in CDB, CDB = 0x4d 0x00 0x4d 0x00 0x00 0x00 0x00 0x00 0x20 0x00 , Sense = 0x70 0x00 0x05 0x00 0x00 0x00 0x00 0x0a 0x00 0x00 0x00 0x00 0x24 0x00 0x00 0x00 0x00 0x00

sieht man dass das genau die selben Meldungen sind.... Nur halt auf nem anderen PD

Die Meldung kommt übrigens für alle PD´s

Ich habe jetzt mal die CPU zurück getauscht und wollte nen Patrol Read machen, kriege aber die Meldung das kein Patrol Read während einer Initializierung gestartet werden kann.

---------- Beitrag hinzugefügt um 20:33 ---------- Vorheriger Beitrag war um 20:24 ----------

Ich habe jetzt meine FÜNFTE 1TB Platte (anderes Modell, aber auch Samsung) als HotSpare angeschlossen.

Controller ID: 0 State change: PD
= --:--:4 Previous = Unconfigured Good
Current = Hot Spare

und dannach kam SOFORT diese Meldung....

Controller ID: 0 Unexpected sense: PD
= --:--:4 - Invalid field in CDB, CDB = 0x4d 0x00 0x4d 0x00 0x00 0x00 0x00 0x00 0x20 0x00 , Sense = 0x70 0x00 0x05 0x00 0x00 0x00 0x00 0x0a 0x00 0x00 0x00 0x00 0x24 0x00 0x00 0x00 0x00 0x00

Das ist ja genau die Meldung die ich auch bei den ersten 3 Platte kriege....

---------- Beitrag hinzugefügt um 20:35 ---------- Vorheriger Beitrag war um 20:24 ----------

Ich habe die Task Rates für Rebuild und BGI jetzt mal erhöht und werde das Raid mal über Nacht in Ruhe laufen lassen.

Weiß einer was die obige Meldung den genau bedeutet, habe über google nichts gefunden.
 
Zuletzt bearbeitet:
Diese Meldung taucht bei mir auch auf. Bei allen HDDs.

Ein User hat mal hier eine Erklärung gebracht, diese konnte ich jedoch nicht nachvollziehen.
 
Diese Meldung taucht bei mir auch auf. Bei allen HDDs.

Ein User hat mal hier eine Erklärung gebracht, diese konnte ich jedoch nicht nachvollziehen.

Also kann man das als Normal abtuhen....

Dann muss ich jetzt nochmal den Log durch wuehlen warum er gestern 2 Platten raus geschmissen hat.....
 
hier hatte doch mal ein user die Hdds getestet mit den 4kb sektoren und war davon nicht so begeistert.

ich kann sein posting grade nicht finden betrifft das auch die Western Digital Caviar Green 2000GB, 64MB Cache, SATA II (WD20EARS)?

Sind atm die günstigsten 2tb hdds, gibt es hier überhaupt user die 2TB hdds am perc erfolgreich einsetzten und wenn ja welche sind das?
 
Sind atm die günstigsten 2tb hdds, gibt es hier überhaupt user die 2TB hdds am perc erfolgreich einsetzten und wenn ja welche sind das?

Na ich!
Aber die teure Raid Edition WD-RE4-GP. Hab mir grad noch ne vierte bestellt.
Die laufen seid Anfang Dezember 24/7 einwandfrei ohne Probleme. Nur das Firmware Update musste ich machen.
 
Also die EARS haben imho keine Vorteile gegenüber den EADS.
Ausserdem lässt sich bei den 64MB Versionen afaik TLER nicht mehr aktivieren. Bei den 32MB EADS geht das aktuell immer noch.

Hab selber einige Hitachis mit 2TB am PERC hängen. Laufen soweit unauffällig
 
Weiß jemand ab welchem LSI Manager er es nicht mehr macht, ......... ein wenig stört mich da schon, auch wenn es nichts zu bedeuten hat.
 
Weiß jemand ab welchem LSI Manager er es nicht mehr macht, ......... ein wenig stört mich da schon, auch wenn es nichts zu bedeuten hat.

wenn du diese sense-errors meinst: ich hab V2.35-01 drauf. die ist zwar schon was älter - funzt aber unter W7 x54 trotzdem ohne probleme

@mongobart: ist eingetragen
 
Wenn du schon dabei bist, kannst du meine Config auch eintragen.

Perc 5i auf Gigabyte 965p-DS4 rev. 3.3 im 2. PCIe x16 Slot (4Lanes) nach PinMod ok



Mal ne blöde Frage. Bald dürfte mein Rebuild fertig sein, was kommt danach? Macht der noch eine BGI oder so?


edit: Ohman, ich gehe kaputt. Wieder Error während des Rebuilds, wieder Drive 3. Kabel kaputt? Log bitte von unten nach oben lesen.


Code:
ID = 2947
SEQUENCE NUMBER = 6620
TIME = 18-04-2010 11:04:57
LOCALIZED MESSAGE = Controller ID:  0   Rebuild aborted by user:   PD       0:3

ID = 2946
SEQUENCE NUMBER = 6619
TIME = 18-04-2010 11:04:52
LOCALIZED MESSAGE = Controller ID:  0   Unexpected sense:   PD       =   0:3 - Invalid field in CDB,   CDB   =    0x4d  0x00  0x4d  0x00  0x00  0x00  0x00  0x00  0x20  0x00     ,   Sense   =    0x70  0x00  0x05  0x00  0x00  0x00  0x00  0x0a  0x00  0x00  0x00  0x00  0x24  0x00  0x00  0x00  0x00  0x00 

ID = 2945
SEQUENCE NUMBER = 6617
TIME = 18-04-2010 11:01:44
LOCALIZED MESSAGE = Controller ID:  0   State change:   PD       =   0:3  Previous   =   Offline      Current   =   Rebuild

ID = 2944
SEQUENCE NUMBER = 6616
TIME = 18-04-2010 11:01:44
LOCALIZED MESSAGE = Controller ID:  0   Rebuild automatically started:   PD       0:3

ID = 2943
SEQUENCE NUMBER = 6615
TIME = 18-04-2010 11:01:44
LOCALIZED MESSAGE = Controller ID:  0   State change:   PD       =   0:3  Previous   =   Unconfigured Good      Current   =   Offline

ID = 2942
SEQUENCE NUMBER = 6614
TIME = 18-04-2010 11:01:44
LOCALIZED MESSAGE = Controller ID:  0   State change:   PD       =   0:3  Previous   =   Unconfigured Bad      Current   =   Unconfigured Good

ID = 2941
SEQUENCE NUMBER = 6613
TIME = 18-04-2010 11:01:44
LOCALIZED MESSAGE = Controller ID:  0   Drive is not certified:       0:3

ID = 2940
SEQUENCE NUMBER = 6612
TIME = 18-04-2010 11:01:44
LOCALIZED MESSAGE = Controller ID:  0  Device inserted   Device Type:       Disk  Device Id:   0:3

ID = 2939
SEQUENCE NUMBER = 6611
TIME = 18-04-2010 11:01:44
LOCALIZED MESSAGE = Controller ID:  0   PD inserted:       0:3

ID = 2938
SEQUENCE NUMBER = 6610
TIME = 18-04-2010 11:01:07
LOCALIZED MESSAGE = Controller ID:  0   Rebuild failed due to target drive error:   PD       0:3

ID = 2937
SEQUENCE NUMBER = 6609
TIME = 18-04-2010 11:01:07
LOCALIZED MESSAGE = Controller ID:  0   State change:   PD       =   0:3  Previous   =   Failed      Current   =   Unconfigured Bad

ID = 2936
SEQUENCE NUMBER = 6608
TIME = 18-04-2010 11:01:07
LOCALIZED MESSAGE = Controller ID:  0   State change:   PD       =   0:3  Previous   =   Rebuild      Current   =   Failed

ID = 2935
SEQUENCE NUMBER = 6607
TIME = 18-04-2010 11:01:07
LOCALIZED MESSAGE = Controller ID:  0  Device removed   Device Type:       Disk  Device Id:   0:3

ID = 2934
SEQUENCE NUMBER = 6606
TIME = 18-04-2010 11:01:07
LOCALIZED MESSAGE = Controller ID:  0   PD removed:       0:3

ID = 2933
SEQUENCE NUMBER = 6605
TIME = 18-04-2010 11:00:40
LOCALIZED MESSAGE = Controller ID:  0   Time established since power on:   Time   2010-04-18,11:00:40      58591  Seconds

Was kann es noch sein?

-HDD, unwahrscheinlich, dass neue HDD ebenfalls defekt
-Kabel -> Teste gerade das Kabel von der Hotspare
-Controller (Speicher?)


edit die x-te: Rebuild läuft mit Anschluss 0 schneller als mit 3. Nach 23min 4%. Kann aber auch Einbildung sein :confused:
 
Zuletzt bearbeitet:
edit: Ohman, ich gehe kaputt. Wieder Error während des Rebuilds, wieder Drive 3. Kabel kaputt? Log bitte von unten nach oben lesen.

Sind deine Samsung-Platten eigentlich auch diese neuen mit den 4kB-Sektoren?

Mit ein paar WD EARS hatte ich nämlich neulich auch ein etwas merkwürdiges Erlebnis im RAID1. Allerdings war das nicht an einem PERC, sondern in einer Synology DiskStation.
Das RAID lief etwa 1 Monat einwandfrei, dann ist auf einmal Disk 1 wegen Schreibfehlern aus dem Array geflogen. Disk geprüft, aber keine Fehler gefunden, also wieder ins Array eingebunden. 3 Tage später ist Disk 0 mit genau den gleichen Fehlern raus geflogen. Das merkwürdige war aber, dieser Schreibfehler ist bei genau jedem 8. Sektor aufgetreten. Ich hab dann herausgefunden, daß die DiskStation die erste Partition auf Sektor 31 gestartet hat.
Ich hab dann jedenfalls das Array aufgelöst, und die Platten nochmal von vorne bis hinten durchgeprüft, nichts. Vorsorglich noch den Idle-Timer aufs Maximum von 300 sec. gesetzt, und das RAID1 wieder neu aufgesetzt, diesmal mit einem Start-Sektor von 256. Und momentan läuft das RAID seit bisher 2 Wochen wieder.

(Mir fällt grad ein, so etwas ähnliches hatte ich mit meinen 2 SSDs am PERC übrigens auch: alle paar Wochen ist beim Runterfahren, oder Starten des Rechners eine der beiden SSDs aus dem RAID0 geflogen. "Import Foreign Config", und danach liefs wieder :fresse:)

Was ich damit sagen will, vielleicht setzt der PERC die Start-Sektoren auch irgendwie "merkwürdig", und die Platten kommen damit nicht zurecht. Ob/wie man das aber überprüfen oder ändern könnte, weiß ich allerdings auch nicht. :(
 
@DerRob: Nein, sind stinknormale HDDs des Typs HD154UI.

@Schlingel_INV: Momentan gehe ich auch von einem Kabeldefekt aus. Rebuild geht wesentlich schneller, momentan stockt es etwas, da ich Daten vom RAID runterkopiere.

Mit den 5h kommts nicht so recht hin.. Habe nun nach 3h 25%. Vllt hat das ganze Kabel einen weg, werde morgen mal ein neues kaufen.

So, habe mir nun 2 neue SAS->SATA Kabel bestellt. Da habe ich erstmal noch einen auf Reserve, falls mal wieder was ist.
 
Zuletzt bearbeitet:
So, 80% und wieder Rebuild abgebrochen.... Selber Fehler wie immer, wie im Log oben. Ich krieg hier echt die Krise.

Bei Anschluss 0 und 3 kam der Fehler, 1 und 2 sind auch mit HDDs belegt, dort wird aber nichts angemeckert. Deshalb wohl doch kein Kabelfehler, denke ich.

Tja, was bleibt noch übrig? Dass die neue HDD ebenfalls defekt ist? Werde morgen mal die nächste probieren, ansonsten habe ich echt keine Ahnung mehr.


edit: Was mir noch einfällt, dass es vielleicht Fehler auf den Platten gibt, denn der letzte Consistency Check lief vor einem Monat.. Und deshalb kann er das Array nicht rebuilden?

edit2: So, Ende im Gelände. Werde nun ein 2. 1:1 Backup ziehen und dann alles neu anlegen. Kein Nerv mehr, mich mit dem Scheiß hier rumzuschlagen.
 
Zuletzt bearbeitet:
Würde an deiner Stelle aber eventuell das mit den Kabeln noch etwas im Auge behalten.
Das RAM Modul könnte man auch nochmal tauschen und per memtest auf Fehler prüfen.. wer weiß :>
 
Status
Für weitere Antworten geschlossen.
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh