LSI MegaRaid und Dell Perc5/i SAS/SATA PCIe [3]

Status
Für weitere Antworten geschlossen.
Wenn Du diese Anzeige nicht sehen willst, registriere Dich und/oder logge Dich ein.
Code:
Controller ID:  0   Unexpected sense:   PD  
    =   0:3 - Power on, reset, or bus device reset occurred,   CDB   =    0x2a  0x00  0x2b  0x57  0x72  0x00  0x00  0x01  0x00  0x00     ,   Sense   =    0x70  0x00  0x06  0x00  0x00  0x00  0x00  0x0a  0x00  0x00  0x00  0x00  0x29  0x00  0x00  0x00  0x00  0x00


Und danach ging die Action los... Eben noch schnell die 40GB Material von heute backuppen, dann neue HDD einlegen und Rebuild laufen lassen. Wieso der die alte HDD und nicht meine Hotspare fürs Rebuild genommen hat, ob ich was falsch konfiguriert habe?

edit:

Also der Ausfall von HDD3 kommt nicht aus heiterem Himmel. Ne Woche vorher hat der Perc diese HDD einfach als Offline markiert, nachdem ich diese wieder online markiert habe, lief es wieder. Nach der BGI jedoch hing das RAID immer mal wieder, WinRAR stockte usw.. Naja, da war wohl HDD3 die Schuldige. Morgen, wenn ich aus der Arbeit komme, sollte das RAID wieder rebuilded sein. Mal schauen. Ersatz HDDs sind schon bestellt, andere geht dann zu Samsung RMA. Meine erste Samsung HDD die ausfällt, nunja.
 
Zuletzt bearbeitet:
Nicht dass ich wüsste. Rödelt anfangs herum wie die anderen sechs auch, sonst ist mir nichts aufgefallen diesbezüglich.


Code:
ID = 2771
SEQUENCE NUMBER = 4643
TIME = 15-04-2010 17:29:20
LOCALIZED MESSAGE = Controller ID:  0   Unexpected sense:   PD       =   0:3 - Invalid field in CDB,   CDB   =    0x4d  0x00  0x4d  0x00  0x00  0x00  0x00  0x00  0x20  0x00     ,   Sense   =    0x70  0x00  0x05  0x00  0x00  0x00  0x00  0x0a  0x00  0x00  0x00  0x00  0x24  0x00  0x00  0x00  0x00  0x00 

ID = 2770
SEQUENCE NUMBER = 4642
TIME = 15-04-2010 17:29:03
LOCALIZED MESSAGE = Controller ID:  0   Patrol Read complete 

ID = 2769
SEQUENCE NUMBER = 4641
TIME = 15-04-2010 17:29:02
LOCALIZED MESSAGE = Controller ID:  0   State change:   PD       =   0:3  Previous   =   Offline      Current   =   Rebuild

ID = 2768
SEQUENCE NUMBER = 4640
TIME = 15-04-2010 17:29:02
LOCALIZED MESSAGE = Controller ID:  0   Rebuild automatically started:   PD       0:3

ID = 2767
SEQUENCE NUMBER = 4639
TIME = 15-04-2010 17:29:02
LOCALIZED MESSAGE = Controller ID:  0   State change:   PD       =   0:3  Previous   =   Unconfigured Good      Current   =   Offline

ID = 2766
SEQUENCE NUMBER = 4638
TIME = 15-04-2010 17:29:01
LOCALIZED MESSAGE = Controller ID:  0   State change:   PD       =   0:3  Previous   =   Unconfigured Bad      Current   =   Unconfigured Good

ID = 2765
SEQUENCE NUMBER = 4637
TIME = 15-04-2010 17:29:01
LOCALIZED MESSAGE = Controller ID:  0   Drive is not certified:       0:3

ID = 2764
SEQUENCE NUMBER = 4636
TIME = 15-04-2010 17:29:01
LOCALIZED MESSAGE = Controller ID:  0  Device inserted   Device Type:       Disk  Device Id:   0:3

ID = 2763
SEQUENCE NUMBER = 4635
TIME = 15-04-2010 17:29:01
LOCALIZED MESSAGE = Controller ID:  0   PD inserted:       0:3

ID = 2762
SEQUENCE NUMBER = 4634
TIME = 15-04-2010 17:28:24
LOCALIZED MESSAGE = Controller ID:  0   State change:   PD       =   0:3  Previous   =   Failed      Current   =   Unconfigured Bad

ID = 2761
SEQUENCE NUMBER = 4633
TIME = 15-04-2010 17:28:24
LOCALIZED MESSAGE = Controller ID:  0   State change:   PD       =   0:3  Previous   =   Online      Current   =   Failed

ID = 2760
SEQUENCE NUMBER = 4632
TIME = 15-04-2010 17:28:24
LOCALIZED MESSAGE = Controller ID:  0  VD is now DEGRADED   VD       0

ID = 2759
SEQUENCE NUMBER = 4631
TIME = 15-04-2010 17:28:24
LOCALIZED MESSAGE = Controller ID:  0   State change on VD:   0      Previous   =   Optimal  Current   =       Degraded

ID = 2758
SEQUENCE NUMBER = 4630
TIME = 15-04-2010 17:28:24
LOCALIZED MESSAGE = Controller ID:  0  Device removed   Device Type:       Disk  Device Id:   0:3

ID = 2757
SEQUENCE NUMBER = 4629
TIME = 15-04-2010 17:28:24
LOCALIZED MESSAGE = Controller ID:  0   PD removed:       0:3

ID = 2756
SEQUENCE NUMBER = 4627
TIME = 15-04-2010 17:28:06
LOCALIZED MESSAGE = Controller ID:  0   Unexpected sense:   PD       =   0:3 - Invalid field in CDB,   CDB   =    0x15  0x11  0x00  0x00  0x10  0x00     ,   Sense   =    0x70  0x00  0x05  0x00  0x00  0x00  0x00  0x0a  0x00  0x00  0x00  0x00  0x24  0x00  0x00  0x00  0x00  0x00 

ID = 2755
SEQUENCE NUMBER = 4626
TIME = 15-04-2010 17:28:06
LOCALIZED MESSAGE = Controller ID:  0   Unexpected sense:   PD       =   0:3 - Invalid field in CDB,   CDB   =    0x15  0x11  0x00  0x00  0x10  0x00     ,   Sense   =    0x70  0x00  0x05  0x00  0x00  0x00  0x00  0x0a  0x00  0x00  0x00  0x00  0x24  0x00  0x00  0x00  0x00  0x00 

ID = 2754
SEQUENCE NUMBER = 4625
TIME = 15-04-2010 17:28:03
LOCALIZED MESSAGE = Controller ID:  0   Unexpected sense:   PD       =   0:3 - Power on, reset, or bus device reset occurred,   CDB   =    0x2a  0x00  0x2b  0x57  0x72  0x00  0x00  0x01  0x00  0x00     ,   Sense   =    0x70  0x00  0x06  0x00  0x00  0x00  0x00  0x0a  0x00  0x00  0x00  0x00  0x29  0x00  0x00  0x00  0x00  0x00


Hier mal der komplette Log.

edit: Nach 12h 19% fertig gestellt. Wenn das RAID voll ist, wirds wohl 2 Wochen dauern, bis das Array rebuilded ist :fresse2:
 
Zuletzt bearbeitet:
Beim Rebuild macht es keinen Unterschied, ob das Array voll oder leer ist. Es würde genauso lange dauern. :) Die Dauer des Rebuilds hängt nur von d. Größe d. Arrays und der Performance der HDDs/Controllers ab.

Hast du mal mit Hutil getestet, ob die Hdd einen weg hat?
 
Zuletzt bearbeitet:
Noch nicht, aber hohe Anzahl an defekten Sektoren laut HDTune, ist schon rot markiert.
 
Hi,

mein Server ist soweit fertig und mein Perc bereit zum einrichten.

Dazu hätte ich jetzt noch ein paar Fragen an die Profis hier.



Kann mich da mal jmd aufklären was dike besten einstellungen sind bzw. was welche einstellung bewirkt?


Mit dieser Einstellung kann ich auch nicht wirklich viel anfangen:





Ich hatte mal testweise ein Raid erstellt und mit HDTune getestet. Hatte ab und zu beim testen dann nen Einbruch. Muß ich mir da gedanken machen?



Danke schonmal für alle Tipps und Tricks

MfG Tobi
 
@ drpaddo
Einstellungen sehen gut aus, eventuell eine größere stripe-size.
Hab bei meinem Array 256kb genommen, da die Daten auf absehbare Zeit eh immer größer als kleiner werden. 128kb ist da so ein Mittelweg, 64kb würd ich nur für System RAIDs einsetzen.
Ich hab Adaptive Read Ahead gewählt, also vorrausschauendes lesen .. kann man sich drüber streiten ob es was bringt. Die meisten lassen es aber "aktiviert".

Patrol Read würde ich für die VD aktivieren, Einstellungen ansonsten auf Standard belassen.

ht tune unbedingt auf die neuste Version (4.01 Pro) aktualisieren.
Die alte kann nur bis ca 2TB messen, sieht man auch gut an den Zugriffszeiten.
Die neue Version misst dann korrekt über das ganze RAID Array.
Am besten eine richtig große Block-Size (8MB) wählen zum testen ;)
 
Danke erstmal für die Antwort. Ich will hier best. nicht rumnerven aber geht das auch genauer?
Is für mich Neuland. Das gepostete Bild sind die unveränderten Einstellungen.

1.Initialization State: Hier muß ich ja Full Ini. machen sonst kann ich das Array nicht nutzen oder?

2.Stripe Size: Array wird ein Datengrab also möglichst groß einstellen? Geht aber nicht auf 256 sondern nur auf 128???

3.Read policy: Hier hab ich keine Ahnung was die Einstellungen bewirken bzw. was die richtige ist.

4.Write policy: Da ich ne BBU betreibe wir wohl Write Back with BBU richtig sein?

5.I/O policy: hat das mit dem Speicher auf dem Controller zu tun?

6.Access policy: Ich glaube das verstehe sogar ich ;)

7.Disk Cache policy: Cache der HDD´s oder wat?



PATROL READ

Was bewirkt die Funktion? Welche Werte einstellen? Hier wäre ne genauere Erklärung nett.
So das wars erstmal. Ich hoffe hier habt genug Geduld um meine Anfängerfragen zu beantworten.

Schonmal 1000Dank dafür

MfG
 
So hatte ich es eingestellt,

raid24qdy.jpg
 
1. Full init = er "formatiert" sozusagen das ganze RAID bzw. schreibt überall Nullen rein. Fast init bedeutet dass du das Array direkt nutzen kannst, er initialisiert im Hintergrund weiter.

2. Stripe-Size wenn möglich 256KB ansonsten sind 128KB auch i.O.

3. Read Policy: Adaptive Read Ahead ist wie gesagt das "Vorrausschauende Lesen von Daten" ich habs aktiviert, andere schalten es ab. Bei SSD macht es z.B. nicht soo viel Sinn, weil die die Daten eh extrem schnell liefern können
Ratgeber: RAID-Controller optimal konfigurieren - Praxis-Tipps | Read Ahead und Adaptive Read Ahead | TecChannel.de

4. Klar wenn BBU vorhanden Write Back aktivieren.

5. Direct I/O nehmen, warum genau kann ich gerade nicht erklären :fresse: .. aber so machen es alle :)
direct IO or cache IO?

6. sollte klar sein ;)

7. http://support.dell.com/support/edocs/software/smiraid/ge/ug/HH383A00.pdf
unchanged oder aktiviert!

Patrol Read guckt in regelmäßen Abständen ob das RAID noch i.O. ist
http://support.dell.com/support/edocs/software/smiraid/ge/ug/HH383A00.pdf
Steht hier auch nochmal drin, einfach die Einstellungen so belassen und den Haken für das RAID setzen fertig ;)
Continuous brauchste aber nicht!


btw: Das Handbuch von Dell wäre nicht sinnvoll für den ersten Post!
http://support.dell.com/support/edocs/software/smiraid/ge/ug/HH383A00.pdf
 
Zuletzt bearbeitet:
Aehm, HILFE !???



---------- Beitrag hinzugefügt um 01:55 ---------- Vorheriger Beitrag war um 01:44 ----------

Es kommen noch mehr.....



Da wird jawohl eine Platte das Zeitliche gesegnet haben.....

Woher weiß ich den welche !?



Ich fahre die Karre am besten runter und warte ab was ihr dazu sagt.
 
Zuletzt bearbeitet:
So Leute, vergeßt bitte mal den Mist den Hdtune 2,55 da anzeigt, und besorgt euch mal das 4.01 da es in der Lage ist über die gesamte Kapazität zu messen, da sieht mit der Zugriffszeit dann ehr schlecht aus. Da sollte beim Raid-0 nicht anders sein.


raid5dx01.jpg


Windows Vista 64 verdoppelt quasi die Messwerte, habe weder mit der Pro Version noch unter Vista 32 mit dem 2,55er so hohe Werte die bis an 300MB/Sec gehen, unter Vista 64 jedoch schon, und mit der Zugriffszeit habe ich richtig vermutet. Gemessen auf das ganze Feld siehts realistischer aus.

@DonGeilo,

Ich würde den PC ausmachen, den Controller ausbauen und mit einem Herstellertool am On-Board Controller die Platten alle prüfen, eine davon wird jedenfalls defekt sein.

Die Intel Firmware habe ich mal aufgespielt, es ist aber wie ich festgestellt habe die gleiche wie die von LSI betreffend der 74er. Es gibt keinen Unterschied, bis auf das man Warmboot-Problem wieder hat und der Controller nicht gefunden wird, also die 51er wieder rauf. Also spielt es lediglich eine Rolle ob Dell FW oder LSI FW verwendet wird.
------------------------------------------------------------------------------------------------------------------
Des letzteren meldet man mir in den Eigenschaften das der Controller "NCQ" kann ich dachte das kann er nicht ?

xyz7hba.jpg
 
Zuletzt bearbeitet:


Welche Platten Nummer soll das den sein !? Ich kann das nicht ersehen !? Habe 0 bis 3 angesteckt.

---------- Beitrag hinzugefügt um 10:23 ---------- Vorheriger Beitrag war um 10:22 ----------

Er schmeißt ja Nr.0 und 1 raus.
 
er fängt bei 0 an und geght bei vollbestückung auf 7 hoch. sprich wenn 0 nen fehler bringt isset HDD1 am anschluss 1 etc.

wenn die platte gedroppt wird scheits was schlimmeres zu sein. normal schreibt er dann aber unten auch rein "logging stopped cause too many erros" o.ä.

was helfen könnte wäre ein volständiges init und danach eine vollständige langsame formatierung. es könnte sich um schwebende sektoren handeln die erst nach einem schreibzugriff behoben werden. das kommt ja scheinbar bei den WD Green und Samsungs mittlerweile häufiger vor


zu der samsung oben mit roten sektoren: die würd ich unter keinen umständen wieder einbinden. selbst nen R5 im R0-status ist da quasi sicherer.

ansonsten: ich halte von samsung ja nix. die dinger laufen meist laut aussage der user. oberflächenfehler die ja sehr gerne bei den dinger nach ca. nem jahr auftreten bemerkt der normale user ja nedd ;) ich will nedd wissen wieviele fehlerhafte HDDs immer noch als i.O angesehen werden. des weiteren würd ich bei großen kapazitäten dann vielleicht doch über TLER nachdenken... auch wenns deutlich mehr kostet

@€dit: um den anschluss rauszufinden würd ich mal bei "physical" guggen. dann schauen welches backend und schon hast die problematische hdd schnell gefunden. so wie es aussieht sinds scheinbar die disks an anschluss 1 und 2 des controllers.
 
Zuletzt bearbeitet:
Jaja Samsung HDDs.. In meiner rappelt irgendwas, als ob da was lose wäre in der HDD :fresse:

Macht ihr eigentlich monatlich den Consistency Check?
 
so wie es aussieht sinds scheinbar die disks an anschluss 1 und 2 des controllers.


Das wollte ich wissen....
Wodran hast du gesehen welches Device das war !?



Ich habe jetzt nochma die Verkabelung getestet, es stecke ein Kabel nicht richtig und neu gestartet.

Device 0 wird auch nach nem Neustart nicht richtig erkannt.


Das Raid läuft jetzt ohne das LW sobald ich das wieder dazu schalten will gibt es die Meldungen "Unexspected Sense"

Soll ich das Device jetzt raus nehmen und mal am Onboard testen !??

Woher weiß ich das nicht noch eine Platte im Anus ist !? Ich wundere mich nur warum er halt immer 2 raus gehauen hat....


Ich habe noch eine 1TB Platte hier (ist allerdings eine ganz andere als die benutzen.), soll ich sonst erst mal Device 0 abnehmen und nen Rebuild machen !??
 
Zuletzt bearbeitet:
wenn nur eine disk im array fehlt (normal müsste dann da degraded und nicht offline stehen!? failed stand bei der alten version die ich nutze dort, wenn zwei disks gedroppt wurden) wäre das ne option. ich würde dir raten erstmal alle disks einzeln mit dem herstellertool im "extended test" (o.ä.), welcher auch die platten auch einmal komplett überschreibt zu überprüfen. danach die smart-werte anguggen und erst danach das R5 aufsetzen
 


---------- Beitrag hinzugefügt um 10:56 ---------- Vorheriger Beitrag war um 10:55 ----------

wenn nur eine disk im array fehlt (normal müsste dann da degraded und nicht offline stehen!? failed stand bei der alten version die ich nutze dort, wenn zwei disks gedroppt wurden) wäre das ne option. ich würde dir raten erstmal alle disks einzeln mit dem herstellertool im "extended test" (o.ä.), welcher auch die platten auch einmal komplett überschreibt zu überprüfen. danach die smart-werte anguggen und erst danach das R5 aufsetzen

Überschreiben ist keine möglichkeit, ich habe kein Backup von den Kompletten 3TB...

und ewig offline kann das Raid eigentlich auch nicht bleiben....
 
Zuletzt bearbeitet:
ohne jetzt viel zu schreiben: dir ist bewusst, dass ich in deinem fall nicht ruhig schlafen könnte? :fresse:

Witzbold, ich werde das RAID JETZT Offline nehmen und dann Platte 0 an einem anderen Rechner Testen.......

Was bleibt mir anderes übrig !? Ich kann keine 3TB auslagern.

Wenn eine Platte Defekt ist muss ich wohl meine übrige 1TB Platte anschließen, ich weiß nur nicht ob da nicht noch mehr Defekt sind weil er immer was von "PD = 0" und "PD = 1" redet und mir hier ja keiner sagt wie aus dem Log herraus lesen kann welchen Anschluss er meint.
 
Anstatt hier dumme Sprüche zu bringen könnt ihr mir ja sagen was ich machen soll, ich sag ja nur Löschen geht nicht......... :fire:
 
Witzbold, ich werde das RAID JETZT Offline nehmen und dann Platte 0 an einem anderen Rechner Testen.......

Was bleibt mir anderes übrig !? Ich kann keine 3TB auslagern.

Wenn eine Platte Defekt ist muss ich wohl meine übrige 1TB Platte anschließen, ich weiß nur nicht ob da nicht noch mehr Defekt sind weil er immer was von "PD = 0" und "PD = 1" redet und mir hier ja keiner sagt wie aus dem Log herraus lesen kann welchen Anschluss er meint.

Du bist auch ein Witzbold, es wurde doch schon gesagt das bei Platte "0" im Manager dann isses am Kabel, wenn nummeriert von "1-4", die Platte am Kabel mit der "1".
Was ist denn daran so schwer?

Ich weiß am Anfang mit Raid ist alles neu und viel auf einmal. Ist blöd wenn dann auch noch so ein Problem auftritt
 
Zuletzt bearbeitet:
Wodran seht ihr den verdammt nochmal das es Platte NULL laut Manager sein soll..... ich will doch nur verstehen wie ich die Fehler zu Meldungen zu Interpretieren habe......
 
Das Bild von dir ein paar Posts weiter oben ist dein Status?

Da ist das Raid ja schon Offline und 2 Platten (Slot 0 + Slot 1) fehlen da :eek:
a bisserl viel für Raid5. Also ob du da noch an die Daten ran kommst ist fraglich? (optimistisch ausgedrückt)
 
Zuletzt bearbeitet:
Ich checke Device 0 jetzt an einem anderen Rechner mit dem Samsung ESTOOL...... Hier kommt auch eins zum anderen, mein Test Rechner will irgendwie nicht habe jetzt den HTPC meines Vaters dafür missbraucht..... Echt ätzend alles, sorry falls ich hier jemanden angefahren habe....
 
hier nochmal die stellen an denen du siehst dass es sich um die HDD am port 1 handelt:



und: hatte ich doch richtig geguggt: nen VD mit ca 2,7TB und ~1TB je HDD spricht stark dafür, dass du ingesamt 4x1TB@R5 laufen hattest. da nur noch zwei als normal angezeigt werden und das array als offline angezeigt wird, ist zu 99,9% davon auszugehen, dass deine daten eh fricke sind. sie werden zwar noch angezeigt und du kannst aufs LW u.U. noch zurgreifen. sobald du aber mal auf die inhalte zugreifst ists essig. kannst es ja mal mit nem .rar oder so testen. ich glaub nicht dass die daten okay sind. sprich: aktueller status = R5 offline = Daten fricke/futsch

die einzige möglichkeit noch was zu retten besteht vielleicht darin die unten aufgelistete disk manuel mittels "replace missing drive" wieder ins array zu packen. ob das funzt sei noch dahin gestellt.

@€dit: zum vergleich:



6x640GB@R5; Anschluss 7 und 8 sind nicht belegt
 
Zuletzt bearbeitet:
Status
Für weitere Antworten geschlossen.
Hardwareluxx setzt keine externen Werbe- und Tracking-Cookies ein. Auf unserer Webseite finden Sie nur noch Cookies nach berechtigtem Interesse (Art. 6 Abs. 1 Satz 1 lit. f DSGVO) oder eigene funktionelle Cookies. Durch die Nutzung unserer Webseite erklären Sie sich damit einverstanden, dass wir diese Cookies setzen. Mehr Informationen und Möglichkeiten zur Einstellung unserer Cookies finden Sie in unserer Datenschutzerklärung.


Zurück
Oben Unten refresh