Grundsätzliche Fragen zu Raid5

foexle

foexle

Kaiser
Hallo Leute,
ich habe noch keine Erfahrung mit Raid deswegen benötige ich Erfahrungsberichte aus 1. Hand.

Folgene Problemstelleung:
Bei einem meiner Server, ist gestern ein komisches Verhalten aufgetreten. Zuerst hat sich ein vserver verabschiedet, der nicht mehr hochgefahren ist, da etwas mit der Image nicht mehr gestimmt hat, Einträge einzelner oder, bzw ganze Ordner strukturen sind verschwunden (mit ls nicht mehr sichtbar) mit cd /ordern aber noch erreichbar.
Danach hat sich das weiter ausgebreitet auf die Dom0. Auf einmal war ls /etc komplett leer, allerdings konnte ich ohne Probleme mit cd /etc/init.d noch rein und da waren auch dateien drin. Das gipfelte dann soweit, das auch /usr/bin nicht mehr sichbar war und auch keine Programme mehr vorhanden waren.
Also dachte ich an einen hardwaredefekt einer der Platten.
Das System habe ich noch nicht rebootet, da noch Teile des Systems funktionieren, wie die anderen vServer und Firewall etc.. Dort sind kunden drauf, deswegen habe ich noch keinen neustart gewagt

Auf dem Server läuft ein Hardware-Raid 5 mit 5 Platten.

Nun habe ich dazu ein paar Fragen:
- Hört sich das für euch nach einem Hardwaredefekt an?
- Wenn die Platte getauscht wird, initiiert der Hardwarecontroller selbst die synchronisierung, oder muss ich das anstossen ?
- Wenn ich das anstossen muss, wie ? Hat da jeder Hersteller seine eigenen Tools oder gibt es da was schon bei Linux im repo
- Muss ich mit Datenverlust rechnen ? oder wird der Raid greifen und die Daten wieder herstellen als ob nichts gewesen währe ?

Das System ist ein Ubuntu 8.0.4 LTS

Hoffe auf brauchbare Antworten und Gruß

Heiko
 
- Hört sich das für euch nach einem Hardwaredefekt an?
für mich hört sich das eher nach einem Dateisystemproblem an
- Wenn die Platte getauscht wird, initiiert der Hardwarecontroller selbst die synchronisierung, oder muss ich das anstossen ?
Das kommt auf den Controller an soweit ich weis... es sollte aber eigentlich von selbst los gehen.

- Wenn ich das anstossen muss, wie ? Hat da jeder Hersteller seine eigenen Tools oder gibt es da was schon bei Linux im repo
entweder aus dem Controller-BIOS heraus oder mit den Hersteller-Tools

- Muss ich mit Datenverlust rechnen ? oder wird der Raid greifen und die Daten wieder herstellen als ob nichts gewesen währe ?
Wenn eine Platte im Eimer ist -> kein Datenverlust
Wenn mehr als eine Platte hin ist -> Datenverlust
Wenn es das FS ist dann sichert das Raid das sowieso nicht ab.

Gruß
Psyjo
 
ok angenommen es ist das Filesystem, wie gehe ich da am besten vor, das ich so wenig wie möglich Datenverlust habe ? Ich weis das fsck das macht, aber das zerstört auch viel oder ?

Gruß
 
Schau am besten erstmal nach ob das Array überhaupt als DEGRADED markiert ist. Wenn das der Fall ist dann ist die Platte zu tauschen. Wenn nicht, kannst du nur einen fsck machen und hoffen das keine Daten kaputt gehen.

Psyjo
 
ok danke ... sry für die dumme frage (aber wie schon erwähnt habe ich absolut keine erfahrung damit) wie schaue ich nach ob das raid iO ist
 
Bei 3Ware steht dann da das du alt+3 drucken musst um in das BIOS zu kommen. Müsste quasi beim booten zu sehen sein. Andernfalls müssten die Herstellertools auch diese Infos ausspucken können.

Psyjo
 
ok ... bootvorgang sehe ich nicht ... dann muss ich nach den tools schauen ... dank dir für die hilfe !
 
Hi,
wenn man über (potentielle) Hardwareprobleme faselt, dann sollte man diese Hardware auch so exakt wie möglich beschreiben, also Hersteller, Typenbezeichnung, Treiber, Firmwareversion .... und nicht nur das RAID, sondern auch den Server. So bringt das doch nix.
Bye,
yai.
 
sry das stimmt natürlich :)

also ich bin atm soweit das ich einen fsck durchlaufen liess, nun bin ich am datensichern die noch da sind.
Allerdings würde ich gerne überprüfen ob das Raid läuft, allerdings suche ich nun schon seit 2 h im Netz und finde nichts, evtl. weil ich auch nach dem falschen suche.
Also das ist der Raidcontroller.

Symbios Logic MegaRAID SAS Verde ZCR

Ich habe keinen Zugriff auf den Server, sodass ich den bootvorgang beobachten könnte.

Könnte mir evtl wer sagen nach was ich genau suchen muss, das ich solch einen check ausführen kann ? Oder mir einen anderen Tip geben?


greetz
 
Wenn die Kiste gehostet ist lass dir ne KVM anschließen, damit kannst du den Bootvorgang betrachten. Evtl. hilft auch ein memtest. Noch eine Vermutung: RAM des Controllers.

Wie die Software für den Controller heißt weis ich auch nicht

Gruß
Psyjo
 
Zurück
Oben