Absturz mit RAID5 / SUSE 11.4

G

Gwador

Grünschnabel
Hallo zusammen,

bei mir tritt ein seltsames Problem auf:

Ich betreibe ein Softraid (per md) aus 4 1TB-Platten.
Das ganze funktioniert soweit.
Versuche ich größere Datenmengen "in einem Zug" zu speichern, z. B. ein Backup eines anderen Rechners per rsync, crasht der Rechner.

Das Ganze ist mit einiger Sicherheit nicht hardwareabhängig, da ich zwei Systeme mit völlig unterschiedlicher Hardware betreibe:

System 1 (Server)
Gigabyte Board mit AMD 970 Chipset und Phenom X6, 8 GB RAM, SUSE 11.4-64bit, 4 x WD 1TB Caviar Blue, SATA3

System 2 (Backup)
Supermicro Board, Intel Chipset, Atom-Prozessor, 2 GB RAM, SUSE 11.4-32bit 2 x 1TB Hitachi, 2 x 1 TB Samsung

Der Server crasht in einen kompletten Reboot, das Backupsystem bleibt so komplett hängen, dass nur noch Netzstecker ziehen hilft.

Die Systeme sind so unterschiedlich wie sie nur sein könnten, bei beiden tritt das Problem beim Schreiben großer Datenmengen auf die RAID5-Partition (ca 2,6 TB) auf.

Beide Systeme nutzen Standard-IDE, das RAID wird komplett über den Linux-internen RAID softwäremäßig abgewickelt.

In dem Server hatte ich vorher 2x1TB + 2x500GB, jeweils als RAID1, das lief ohne Probleme.

Hat jemand eine idee?

Gwador
 
Hallo

Naja, SW-Raid5, ich kenne aus anderen Foren einige Leute, denen kommt SW-Raid5 nicht auf ihre Rechner, macht nur Probleme.

mfg
schwedenmann
 
post die Ausgabe von "cat /proc/mdstat" und was im systemlog steht vor dem Absturz

Ich hatte auch lange eis sw raid 5 bis das netzteil ex gegangen ist und alle drei platten auf einmal mit sich gerissen hat.
 
passiert der Absturz auch, wenn Du Lokal eine große Datei (z.B. per dd) auf das Raid schreibst?

beobachte doch mal per top oder einem anderen, evtl. sogar Logs schreibenden Monitor das System während des Kopierens - vor allem die Hauptspeicher- und SWAP-Auslastung.
 
@ marce
ja, auch beim lokalen Kopieren.
Ich hatte die Netzwerkkarten auch in Verdacht, aber die Maschine hat insgesamt 3, eine OnBoard und zwei zugesteckte mit einem anderen Treiber.
Der Fehler tritt sowohl bei lokaler Kopie als auch über alle Netzkarten auf.
Hauptspeicher ist nur teilweise ausgelastet, Swap taucht praktisch nicht auf (8GB RAM).

@ marcellus

mdstat:
Personalities : [raid0] [raid1] [raid10] [raid6] [raid5] [raid4]
md3 : active raid1 sdd1[0] sdc1[1]
304116 blocks super 1.0 [2/2] [UU]
bitmap: 0/1 pages [0KB], 65536KB chunk

md2 : active raid1 sda1[0] sdb1[1]
304116 blocks super 1.0 [2/2] [UU]
bitmap: 0/1 pages [0KB], 65536KB chunk

md1 : active raid5 sda4[0] sdc4[4] sdd4[2] sdb4[1]
2736776448 blocks super 1.0 level 5, 128k chunk, algorithm 2 [4/4] [UUUU]
bitmap: 0/7 pages [0KB], 65536KB chunk

md0 : active raid5 sda2[0] sdc2[4] sdd2[2] sdb2[1]
110100096 blocks super 1.0 level 5, 128k chunk, algorithm 2 [4/4] [UUUU]
bitmap: 1/1 pages [4KB], 65536KB chunk

unused devices: <none>

In den Systemlogs (messages, warn) steht keinerlei erkennbarer Hinweis, kein bestimmtes Programm, das startet oder ähnlich.
Und es steht auch jedes mal was anderes, so dass eine Zuordnung an irgend ein Event im System kaum geht.

Ich werd den großen Server mal auf RAID1 umkonfen und sehen, was er dann macht.
Evtl. lasse ich über Nacht dann Memtest laufen, aber das eine alte, lange gelaufene Maschine und eine neue gleichzeitig Memoryfehler haben, ist eher wenig wahrscheinlich.
 
So, eindeutig: Der RAID5-Teil des md ist offenbar nicht sauber.

Ich hab die RAID5-Partitionen aufgelöst und in RAID10 umgebaut (Striping + Mirroring). das kommt fühlbar der Geschwindigkeit zu Gute.

Über Nacht hab ich etwa 500 GB Daten vom Backup zurückgeschrieben. Dieser Vorgang hat mit RAID5 5 - 6 Totalabstürze produziert, mit RAID10 keinen einzigen.

Das Ergebnis ist bedauerlich, denn dadurch geht doch einiges an nutzbarer Plattenkapazität verloren.

Gibt es einen einigermaßen bezahlbaren Hardware-RAID-Controller?
 
Hallo

Gibt es einen einigermaßen bezahlbaren Hardware-RAID-Controller?

Was heißt das in Euronen.

Du bekommst teilweise schon für 80-100€ gebrauchte 4Kanal Escalde Contrioller.

mfg
schwedenmann
 
hallo schwedenmann,

naja, ich hab schon mal mit den Intel/LSI oder 3ware geliebäugelt, SAS/SATA-Controller. Beides wohl gute Teile, die 3ware setzen wir hier teilw. dienstlich ein.

Aber bei Preisen von 300 bis weit über 1000 EUR muss ich denn doch trocken schlucken, für einen privaten Hobbybetrieb wird das reichlich teuer.
 
Hallo

Ist schon klar, bei Neuware, raid hat eben seinen Preis, aber es gibt durchaus auch bezahlbare Gebrauchtangebote, zwar nicht unbedingt bei ebay, aber z.B. auf der newsgroup de.markt.comp.hardware.cpu+mainboard, oder .de.markt.comp.hardware.misc . Dort werden zwar nicht jeden Tag Raid-Controler angeboten, aber die newsgroups sind m.M. nach sehr gut und die Leute da kompetent.

mfg
schwedenmann
 

Ähnliche Themen

Suse Linux 11.4 hängt sich auf

SATA RAID Controller 3Ware / LSI / Adaptec

Laptop wird unter SuSe super heiß und stürzt regelm. ab

Server einrichten

Raid 0 (SATA mit Win XP) Suse 10 Bootprobleme

Zurück
Oben