Absturz mit RAID5 / SUSE 11.4

Dieses Thema im Forum "SuSE / OpenSuSE" wurde erstellt von Gwador, 06.09.2011.

  1. Gwador

    Gwador Grünschnabel

    Dabei seit:
    06.09.2011
    Beiträge:
    4
    Zustimmungen:
    0
    Hallo zusammen,

    bei mir tritt ein seltsames Problem auf:

    Ich betreibe ein Softraid (per md) aus 4 1TB-Platten.
    Das ganze funktioniert soweit.
    Versuche ich größere Datenmengen "in einem Zug" zu speichern, z. B. ein Backup eines anderen Rechners per rsync, crasht der Rechner.

    Das Ganze ist mit einiger Sicherheit nicht hardwareabhängig, da ich zwei Systeme mit völlig unterschiedlicher Hardware betreibe:

    System 1 (Server)
    Gigabyte Board mit AMD 970 Chipset und Phenom X6, 8 GB RAM, SUSE 11.4-64bit, 4 x WD 1TB Caviar Blue, SATA3

    System 2 (Backup)
    Supermicro Board, Intel Chipset, Atom-Prozessor, 2 GB RAM, SUSE 11.4-32bit 2 x 1TB Hitachi, 2 x 1 TB Samsung

    Der Server crasht in einen kompletten Reboot, das Backupsystem bleibt so komplett hängen, dass nur noch Netzstecker ziehen hilft.

    Die Systeme sind so unterschiedlich wie sie nur sein könnten, bei beiden tritt das Problem beim Schreiben großer Datenmengen auf die RAID5-Partition (ca 2,6 TB) auf.

    Beide Systeme nutzen Standard-IDE, das RAID wird komplett über den Linux-internen RAID softwäremäßig abgewickelt.

    In dem Server hatte ich vorher 2x1TB + 2x500GB, jeweils als RAID1, das lief ohne Probleme.

    Hat jemand eine idee?

    Gwador
     
  2. Anzeige

    Schau dir mal diese Kategorie an. Dort findest du bestimmt etwas.
    Registrieren bzw. einloggen, um diese und auch andere Anzeigen zu deaktivieren
  3. #2 schwedenmann, 06.09.2011
    schwedenmann

    schwedenmann Foren Gott

    Dabei seit:
    18.11.2003
    Beiträge:
    2.635
    Zustimmungen:
    2
    Ort:
    Wegberg
    Hallo

    Naja, SW-Raid5, ich kenne aus anderen Foren einige Leute, denen kommt SW-Raid5 nicht auf ihre Rechner, macht nur Probleme.

    mfg
    schwedenmann
     
  4. #3 marcellus, 07.09.2011
    marcellus

    marcellus Kaiser

    Dabei seit:
    09.05.2007
    Beiträge:
    1.392
    Zustimmungen:
    0
    post die Ausgabe von "cat /proc/mdstat" und was im systemlog steht vor dem Absturz

    Ich hatte auch lange eis sw raid 5 bis das netzteil ex gegangen ist und alle drei platten auf einmal mit sich gerissen hat.
     
  5. marce

    marce Kaiser

    Dabei seit:
    01.08.2007
    Beiträge:
    1.053
    Zustimmungen:
    8
    passiert der Absturz auch, wenn Du Lokal eine große Datei (z.B. per dd) auf das Raid schreibst?

    beobachte doch mal per top oder einem anderen, evtl. sogar Logs schreibenden Monitor das System während des Kopierens - vor allem die Hauptspeicher- und SWAP-Auslastung.
     
  6. Gwador

    Gwador Grünschnabel

    Dabei seit:
    06.09.2011
    Beiträge:
    4
    Zustimmungen:
    0
    @ marce
    ja, auch beim lokalen Kopieren.
    Ich hatte die Netzwerkkarten auch in Verdacht, aber die Maschine hat insgesamt 3, eine OnBoard und zwei zugesteckte mit einem anderen Treiber.
    Der Fehler tritt sowohl bei lokaler Kopie als auch über alle Netzkarten auf.
    Hauptspeicher ist nur teilweise ausgelastet, Swap taucht praktisch nicht auf (8GB RAM).

    @ marcellus

    mdstat:
    Personalities : [raid0] [raid1] [raid10] [raid6] [raid5] [raid4]
    md3 : active raid1 sdd1[0] sdc1[1]
    304116 blocks super 1.0 [2/2] [UU]
    bitmap: 0/1 pages [0KB], 65536KB chunk

    md2 : active raid1 sda1[0] sdb1[1]
    304116 blocks super 1.0 [2/2] [UU]
    bitmap: 0/1 pages [0KB], 65536KB chunk

    md1 : active raid5 sda4[0] sdc4[4] sdd4[2] sdb4[1]
    2736776448 blocks super 1.0 level 5, 128k chunk, algorithm 2 [4/4] [UUUU]
    bitmap: 0/7 pages [0KB], 65536KB chunk

    md0 : active raid5 sda2[0] sdc2[4] sdd2[2] sdb2[1]
    110100096 blocks super 1.0 level 5, 128k chunk, algorithm 2 [4/4] [UUUU]
    bitmap: 1/1 pages [4KB], 65536KB chunk

    unused devices: <none>

    In den Systemlogs (messages, warn) steht keinerlei erkennbarer Hinweis, kein bestimmtes Programm, das startet oder ähnlich.
    Und es steht auch jedes mal was anderes, so dass eine Zuordnung an irgend ein Event im System kaum geht.

    Ich werd den großen Server mal auf RAID1 umkonfen und sehen, was er dann macht.
    Evtl. lasse ich über Nacht dann Memtest laufen, aber das eine alte, lange gelaufene Maschine und eine neue gleichzeitig Memoryfehler haben, ist eher wenig wahrscheinlich.
     
  7. Gwador

    Gwador Grünschnabel

    Dabei seit:
    06.09.2011
    Beiträge:
    4
    Zustimmungen:
    0
    So, eindeutig: Der RAID5-Teil des md ist offenbar nicht sauber.

    Ich hab die RAID5-Partitionen aufgelöst und in RAID10 umgebaut (Striping + Mirroring). das kommt fühlbar der Geschwindigkeit zu Gute.

    Über Nacht hab ich etwa 500 GB Daten vom Backup zurückgeschrieben. Dieser Vorgang hat mit RAID5 5 - 6 Totalabstürze produziert, mit RAID10 keinen einzigen.

    Das Ergebnis ist bedauerlich, denn dadurch geht doch einiges an nutzbarer Plattenkapazität verloren.

    Gibt es einen einigermaßen bezahlbaren Hardware-RAID-Controller?
     
  8. #7 schwedenmann, 08.09.2011
    schwedenmann

    schwedenmann Foren Gott

    Dabei seit:
    18.11.2003
    Beiträge:
    2.635
    Zustimmungen:
    2
    Ort:
    Wegberg
    Hallo

    Was heißt das in Euronen.

    Du bekommst teilweise schon für 80-100€ gebrauchte 4Kanal Escalde Contrioller.

    mfg
    schwedenmann
     
  9. Anzeige

    Vielleicht findest du HIER Antworten.
    Registrieren bzw. einloggen, um diese und auch andere Anzeigen zu deaktivieren
  10. Gwador

    Gwador Grünschnabel

    Dabei seit:
    06.09.2011
    Beiträge:
    4
    Zustimmungen:
    0
    hallo schwedenmann,

    naja, ich hab schon mal mit den Intel/LSI oder 3ware geliebäugelt, SAS/SATA-Controller. Beides wohl gute Teile, die 3ware setzen wir hier teilw. dienstlich ein.

    Aber bei Preisen von 300 bis weit über 1000 EUR muss ich denn doch trocken schlucken, für einen privaten Hobbybetrieb wird das reichlich teuer.
     
  11. #9 schwedenmann, 09.09.2011
    schwedenmann

    schwedenmann Foren Gott

    Dabei seit:
    18.11.2003
    Beiträge:
    2.635
    Zustimmungen:
    2
    Ort:
    Wegberg
    Hallo

    Ist schon klar, bei Neuware, raid hat eben seinen Preis, aber es gibt durchaus auch bezahlbare Gebrauchtangebote, zwar nicht unbedingt bei ebay, aber z.B. auf der newsgroup de.markt.comp.hardware.cpu+mainboard, oder .de.markt.comp.hardware.misc . Dort werden zwar nicht jeden Tag Raid-Controler angeboten, aber die newsgroups sind m.M. nach sehr gut und die Leute da kompetent.

    mfg
    schwedenmann
     
Thema:

Absturz mit RAID5 / SUSE 11.4

Die Seite wird geladen...

Absturz mit RAID5 / SUSE 11.4 - Ähnliche Themen

  1. Kernel: Abstürze als QR-Code

    Kernel: Abstürze als QR-Code: Eine interessante - aber nicht neue - Idee stellte Teodora Baluta auf der LKML vor. Demnach soll der Kernel seine Abstürze, genannt auch Oops,...
  2. Freezes Abstürze und bootcrashes

    Freezes Abstürze und bootcrashes: Hallo ihr lieben Leute Nach ewigem suchen in diversen Foren und anderen Hilfeseiten bin ich zum Schluss gekommen das mein problem offenbar ein...
  3. Mayhem: 1200 Abstürze in Debian »Wheezy«

    Mayhem: 1200 Abstürze in Debian »Wheezy«: Forscher der Carnegie Mellon Universität haben mittels einer Testsuite über 1200 Abstürze von Anwendungen in Debian entdeckt. Eine Liste der...
  4. Mysteriöser 11.4 Absturz - Maschine läuft, SSH und vor Ort Login unmöglich

    Mysteriöser 11.4 Absturz - Maschine läuft, SSH und vor Ort Login unmöglich: Hallo Linux Community, als Wiedereinsteiger habe ich als kleines Projekt einen Fileserver mit Samba aufgesetzt, der gleichzeitig als Apache und...
  5. thunderbird absturz nach klick

    thunderbird absturz nach klick: moin moin, kennst ihr das phänomen das wenn man im thunderbird ein klick macht, dieser dann abstürzt? mit der tastatur lässt er sich wie gewohnt...