Linux stuerzt ab - Festplatte defekt?

musiKk

musiKk

Dr. Strangelove
Hi,

zunaechst: Ich war mir jetzt nicht sicher, in welches Forum damit, wenn das falsch hier ist, bitte verschieben.

Und zwar ist mir eben das dritte Mal seit vielleicht einem Monat das System (Fedora Core 6) einfach abgestuerzt. Das aeussert sich darin, dass der Monitor in den Stand-By-Modus geht (als waere der Rechner aus) und ich nichts mehr machen kann. Laeuft gerade xmms, klingt es, als hoerte ich eine Schallplatte mit Sprung, die letzte halbe Sekunde wird kontinuierlich wiederholt. Es gibt keine Festplattenaktivitaet (Lampe leuchtet nicht).
Zum Zeitpunkt des Absturzes habe ich keine ungewoehnlichen Dinge getan, wie z. B. spezielle Programme ausgefuehrt oder aehnliches.

Im Log (/var/log/messages) gibt es keinen Eintrag zum fraglichen Zeitpunkt, allerdings gibt es folgende Meldung recht haeufig:
Code:
smartd[2802]: Device: /dev/hda, 1 Currently unreadable (pending) sectors
Diese Meldung erscheint ueber den Tag in Abstaenden zu exakt einer halben Stunde. Ich habe bisher allerdings noch keine Massnahmen getroffen, da ich keine wirklich sensiblen Daten auf der Platte habe.
Nun, dass das nicht gut klingt, ist mir klar. Ich habe vorhin auch den Drive Fitness Test laufen lassen, welcher nach sehr kurzer Zeit bei /dev/hda wegen fehlerhaften Sektoren abbrach.

Nun lautet eine Frage: Kann dies der Grund fuer den Totalabsturz sein? Es ist naemlich so, dass auf /dev/hda nur NTFS-Partitionen in read-only gemountet sind. Linux ist auf /dev/hdb (welche btw laut DFT komplett fehlerfrei ist).
Waere schoen, wenn vielleicht jemand was dazu sagen koennte, vielleicht kennt jemand so ein Problem ja. Sollten Angaben fehlen, liefere ich diese natuerlich nach.

PS: Unter Windows XP gab es das Problem nie, allerdings musste ich mal ein paar Tage nach der FC6-Installation XP booten und da wurden beim Start auch Fehler entdeckt.
 
Hm, da scheint die Festplatte doch wirklich über den Jordan zu gehen... was mich ein wenig wundert: wieso bricht der DFT bei Dir ab? Er müsste doch zumindest die Festplatte vollständig scannen können - jedenfalls würde ich bei solch gravierenden Symptomen davon ausgehen, dass sich die Fehler auch auf anderen Partitionen finden ließen. Deshalb für /hdb lieber nochmal einen langen scan machen, der Kurzscan findet nicht alles.
 
Zuletzt bearbeitet:
Der Kurzscan lief auch problemlos. Der lange hat gelesen bis 0x600000, ist dort eine Weile verweilt (da dachte ich schon, dass es Probleme gibt) und dann ausgestiegen. Ich glaube, Fehlercode war 0x70, die Hilfe dazu sagte halt, dass dort ein Fehler ist und dass ich doch "erase" ausfuehren solle, was ich natuerlich noch nicht getan habe; ein paar Daten werde ich noch auf die externe kopieren.
 
Hat er Dir denn außer dem kompletten Formatieren der Platte nix angeboten? Dann scheint es sich kaum noch um bad blocks oder ähnliches zu handeln (das ließe sich noch in den Griff bekommen), sondern um irgendwas an der Mechanik. Daten sichern, Garantie 'rauskramen, neue Festplatte einfordern (falls die Garantie noch läuft). Beim Neuformatieren dürftest Du diese Probs bald wieder haben.
 
Ich werde das morgen nochmal testen und mehr auf die Meldung achten. Platte duerfte auf jeden Fall schon aelter als 2 Jahre sein.

Mir gings vor allem eben auch darum, zu wissen, ob das auch wirklich der Grund fuer den Absturz sein kann. Wie gesagt: Der Fehler vom smartdaemon kommt exakt alle halbe Stunde, was ja dafuer spricht, dass auf den gleichen Bereich (ohne Erfolg) zugegriffen wird.
Auch, dass es keinen Eintrag im Log gibt, verwundert mich... weist ja sicher auf einen Hardware-Fehler hin.
 
Hallo
Möglicherweise liegt sogar ein Fehler am Controler an.
Ich hoffe es nicht für dich.
Was sagt denn hdparm zu den Geräten?

Gruß Wolfgang
 
Also. Habe jetzt beim DFT nochmal genauer auf die Fehlermeldung geachtet. Sinngemaess erscheint zuerst, dass Fehler auf der Platte entdeckt wurden. Es werden Corrupt Sector Repair oder Erase Disk empfohlen. Anbei:
Note: Corrupt Sector Repair will initialize all sectors DFT identifies as corrupted on the selected drive.
Erase Disk will delete all the data on the selected drive
Und direkt darunter steht dann, dass defekte Sektoren gefunden wurden und ich deshalb Erase Disk ausfuehren soll.

Neue Festplatten kosten ja nicht so viel Geld, das koennte ich verschmerzen; viel beunruhigender finde ich, was Wolfgang sagt. Nur bei den vielen Optionen, die hdparm anbietet, habe ich jetzt nichts gefunden, was mir den Controller prueft. Aber ich habe hier mal das ergebnis von -I hinterlegt. Ich weiss aber nicht, ob das das richtige ist.

mfg
mK
 
Note: Corrupt Sector Repair will initialize all sectors DFT identifies as corrupted on the selected drive.

Den 'Corrupt sector repair' würde ich doch mal probieren (dazu ist der DFT unter anderem ja da) - allerdings verstehe ich jetzt nicht so ganz ob Dir der DFT beide Optionen auch anwählbar bietet oder nur das 'erase disk'. Jedenfalls: Die Methode der Markierung korrupter Blöcke kostet dich vielleicht ein paar byte Festplattenplatz, aber lediglich von Sektoren, die ohnehin unbenutzbar sind. DFT kann also Deine Festplatte mit dieser Option nicht zusätzlich schädigen oder Daten löschen, die nicht ohnehin verloren sind.
 
Zuletzt bearbeitet:
Nachdem es nun vergangene Nacht wieder passiert ist und sich die Abstuerze zu haeufen scheinen, habe ich nun erstmal alles, was mit der hda zu tun hat, aus der fstab entfernt und werde dort auch erstmal nicht mehr drauf zugreifen. Fuer den Betrieb noetige Sachen sind da nicht drauf. Wenn ich mir sicher bin, alles wichtige von den 200GB gesichert zu haben, werde ich auch Corrupt Sector Repair durchfuehren, weil ich trau dem trotzdem nicht hundertprozentig.

Koennte noch jemand was zu hdparm sagen? Also im Bezug auf Wolfgangs Aussage.

mfg
mK
 
Uhm. Inzwischen kommen die Abstuerze wohl jeden Tag. Laut dem smartd gibts angeblich inzwischen auch Sektorprobleme bei hdb. Nun draengt sich mir der Verdacht auf, dass ich generell hier bei FC6 was falsch gemacht hab, da jahrelang unter Windows alles glatt lief und die Probleme mit Linux beginnen. Es ist mir klar, dass keiner hier eine Glaskugel hat, allerdings habe ich ueberhaupt keine Ahnung wo und wie ich ueberhaupt nur anfangen koennte, nach moeglichen Ursachen zu suchen.
 
Wie gesagt: probiere wenigstens mal, die von DFT als fehlerhaft gemeldete Sektoren markieren zu lassen - diese sind ohnehin nicht mehr brauchbar, sondern halten das System bei jedem Leseversuch nur auf. Ich hatte mal eine zeitlang minutenlange Freezes begleitet von ziemlich beeindruckende Schleifgeräuschen meiner Festplatte - zwei oder drei lange Testläufe mit dem DFT mit jeweils anschließendem Markieren haben das Problem nachhaltig (bis heute) gelöst. Ein Versuch ist es bestimmt wert.
 
Zuletzt bearbeitet:
Ja, das stimmt, ich habe vorhin alles wichtige gesichert und werde das machen. Nur der letzte Absturz kam, obwohl keine einzige Partition von /dev/hda irgendwo gemountet war und deshalb frag ich mich, warum ein etwaiger Lesevorgang dort etwas verursachen koennte - wo nicht gemountet ist, sollte auch nicht gelesen werden, aber wer weiss, welche Programme da wie rumgucken.
 
Zurück
Oben