Festplattezugriff des Todes

W

wolf.volkmann

Grünschnabel
Festplattenzugriff des Todes

Hallo,

hab mal ne Frage:

Ich hab einen RootServer.
Auf dem läuft ein openSuSE.
Hab das Problem das der Server manchmal nicht mehr erreichbar ist.
Erst dachte ich das es irgendwelche DOS attacken oder ähnliches wären,
aber dann ist mir aufgefallen das das Problem auch auftritt während ich eine Sicherung mache.

Daraufhin hatte ich ein Recoverysystem gestartet und folgenden Befehl abgesetzt:
"fsck.ext3 -f -c /dev/sda3"

Dann fängt badblocks an die Platte block für block zu testen.
Und auf einmal ist der Server wieder nicht mehr erreichbar.

Letzte Ausgabe:
root@hans:~# fsck.ext3 -f -c /dev/sda3
e2fsck 1.40.8 (13-Mar-2008)
Checking for bad blocks (read-only test): 43138624/ 77844964

nebenbei hatte ich ein tail-f auf var/log/messages laufen lassen, dort ist aber keine einzige meldung aufgetaucht.

Hat jemand ne Idee woran das liegen kann?

Muss doch eigentlich ein Hardware Problem sein oder nicht?
Wenn die Platte nen Fehler oder sonst was hätte, würde ich ja verstehen wenn irgendwelche wilden Fehlermeldungen auftauchen würden....
Aber einfach nicht mehr erreichbar?!? ?( ?(

Meni Serverhoster hat bereits einen Hardwaretest durch geführt und angeblich keinen Fehler gefunden.

Fällt euch noch was ein?

danke schonmal.

Wolf
 
Zuletzt bearbeitet:
Heisst dein Serveranbieter Strato?
 
anbieter

nö.
anders ^^
aber tut das was zur Sache?
 
Ja weil nur Strato dafür bekannt ist Hardwareproblemen auch wirklich auf den Grund zu gehen ^.^
 
Genau. Ich hab auch schon Server bei Strato betreut die einen Hardwareschaden hatten, aber der "Hardware-Check" hat keinen Fehler gefunden.

Erst als der Mieter mit Kündigung aller Server drohte, wurde plötzlich ein Schaden festgetellt. Daher hätte es mich nicht gewundert, wenn Strato erst auf Basis von selbst erbrachten Beweisen einen Hardwareschaden eingestehen würde.

Das tolle ist dann, dass Strato einfach den kompletten Server tauscht, nur weil der CPU-Lüfter defekt ist ;)
 
Also mein Anbieter ist Server4you.
Aber hier zu diskutieren welcher Anbieter was verkehrt macht, bringt mir leider auch nichts.
Nochmal zurück zur Frage:
Wenn der Server auf einmal weg ist, ohne einen Eintrag in der irgendeiner Logdatei - dann muss es schon an der Hardware liegen eigentlich oder?
Hab inzwischen auch alle Ports bis auf SSH gesperrt, aber wie gesagt wenn es DOS-attscken oder irgendwas in der richtung wären, müsste ich ja in irgendeinem logfile einen hinweis finden...

Euch fällt also auch nichts mehr ein oder?
 
was sagt denn uptime - kann der Server nach so einem Ausfall neu gestartet worden sein?
 
Schau mal in den logs nach drive seek error x052 oder so - dann hast du ne Macke auf
der Platte - dann versucht das System, den fehlerhaften Sektor mehrfach zu lesen, um noch an
die Daten zu kommen- irgendwann gehts dann weiter ... Ich habe selbst so ne Sch.. Platte mit
seit ca 8 Jahren konstanter Anzahl Bad-Blocks (mittlerweile den Bereich einfach ungenutzt gelassen,
und gut ist ) . Ich weiß, Platte ist eigentlich für den Müll, aber da seit 8 Jahre nicht mehr
dazugekommen sind - als Arbeitsbereich usw ist se noch lange gut - ist nix wichtiges drauf.
 
Das Problem ist ich hab gar keine Meldung in den Logs.
Null, Nada, Niente...
das ist ja das komische.
 
Mir kommt das wie Überhitzung vor. Warm -> CPU schaltet ab und der Server damit neu.

evtl mal mit sensors schauen wie es um die Temperaturen steht.

Wenn du es ganz genau wissen willst dann lass dir wenn möglich ne KVM anschließen und schau die die Ausgaben auf dem Terminal mal an wenn das wieder passiert.

Psyjo
 
Oder ist ein Hardwareraid, das noch nicht sync ist und deswegen die platte so langsam ist
 

Ähnliche Themen

Bootloader nach update weg

Festplatte stirbt, dd funktioniert nicht

Windows clients können nicht mehr auf lange laufendes System zugreifen

Die Usb-Festplatte wird nicht mehr eingehängt!

rsync: Quelle größer als Ziel => "Archiv" aufteilen/splitten

Zurück
Oben