PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Ext3-fs Error: Error reading...



Serpentine
13.03.2009, 13:32
Also ich habe folgendes Problem:
Ich gehe vom PC und komme nach einer geraumen Zeit wieder...Der Screensaver hat sich mittlerweile akzeptiert und die Sitzung ist gesperrt, aber wenn ich den Bildschirm an mache, sehe ich nur hellgrün und meinen Mauszeiger der sich auch bewegen lässt.
Ich haue also auf Strg + Alt + Zurueck um den X Server neu zu starten und komme in die normale Konsole... Dort sehe ich dann schon eine Fehlermeldung: Ext3-fs Error: Error reading directory: Offset: $Offset

Ich versuche mich als root anzumelden und den PC neu zu starten, bekomme aber immer wieder die selbe Fehlermeldung, mit verschiedenen Offset variationen und drücke den Power Knopf am PC: "Directory /sbin/shutdown cannot be read"

Dem ganzen konnte ich bis jetzt entnehmen, dass mein Dateisystem der root Partition fehlerhaft ist, ist es aber nicht, denn der PC fährt ganz normal hoch und Arch bootet auch ganz normal.

Also muss das Problem am System liegen, allerdings kommt der Fehler nur, wenn der Screensaver an war und auch nicht immer...

Also falls jemand ne Idee hat her damit^^

defcon
13.03.2009, 14:21
Bildschirmschoner deaktivieren :D
Nutzt du SATA?
Mach mal (wenn du wieder vorm Problem stehst) ein dmesg und poste mal die Ausgabe.

Eventuell solltest Du auch mal die Kabel überprüfen.

Serpentine
13.03.2009, 14:35
Ja, ich nutze S-ATA, aber nicht für die Root Partition, von daher eigentlich belanglos, da es mit dieser Partition ja keine Probleme gibt.

Screensaver ist deaktiviert nachdem ich das Problem jetzt wieder hatte und dmesg kannste wohl leider vergessen, da ich mich ja nicht anmelden kann und auch sonst keine Programme/Befehle ausführen kann, weil er ja keine Dateien/Ordner lesen noch schreiben kann.

Wenn das Problem eintritt kann ich ja bereits nichts mehr machen, es gibt auch keinen Log davon aus den oben genannten Gründen.

chb
13.03.2009, 14:53
Du kannst ja versuchen dich von einem 2. PC per ssh einzuloggen und nachzusehen.

Serpentine
13.03.2009, 15:45
Ich verstehe nicht wie du das meinst...
Das System funktioniert ja nach einem reboot wieder einwandfrei. Deswegen bin ich ja so ratlos.

Gast1
14.03.2009, 07:51
Ich verstehe nicht wie du das meinst...

Was verstehst Du denn daran nicht, ist doch eindeutig, was Dir vorgeschlagen wurde.

Auf der Kiste SSH-server laufen lassen und wenn sie wieder "steht" versuchen per ssh von einer anderen Kiste einzuloggen.

Serpentine
14.03.2009, 11:49
Das habe ich schon verstanden, nur wenn ich mich lokal nicht einloggen kann, wird es über SSH auch nicht gehen, deswegen finde ich das ein wenig unsinnig.
Ich hatte übrigends wieder das selbe Problem, diesmal ohne Bildschirmschoner, aber ich habe die Ausgabe mal aufgeschrieben:

Ext3-fs error (device sdb1): ext3_find_entry: reading directory #1804210 offset 0

Diesmal ist zuerst das Gnome-Panel gecrasht und hat tausende errors produziert und dann war alles weg.

Gast1
14.03.2009, 11:58
Das habe ich schon verstanden, nur wenn ich mich lokal nicht einloggen kann, wird es über SSH auch nicht gehen, deswegen finde ich das ein wenig unsinnig.

Ist es aber nicht und ausprobieren kostet nichts.

Es gibt genügend Beispiele, wo ein Login per SSH noch geht, obwohl die Kiste lokal "tot" ist.

Bâshgob
14.03.2009, 12:13
Wo ist die Ausgabe von "dmesg" (vergl. Post Nr. 2)?
Wo sind die Logfiles?
Was ergibt "smartctl -a /dev/sdb"?
Kabel geprüft?
"uname -a"?
"fdisk -l"?

Serpentine
14.03.2009, 13:21
Okay, das einloggen mit ssh wird mir wohl leider nicht möglich sein, da ich keinen 2ten funktionsfähigen PC/Laptop hier habe.
Dmesg kann ich wenn er steht nicht machen, da ich mich nicht anmelden kann, müsste sonst ein bekannter per ssh versuchen, wenn er sich einloggen kann, was dann aber auch meine einzige Möglichkeit wäre es über ssh zu versuchen.

smartctl:


smartctl version 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF INFORMATION SECTION ===
Device Model: SAMSUNG SV1204H
Serial Number: 0450J1FW203241
Firmware Version: RK100-15
User Capacity: 120.060.444.672 bytes
Device is: In smartctl database [for details use: -P show]
ATA Version is: 6
ATA Standard is: ATA/ATAPI-6 T13 1410D revision 1
Local Time is: Sat Mar 14 13:10:23 2009 CET
SMART support is: Available - device has SMART capability.
SMART support is: Disabled

SMART Disabled. Use option -s with argument 'on' to enable it.


Logfiles dafür gibt es nicht, da keine geschrieben werden können denke ich mal, hab auch schon alles durchsucht aber nichts gefunden.

uname:


Linux 10100111001 2.6.28-ARCH #1 SMP PREEMPT Sun Mar 8 10:18:28 UTC 2009 i686 Intel(R) Pentium(R) 4 CPU 3.00GHz GenuineIntel GNU/Linux


fdisk:


Platte /dev/sda: 40.0 GByte, 40059321856 Byte
255 Köpfe, 63 Sektoren/Spuren, 4870 Zylinder
Einheiten = Zylinder von 16065 × 512 = 8225280 Bytes
Disk identifier: 0xb5b2b5b2

Gerät boot. Anfang Ende Blöcke Id System
/dev/sda1 * 1 1275 10241406 7 HPFS/NTFS
/dev/sda2 1276 4869 28868805 f W95 Erw. (LBA)
/dev/sda5 1276 4869 28868773+ 7 HPFS/NTFS

Platte /dev/sdb: 120.0 GByte, 120060444672 Byte
255 Köpfe, 63 Sektoren/Spuren, 14596 Zylinder
Einheiten = Zylinder von 16065 × 512 = 8225280 Bytes
Disk identifier: 0x000d9b25

Gerät boot. Anfang Ende Blöcke Id System
/dev/sdb1 1 14596 117242338+ 83 Linux

Platte /dev/sdc: 120.0 GByte, 120034123776 Byte
255 Köpfe, 63 Sektoren/Spuren, 14593 Zylinder
Einheiten = Zylinder von 16065 × 512 = 8225280 Bytes
Disk identifier: 0x05450544

Gerät boot. Anfang Ende Blöcke Id System
/dev/sdc1 * 1 243 1951866 82 Linux Swap / Solaris
/dev/sdc2 244 365 979965 83 Linux
/dev/sdc3 366 14593 114286410 b W95 FAT32

Platte /dev/sdd: 80.0 GByte, 80026361856 Byte
255 Köpfe, 63 Sektoren/Spuren, 9729 Zylinder
Einheiten = Zylinder von 16065 × 512 = 8225280 Bytes
Disk identifier: 0x30583057

Gerät boot. Anfang Ende Blöcke Id System
/dev/sdd1 1 9729 78148161 b W95 FAT32


Kabel sind einwandfrei.

Krotti
14.03.2009, 15:28
Schon mal den Arbeitsspeicher überprüft ? Würde anhand deiner Fehlerbeschreibung eher auf einen defekten RAM Baustein tippen.


SMART support is: Disabled

SMART Disabled. Use option -s with argument 'on' to enable it.


Schon mal versucht SMART zu aktivieren ?

Serpentine
14.03.2009, 15:56
Ja, hab SMART mal im BIOS enabled für alle hdds, gab aber irgendnen krassen error.
Habs jetzt mal mit smartctl für sdb enabled und bekomme beim selftest folgende Ausgabe, aus der ich nicht wirklich schlau werde:


SMART Error Log Version: 1
Warning: ATA error count 14904 inconsistent with error log pointer 5

ATA Error Count: 14904 (device log contains only the most recent five errors)
CR = Command Register [HEX]
FR = Features Register [HEX]
SC = Sector Count Register [HEX]
SN = Sector Number Register [HEX]
CL = Cylinder Low Register [HEX]
CH = Cylinder High Register [HEX]
DH = Device/Head Register [HEX]
DC = Device Command Register [HEX]
ER = Error register [HEX]
ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 14904 occurred at disk power-on lifetime: 12483 hours (520 days + 3 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
04 51 00 01 c2 4f b0 Error: ABRT

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
b0 d9 00 01 c2 4f b0 00 00:00:09.000 SMART DISABLE OPERATIONS
ec 00 ff 01 c2 4f b0 00 00:00:09.000 IDENTIFY DEVICE
10 00 ff 01 c2 4f b0 00 00:00:09.000 RECALIBRATE [OBS-4]
91 00 ff 01 c2 4f bf 00 00:00:09.000 INITIALIZE DEVICE PARAMETERS [OBS-6]
ec 00 ff 01 00 00 b0 00 00:00:09.000 IDENTIFY DEVICE

Error 14903 occurred at disk power-on lifetime: 12483 hours (520 days + 3 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
04 51 01 01 00 00 b0 Error: ABRT

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
a1 00 01 01 00 00 b0 00 00:00:08.000 IDENTIFY PACKET DEVICE
c8 00 08 bf 0c 57 f0 00 01:37:29.000 READ DMA
c8 00 08 0f d2 df fd 00 01:37:29.000 READ DMA
ca 00 08 7f 01 07 f0 00 01:37:29.000 WRITE DMA
08 00 01 01 00 00 b0 00 00:00:08.000 DEVICE RESET

Error 14902 occurred at disk power-on lifetime: 12483 hours (520 days + 3 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
04 51 01 01 00 00 b0

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
08 00 01 01 00 00 b0 00 00:00:08.000 DEVICE RESET
00 00 01 01 00 00 00 00 00:00:04.000 NOP [Abort queued commands]
c8 00 08 bf 0c 57 f0 00 01:37:29.000 READ DMA
c8 00 08 0f d2 df fd 00 01:37:29.000 READ DMA
ca 00 08 7f 01 07 f0 00 01:37:29.000 WRITE DMA

Error 14901 occurred at disk power-on lifetime: 12483 hours (520 days + 3 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
04 51 00 00 c2 4f 10 Error: ABRT

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
b0 da 00 00 c2 4f 10 00 01:37:29.000 SMART RETURN STATUS
c8 00 08 bf 0c 57 f0 00 01:37:29.000 READ DMA
c8 00 08 0f d2 df fd 00 01:37:29.000 READ DMA
ca 00 08 7f 01 07 f0 00 01:37:29.000 WRITE DMA
ec 00 01 00 00 00 10 00 01:37:29.000 IDENTIFY DEVICE

Error 14900 occurred at disk power-on lifetime: 12482 hours (520 days + 2 hours)
When the command that caused the error occurred, the device was active or idle.

After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
84 51 60 cf be d1 fd Error: ICRC, ABRT 96 sectors at LBA = 0x0dd1becf = 231849679

Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
c8 00 60 cf be d1 fd 00 00:15:59.000 READ DMA
c8 00 00 17 65 c2 f0 00 00:15:59.000 READ DMA
c8 00 c8 d7 65 bf f0 00 00:15:59.000 READ DMA
c8 00 b8 ef bd d2 fd 00 00:15:59.000 READ DMA
c8 00 08 0f 38 4e f6 00 00:15:59.000 READ DMA


RAM könnte sein werde ich mal testen wenn ich genug Zeit habe.
Hauptsache die HDD zerhauts nicht, weil da is ziemlich viel wichtiges Zeug drauf und hab natürlich kein RAID^^

Gast1
14.03.2009, 16:00
Hauptsache die HDD zerhauts nicht, weil da is ziemlich viel wichtiges Zeug drauf und hab natürlich kein RAID^^

Ein Backup wäre auch wichtiger als RAID.

Serpentine
14.03.2009, 16:03
Och ich finde RAID 1 ehrlich gesagt besser als immer Backups zu machen.
Aber darum geht es nicht.
Weiß jemand was mit den Logs anzufangen?

Gast1
14.03.2009, 16:14
Och ich finde RAID 1 ehrlich gesagt besser als immer Backups zu machen.


Na klar, wenn Dir Deine Daten nicht wichtig sind, dann ist RAID1 als einzige "Backupstrategie" genau das richtige.

Serpentine
14.03.2009, 16:35
Meinungen sind nunmal verschieden.
Zurück zum Thema ;)

Bâshgob
14.03.2009, 16:51
Ich warte immer noch auf ein dmesg. Das das natürlich nicht klappt wenn der Rechner steht sollte dem letzten Baumschüler klar sein. Aber es kann trotz allem enorm hilfreich bei der Diagnose sein.

Dann lässt du noch mal 'n Test über die Platte laufen ("smartctl -t long /dev/sdb") und postest nachher brav das Ergebnis ("smartctl -a /dev/sdb").

Und dann schaun wir mal.

Und zu deiner Meinung bezüglich der "Backupstrategie" nur soviel: "Echte Kerle brauchen kein Backup."

Gast1
14.03.2009, 16:52
Das hat nichts mit Meinungen zu tun, ein RAID kann kein Backup ersetzen, das ist Fakt.

Darfst gerne die Suchmaschine Deines geringsten Mißtrauens zu dem Thema befragen.

Und ein Backup solltest Du möglichst zügig anlegen, wenn Dir Deine Daten wichtig sind.

//Edit:


Und zu deiner Meinung bezüglich der "Backupstrategie" nur soviel: "Echte Kerle brauchen kein Backup."

*g* Ganz genau, das sind so berühmte, letzte Worte bevor das Geheul losgeht (so wie die letzten Worte des Beifahrers "Rechts ist frei.")

Wobei es da noch eine erweiterte Form des Zitats gibt:


"Nur Weicheier benutzen Datensicherungen auf Band: Richtige Männer laden ihren wichtigen Kram einfach auf einen FTP und lassen diesen vom Rest der Welt spiegeln."

Original


Only wimps use tape backup: real men just upload their important stuff on ftp, and let the rest of the world mirror it.

=> Quelle (http://groups.google.com/group/linux.dev.kernel/msg/76ae734d543e396d)

bb83
25.04.2009, 09:30
Schaue doch mal nach, was nach dem reboot

cat /var/log/messages.log
steht. Dort findet man auch ältere Einträge, welche relativ equivalent zu dmesg sein dürften