PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : System stürzt ab. Was sagt mir das Log?



clemente
04.01.2007, 15:02
Hallo,
nach Studium von "Was ist Sicherheit" traue ich mich, hier zu posten ;)
Ein Rechner von mir stürzt ab und zu ab - so auch gestern. Abstürzen heißt, dass der Rechner einfriert. Keine Reaktion auf Tastatur oder Netzwerk (ssh, ping, telnet, ...).
Ich möchte gerne wissen, warum, verstehe aber kaum etwas von den Kernelmeldungen im Log.
Kann mir vielleicht jemand auf die Sprünge helfen?
Vielleicht ist der ganze Kerneloutput ja auch irrelevant? Die letzte Meldung vor dem Reboot stammt von Cron.

Vielen Dank ,
Clemente



Jan 3 17:15:13 fpvm kernel: [1409052.669019] CPU: 0
Jan 3 17:15:13 fpvm kernel: [1409052.669020] EIP: 0060:[find_get_page+41/80] Not tainted VLI
Jan 3 17:15:13 fpvm kernel: [1409052.669021] EFLAGS: 00010002 (2.6.15-23-server)
Jan 3 17:15:13 fpvm kernel: [1409052.673901] EIP is at find_get_page+0x29/0x50
Jan 3 17:15:13 fpvm kernel: [1409052.675526] eax: 00000002 ebx: d01afd48 ecx: 00000002 edx: c2fa42bc
Jan 3 17:15:13 fpvm kernel: [1409052.677187] esi: c11b1da0 edi: 0000001e ebp: 0000001e esp: cf661dd8
Jan 3 17:15:13 fpvm kernel: [1409052.678832] ds: 007b es: 007b ss: 0068
Jan 3 17:15:13 fpvm kernel: [1409052.680466] Process smbd (pid: 5836, threadinfo=cf660000 task=dd373030)
Jan 3 17:15:13 fpvm kernel: [1409052.680529] Stack: d01afd4c 0000001e 00001000 c014d1d5 d01afd48 0000001e 00000000 00001000
Jan 3 17:15:13 fpvm kernel: [1409052.682238] 00000008 d01afc9c 0000002c 00000000 00000022 00000022 0000001d 0002cc00
Jan 3 17:15:13 fpvm kernel: [1409052.683956] 00000000 00000000 00001000 00000000 00000000 00000000 00000030 00000021
Jan 3 17:15:13 fpvm kernel: [1409052.685658] Call Trace:
Jan 3 17:15:13 fpvm kernel: [1409052.688874] [do_generic_mapping_read+421/1280] do_generic_mapping_read+0x1a5/0x500
Jan 3 17:15:13 fpvm kernel: [1409052.690552] [__generic_file_aio_read+393/608] __generic_file_aio_read+0x189/0x260
Jan 3 17:15:13 fpvm kernel: [1409052.692193] [file_read_actor+0/272] file_read_actor+0x0/0x110
Jan 3 17:15:13 fpvm kernel: [1409052.693841] [generic_file_aio_read+91/128] generic_file_aio_read+0x5b/0x80
Jan 3 17:15:13 fpvm kernel: [1409052.695488] [do_sync_read+201/304] do_sync_read+0xc9/0x130
Jan 3 17:15:13 fpvm kernel: [1409052.697142] [autoremove_wake_function+0/96] autoremove_wake_function+0x0/0x60
Jan 3 17:15:13 fpvm kernel: [1409052.698794] [vfs_read+214/432] vfs_read+0xd6/0x1b0
Jan 3 17:15:13 fpvm kernel: [1409052.700431] [sys_pread64+128/144] sys_pread64+0x80/0x90
Jan 3 17:15:13 fpvm kernel: [1409052.702061] [sysenter_past_esp+84/117] sysenter_past_esp+0x54/0x75
Jan 3 17:15:13 fpvm kernel: [1409052.703707] Code: 00 00 53 83 ec 08 8b 5c 24 10 8d 43 10 e8 b0 9e 1b 00 8d 53 04 8b 44 24 14 89 14 24 89 44 24 04 e8 3d 84 0a 00 85 c0 89 c1 74 0
d <8b> 00 89 ca f6 c4 40 75 10 f0 ff 42 04 f0 ff 43 10 fb 83 c4 08
Jan 3 17:15:14 fpvm kernel: [1409052.708969] <1>Unable to handle kernel NULL pointer dereference at virtual address 00000002
Jan 3 17:15:14 fpvm kernel: [1409052.835121] printing eip:
Jan 3 17:15:14 fpvm kernel: [1409052.836760] c014cc69
Jan 3 17:15:14 fpvm kernel: [1409052.838349] *pde = 1f6cc001
Jan 3 17:15:14 fpvm kernel: [1409052.839945] Oops: 0000 [#4]
Jan 3 17:15:14 fpvm kernel: [1409052.841539] SMP
Jan 3 17:15:14 fpvm kernel: [1409052.843128] Modules linked in: af_packet dm_mod psmouse lp parport_pc parport pcspkr floppy ipv6 snd_intel8x0 snd_ac97_codec snd_ac97_bus snd_pcm
_oss snd_mixer_oss snd_pcm snd_timer snd soundcore snd_page_alloc shpchp pci_hotplug i2c_nforce2 i2c_core sg evdev ext3 jbd raid1 md_mod ide_generic forcedeth ehci_hcd ohci_hcd us
bcore ide_disk generic amd74xx sd_mod sata_nv libata scsi_mod processor capability commoncap vesafb fbcon tileblit font bitblit softcursor
Jan 3 17:15:14 fpvm kernel: [1409052.851770] CPU: 0
Jan 3 17:15:14 fpvm kernel: [1409052.851771] EIP: 0060:[find_get_page+41/80] Not tainted VLI
Jan 3 17:15:14 fpvm kernel: [1409052.851773] EFLAGS: 00010002 (2.6.15-23-server)
Jan 3 17:15:14 fpvm kernel: [1409052.856653] EIP is at find_get_page+0x29/0x50
Jan 3 17:15:14 fpvm kernel: [1409052.858278] eax: 00000002 ebx: d01afd48 ecx: 00000002 edx: c2fa42bc
Jan 3 17:15:14 fpvm kernel: [1409052.859938] esi: c11b1da0 edi: 0000001e ebp: 0000001e esp: cf661dd8
Jan 3 17:15:14 fpvm kernel: [1409052.861582] ds: 007b es: 007b ss: 0068
Jan 3 17:15:14 fpvm kernel: [1409052.863216] Process smbd (pid: 5837, threadinfo=cf660000 task=dd373030)
Jan 3 17:15:14 fpvm kernel: [1409052.863279] Stack: d01afd4c 0000001e 00001000 c014d1d5 d01afd48 0000001e 00000000 00001000
Jan 3 17:15:14 fpvm kernel: [1409052.864987] 00000008 d01afc9c 0000002c 00000000 00000022 00000022 0000001d 0002cc00
Jan 3 17:15:14 fpvm kernel: [1409052.866703] 00000000 00000000 00001000 00000000 00000000 00000000 00000030 00000021
Jan 3 17:15:14 fpvm kernel: [1409052.868402] Call Trace:
Jan 3 17:15:14 fpvm kernel: [1409052.871614] [do_generic_mapping_read+421/1280] do_generic_mapping_read+0x1a5/0x500
Jan 3 17:15:14 fpvm kernel: [1409052.873294] [__generic_file_aio_read+393/608] __generic_file_aio_read+0x189/0x260
Jan 3 17:15:14 fpvm kernel: [1409052.874934] [file_read_actor+0/272] file_read_actor+0x0/0x110
Jan 3 17:15:14 fpvm kernel: [1409052.876580] [generic_file_aio_read+91/128] generic_file_aio_read+0x5b/0x80
Jan 3 17:15:14 fpvm kernel: [1409052.878225] [do_sync_read+201/304] do_sync_read+0xc9/0x130
Jan 3 17:15:14 fpvm kernel: [1409052.879880] [autoremove_wake_function+0/96] autoremove_wake_function+0x0/0x60
Jan 3 17:15:14 fpvm kernel: [1409052.881530] [vfs_read+214/432] vfs_read+0xd6/0x1b0
Jan 3 17:15:14 fpvm kernel: [1409052.883165] [sys_pread64+128/144] sys_pread64+0x80/0x90
Jan 3 17:15:14 fpvm kernel: [1409052.884791] [sysenter_past_esp+84/117] sysenter_past_esp+0x54/0x75
Jan 3 17:15:14 fpvm kernel: [1409052.886434] Code: 00 00 53 83 ec 08 8b 5c 24 10 8d 43 10 e8 b0 9e 1b 00 8d 53 04 8b 44 24 14 89 14 24 89 44 24 04 e8 3d 84 0a 00 85 c0 89 c1 74 0
d <8b> 00 89 ca f6 c4 40 75 10 f0 ff 42 04 f0 ff 43 10 fb 83 c4 08
Jan 3 17:17:01 fpvm /USR/SBIN/CRON[5840]: (root) CMD ( run-parts --report /etc/cron.hourly)
Jan 3 18:03:48 fpvm syslogd 1.4.1#17ubuntu7: restart.
Jan 3 18:03:48 fpvm kernel: Inspecting /boot/System.map-2.6.15-23-server
Jan 3 18:03:48 fpvm kernel: Loaded 23140 symbols from /boot/System.map-2.6.15-23-server.
Jan 3 18:03:48 fpvm kernel: Symbols match kernel version 2.6.15.
Jan 3 18:03:48 fpvm kernel: No module symbols loaded - kernel modules not enabled.
Jan 3 18:03:48 fpvm kernel: [42949372.960000] Linux version 2.6.15-23-server (buildd@rothera) (gcc version 4.0.3 (Ubuntu 4.0.3-1ubuntu5)) #1 SMP Tue May 23 15:10:35 UTC 2006
Jan 3 18:03:48 fpvm kernel: [42949372.960000] BIOS-provided physical RAM map:

blur
11.01.2007, 16:00
Moin, moin,

ich tippe auf Probleme mit dem smbd. Um näheres zu sagen, müsste man wissen, was der Rechner so alles macht und zu welchen Zeitpunkten das Einfrieren passiert.

Gruß
Blur

clemente
11.01.2007, 20:17
Hallo,
der Rechner macht nicht sehr viel ;-) Es ist ein Fileserver für acht mäßig aktive Arbeitsstationen. Als solches laufen - neben Üblichen Dingen -
- Samba (nicht als PDC, keine Drucker)
- Ein Software RAID
- Kopieren der Nutzerdaten (4 Snapshots + ein Full/Tag)
Abgestürzt ist der Rechner drei mal, nicht reproduzoerbar (jedenfalls für mich).
Die Ereignisse rund um die Absturzzeit:

Im Syslog kommt die letzte Nachricht um 17:17 von CRON. Es ist der hourly-Lauf. Das cron.hourly Verzeichnis ist leer, CRON hat also nichts zu tun.
Um 17:13 startet ein dirvish-runall (Backup Tool auf Rsync Basis). Das Log des betreffenden Backup Laufs sagt aus, dass das Backup um 17:14 erfolgreich beendet wurde.
Der letzte Eintrag in den Samba Locks stammt von 17:23 und bemängelt: nable to open printcap file /etc/printcap for read! Die Datei gibt es auch nicht, deren Fehlen bemängelt Samba mehrmals pro Stunde. ;)

Ich finde, das klingt eigentlich alles undramatisch. Oder?

Schlaubi_fi.de
11.01.2007, 22:26
1. Erstelle mit folgendem Befehl eine leere /etc/printcap und Samba schreit nicht mehr:


touch /etc/printcap

2. Bitte poste doch mal Deine Sambaversion - evtl. gibt es ja bereits ein neues Release...

harihurtig
19.02.2007, 19:09
@blur:


Moin, moin,

ich tippe auf Probleme mit dem smbd. Um näheres zu sagen, müsste man wissen, was der Rechner so alles macht und zu welchen Zeitpunkten das Einfrieren passiert.

Gruß
Blur

Blur,

kannst Du mir bitte verraten wie der smbd als User-Space Applikation diese Probleme verursachen soll??

@clemente:



Der letzte Eintrag in den Samba Locks stammt von 17:23 und bemängelt: Unable to open printcap file /etc/printcap for read! Die Datei gibt es auch nicht, deren Fehlen bemängelt Samba mehrmals pro Stunde. ;)

Ich finde, das klingt eigentlich alles undramatisch. Oder?

Die Fehlermeldung sollte alle "printcap cache time" Sekunden auftreten. Entweder Du legst eine leere Datei an oder ignorierst die Meldung.

Mach mal einen Crash-Dump mit LKCD, da sollte man den Fehler recht schnell finden.
Läuft bei Dir ein "powersaved" oder ähnliches?

lg, Hari

blur
20.02.2007, 09:54
@blur:



Blur,

kannst Du mir bitte verraten wie der smbd als User-Space Applikation diese Probleme verursachen soll??


Nein, aber aus der Praxis kann ich Dir sagen, daß dies im letzten Jahr bei mehreren Installationen aufgetreten war.

Blur

clemente
20.02.2007, 11:29
Hallo,
danke für Eure Antworten.

@Harihurtig
LKCD. Linux kernel crash dump, der Benutzer benutzt es anscheinend mit lcrash. Soweit Google.
man lcrash sagt mir nicht viel, was ich im Netz finde ist etwas zu ausführlich für zwischendurch. Ein beherzt-unwissendes "lcrash" ergibt:


lcrash 0.10.2 (xlcrash) build at Nov 10 2005 15:15:08
Lcrash is free software. It is covered by the GNU General Public License.
You are welcome to change it and/or distribute copies of it under certain
conditions. Type "help -C" to see the conditions. Absolutely no warranty
is given for Lcrash. Type "help -W" for warranty details.

map = /boot/System.map-2.6.15-23-server
dump = /dev/mem
kerntypes = /boot/Kerntypes-2.6.15-23-server


Please wait...

Verifying filenames... Failed.

bad namelist filename

Wobei es die Datei Kerntypes.xxx nicht gibt.

Lange Rede schwacher Sinn: Lässt sich lcrash schnell und schmerzlos erklären? Ansonsten habe ich am WE einiges zu lesen ;)

@Blur:
Es handet sich um Samba 3.0.22

lg, Clemente