M
martin12345
Grünschnabel
Hallo Linux Community,
als Wiedereinsteiger habe ich als kleines Projekt einen Fileserver mit Samba aufgesetzt, der gleichzeitig als Apache und MySQL Server herhält. Installation usw. verlief nach einigen kleineren Problemchen okay und der Server lief stabil und verrichtete seinen Dienst brav.
Heute aber traten einige Probleme auf, die mit einem kurzen SSH Ausfall begannen (dauerte nur 1 min), übergingen in Probleme beim Nachladen von XML Daten für PHPsysinfo und schließlich nach SAMBA Hackeleien zum Absturz kamen.
Der Server war dann weder über Port 80 noch über SSH noch über Ping ansprechbar.
Ein Gang in den Keller (bewaffnet mit Monitor und Tastatur) offenbarte mir einen dahin schnurrenden Server, der jedoch nach Anschluss von VGA und USB Kabel weder Bild auf den Monitor noch ein Erleuchten des Numlocks brachte.
Schweren Herzens musste ich ihn also hardresetten und jetzt läuft er seit einer Stunde wieder wie gewohnt.
Könnt ihr mir helfen den Absturz zu analysieren und zukünftige Probleme derart zu vermeiden?
Hier zunächst mal "/var/log/messages" für den entsprechenden Zeitraum:
Hier noch ein Paar weitere Angaben:
als Wiedereinsteiger habe ich als kleines Projekt einen Fileserver mit Samba aufgesetzt, der gleichzeitig als Apache und MySQL Server herhält. Installation usw. verlief nach einigen kleineren Problemchen okay und der Server lief stabil und verrichtete seinen Dienst brav.
Heute aber traten einige Probleme auf, die mit einem kurzen SSH Ausfall begannen (dauerte nur 1 min), übergingen in Probleme beim Nachladen von XML Daten für PHPsysinfo und schließlich nach SAMBA Hackeleien zum Absturz kamen.
Der Server war dann weder über Port 80 noch über SSH noch über Ping ansprechbar.
Ein Gang in den Keller (bewaffnet mit Monitor und Tastatur) offenbarte mir einen dahin schnurrenden Server, der jedoch nach Anschluss von VGA und USB Kabel weder Bild auf den Monitor noch ein Erleuchten des Numlocks brachte.
Schweren Herzens musste ich ihn also hardresetten und jetzt läuft er seit einer Stunde wieder wie gewohnt.
Könnt ihr mir helfen den Absturz zu analysieren und zukünftige Probleme derart zu vermeiden?
Hier zunächst mal "/var/log/messages" für den entsprechenden Zeitraum:
Nov 12 21:40:28 fileserver dhclient: XMT: Solicit on eth4, interval 118030ms.
Nov 12 21:42:26 fileserver dhclient: XMT: Solicit on eth4, interval 112090ms.
Nov 12 21:44:19 fileserver dhclient: XMT: Solicit on eth4, interval 119420ms.
Nov 12 21:46:18 fileserver dhclient: XMT: Solicit on eth4, interval 119300ms.
Nov 12 21:48:17 fileserver dhclient: XMT: Solicit on eth4, interval 113670ms.
Nov 12 21:50:11 fileserver dhclient: XMT: Solicit on eth4, interval 109920ms.
Nov 12 21:51:23 fileserver nmbd[2317]: [2011/11/12 21:51:23.748679, 0] nmbd/nmbd_browsesync.c:350(find_domain_master_name_query_fail)
Nov 12 21:51:23 fileserver nmbd[2317]: find_domain_master_name_query_fail:
Nov 12 21:51:23 fileserver nmbd[2317]: Unable to find the Domain Master Browser name WORKGROUP<1b> for the workgroup WORKGROUP.
Nov 12 21:51:23 fileserver nmbd[2317]: Unable to sync browse lists in this workgroup.
Nov 12 21:52:01 fileserver dhclient: XMT: Solicit on eth4, interval 123530ms.
Nov 12 21:54:05 fileserver dhclient: XMT: Solicit on eth4, interval 113630ms.
Nov 12 21:55:03 fileserver smartd[4337]: Device: /dev/sda [SAT], SMART Usage Attribute: 199 UDMA_CRC_Error_Count changed from 197 to 18\
6
Nov 12 21:55:03 fileserver smartd[4337]: Device: /dev/sdb [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 125 to 124
Nov 12 21:55:04 fileserver smartd[4337]: Device: /dev/sdd [SAT], 1 Currently unreadable (pending) sectors
Nov 12 21:55:04 fileserver smartd[4337]: Device: /dev/sdd [SAT], 1 Offline uncorrectable sectors
Nov 12 21:55:04 fileserver smartd[4337]: Device: /dev/sdd [SAT], SMART Prefailure Attribute: 1 Raw_Read_Error_Rate changed from 54 to 5\
3
Nov 12 21:55:04 fileserver smartd[4337]: Device: /dev/sdd [SAT], SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 54 to 5\
3
Nov 12 21:55:58 fileserver kernel: [174739.110435] ata5.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen
Nov 12 21:55:58 fileserver kernel: [174739.110445] ata5.00: ST-ATA: DRQ=0 without device error, dev_stat 0x0
Nov 12 21:55:58 fileserver kernel: [174739.110455] ata5.00: failed command: SMART
Nov 12 21:55:58 fileserver kernel: [174739.110472] ata5.00: cmd b0/d1:01:00:4f:c2/00:00:00:00:00/00 tag 0 pio 512 in
Nov 12 21:55:58 fileserver kernel: [174739.110476] res d0/00:01:00:4f:c2/00:00:00:00:00/00 Emask 0x202 (HSM violation)
Nov 12 21:55:58 fileserver kernel: [174739.110485] ata5.00: status: { Busy }
Nov 12 21:55:58 fileserver kernel: [174739.110502] ata5: hard resetting link
Nov 12 21:55:59 fileserver dhclient: XMT: Solicit on eth4, interval 110530ms.
Nov 12 21:55:59 fileserver kernel: [174739.567182] ata5: SATA link up 1.5 Gbps (SStatus 113 SControl 300)
Nov 12 21:55:59 fileserver kernel: [174739.574623] ata5.00: configured for UDMA/133
Nov 12 21:55:59 fileserver kernel: [174739.574685] ata5: EH complete
Nov 12 21:57:49 fileserver dhclient: XMT: Solicit on eth4, interval 118560ms.
Nov 12 21:59:48 fileserver dhclient: XMT: Solicit on eth4, interval 127720ms.
Nov 12 22:01:56 fileserver dhclient: XMT: Solicit on eth4, interval 124340ms.
Nov 12 22:04:00 fileserver dhclient: XMT: Solicit on eth4, interval 124160ms.
Nov 12 22:06:04 fileserver dhclient: XMT: Solicit on eth4, interval 130760ms.
Nov 12 22:
Nov 12 22:06:23 fileserver nmbd[2317]: find_domain_master_name_query_fail:
Nov 12 22:06:23 fileserver nmbd[2317]: Unable to find the Domain Master Browser name WORKGROUP<1b> for the workgroup WORKGROUP.
Nov 12 22:06:23 fileserver nmbd[2317]: Unable to sync browse lists in this workgroup.
Nov 12 22:08:15 fileserver dhclient: XMT: Solicit on eth4, interval 131780ms.
Nov 12 22:10:27 fileserver dhclient: XMT: Solicit on eth4, interval 122380ms.
Nov 12 22:12:30 fileserver dhclient: XMT: Solicit on eth4, interval 121530ms.
Nov 12 22:14:31 fileserver dhclient: XMT: Solicit on eth4, interval 108590ms.
Nov 12 22:16:20 fileserver dhclient: XMT: Solicit on eth4, interval 120860ms.
Nov 12 22:18:21 fileserver dhclient: XMT: Solicit on eth4, interval 120720ms.
Nov 12 22:20:22 fileserver dhclient: XMT: Solicit on eth4, interval 123670ms.
Nov 12 22:21:23 fileserver nmbd[2317]: [2011/11/12 22:21:23.702703, 0] nmbd/nmbd_browsesync.c:350(find_domain_master_name_query_fail)
Nov 12 22:21:23 fileserver nmbd[2317]: find_domain_master_name_query_fail:
Nov 12 22:21:23 fileserver nmbd[2317]: Unable to find the Domain Master Browser name WORKGROUP<1b> for the workgroup WORKGROUP.
Nov 12 22:21:23 fileserver nmbd[2317]: Unable to sync browse lists in this workgroup.
Nov 12 22:22:25 fileserver dhclient: XMT: Solicit on eth4, interval 129220ms.
Nov 12 22:22:36 fileserver ntfs-3g[572]: ntfs_mst_post_read_fixup: magic: 0x00000002 size: 1024 usa_ofs: 0 usa_count: 65535: Invalid\
argument
06:23 fileserver nmbd[2317]: [2011/11/12 22:06:23.701264, 0] nmbd/nmbd_browsesync.c:350(find_domain_master_name_query_fail)
Nov 12 22:22:36 fileserver ntfs-3g[572]: ntfs_mst_post_read_fixup: magic: 0x00000002 size: 1024 usa_ofs: 0 usa_count: 65535: Invalid\
argument
Nov 12 22:24:35 fileserver dhclient: XMT: Solicit on eth4, interval 113030ms.
Nov 12 22:25:03 fileserver smartd[4337]: Device: /dev/sda [SAT], SMART Prefailure Attribute: 8 Seek_Time_Performance changed from 243 t\
o 244
Nov 12 22:25:03 fileserver smartd[4337]: Device: /dev/sda [SAT], SMART Usage Attribute: 199 UDMA_CRC_Error_Count changed from 186 to 19\
9
Nov 12 22:25:03 fileserver smartd[4337]: Device: /dev/sdb [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 124 to 126
Reboot
Nov 12 22:46:40 fileserver kernel: imklog 5.6.3, log source = /proc/kmsg started.
Nov 12 22:46:40 fileserver rsyslogd: [origin software="rsyslogd" swVersion="5.6.3" x-pid="882" x-info="http://www.rsyslog.com"] start
Nov 12 22:46:40 fileserver kernel: [ 45.011104] powernow: This module only works with AMD K7 CPUs
Nov 12 22:46:40 fileserver rc.cpufreq: CPU frequency scaling is not supported by your processor.
Nov 12 22:46:40 fileserver rc.cpufreq: boot with 'CPUFREQ=no' in to avoid this warning.
Nov 12 22:46:40 fileserver kernel: [ 45.124521] ip6_tables: (C) 2000-2006 Netfilter Core Team
Nov 12 22:46:40 fileserver kernel: [ 45.182795] nf_conntrack version 0.5.0 (16384 buckets, 65536 max)
Hier noch ein Paar weitere Angaben:
Code:
Hostname localhost resolves to 2 IPs. Only scanned 127.0.0.1
Not shown: 991 closed ports
PORT STATE SERVICE
22/tcp open ssh
25/tcp open smtp
80/tcp open http
111/tcp open rpcbind
139/tcp open netbios-ssn
443/tcp open https
445/tcp open microsoft-ds
631/tcp open ipp
3306/tcp open mysql
Nmap done: 1 IP address (1 host up) scanned in 0.27 seconds
Code:
cat /proc/cpuinfo
processor : 0
vendor_id : GenuineIntel
cpu family : 15
model : 2
model name : Intel(R) Xeon(TM) CPU 2.40GHz
stepping : 5
cpu MHz : 2392.226
cache size : 512 KB
physical id : 0
siblings : 2
core id : 0
cpu cores : 1
apicid : 0
initial apicid : 0
fdiv_bug : no
hlt_bug : no
f00f_bug : no
coma_bug : no
fpu : yes
fpu_exception : yes
cpuid level : 2
wp : yes
flags : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe pebs bts cid xtpr
bogomips : 4784.45
clflush size : 64
cache_alignment : 128
address sizes : 36 bits physical, 32 bits virtual
power management:
processor : 1
vendor_id : GenuineIntel
cpu family : 15
model : 2
model name : Intel(R) Xeon(TM) CPU 2.40GHz
stepping : 5
cpu MHz : 2392.226
cache size : 512 KB
physical id : 0
siblings : 2
core id : 0
cpu cores : 1
apicid : 1
initial apicid : 1
fdiv_bug : no
hlt_bug : no
f00f_bug : no
coma_bug : no
fpu : yes
fpu_exception : yes
cpuid level : 2
wp : yes
flags : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe pebs bts cid xtpr
bogomips : 4783.72
clflush size : 64
cache_alignment : 128
address sizes : 36 bits physical, 32 bits virtual
power management: