B
byron1778
Jungspund
Hallo Forum!
Wir haben ein seltsames Phaenomen. Wenn das fmservice laeuft, dann haben wir stets Verbindungsabbrueche ( vorher vermuteten wir schon defektes Kabel, Switch, etc. ).
Jetzt scheint es so, als haette es etwas mit dem fmservice Prozess zu tun.
Diese Verbindungsabbrueche haben wir aber nicht, wenn wir von der Maschine einen Ping absetzen, die staendig diese Abbrueche hat!
Jetzt haben wir einmal einen truss auf das Service los gelassen und den Output mit der Maschine verglichen, wo es aber funktioniert ( wo es nicht funktioniert ist das Backupsystem - beide Systeme sind aber identisch! ).
So sieht der Output aus
Der Output vom funktionierenden System sieht genauso aus.
Ich kann jetzt keine groeberen Unregelmaessigkeiten erkennen, noch kann ich aus dem Code von oben irgendwelche relevanten Rueckschluesse ziehen.
Kann jemand von Euch vll. etwas mit dem obrigen anfangen?
Danke Euch vielmals schon!
.
.
.
EDIT (autom. Beitragszusammenführung) :
.
Folgendes konnte ich noch beim Prozess:
feststellen, wenn ich einen truss darauf mache.
Ich bekomme regelmaessig den Errorcode Err#150 EINPROGRESS bei diesem Storage Manager Prozess zurueck und genau dann bricht die Verbindung ab.
Wie kann ich es verhindern, dass er auf dem Kanal in ein Timeout laeuft?
Wir haben ein seltsames Phaenomen. Wenn das fmservice laeuft, dann haben wir stets Verbindungsabbrueche ( vorher vermuteten wir schon defektes Kabel, Switch, etc. ).
Jetzt scheint es so, als haette es etwas mit dem fmservice Prozess zu tun.
Diese Verbindungsabbrueche haben wir aber nicht, wenn wir von der Maschine einen Ping absetzen, die staendig diese Abbrueche hat!
Jetzt haben wir einmal einen truss auf das Service los gelassen und den Output mit der Maschine verglichen, wo es aber funktioniert ( wo es nicht funktioniert ist das Backupsystem - beide Systeme sind aber identisch! ).
So sieht der Output aus
Code:
28327/1: read(5, 0xFFBFF2B0, 1024) Err#11 EAGAIN
28327/1: recv(7, 0xFFBFF697, 1, 0) Err#11 EAGAIN
28327/1: waitid(P_PID, 28330, 0xFFBFF500, WEXITED|WTRAPPED|WNOHANG) = 0
28327/2: nanosleep(0xFF07BF10, 0x00000000) = 0
28327/1: nanosleep(0xFFBFF6B0, 0x00000000) = 0
28327/1: read(5, 0xFFBFF2B0, 1024) Err#11 EAGAIN
28327/1: recv(7, 0xFFBFF697, 1, 0) Err#11 EAGAIN
28327/1: waitid(P_PID, 28330, 0xFFBFF500, WEXITED|WTRAPPED|WNOHANG) = 0
28327/1: send(7, " g p i n g\0", 6, 0) = 6
28327/2: nanosleep(0xFF07BF10, 0x00000000) = 0
28327/1: nanosleep(0xFFBFF6B0, 0x00000000) = 0
28327/1: read(5, 0xFFBFF2B0, 1024) Err#11 EAGAIN
28327/1: recv(7, " g", 1, 0) = 1
28327/1: recv(7, " o", 1, 0) = 1
28327/1: recv(7, " k", 1, 0) = 1
28327/1: recv(7, "\0", 1, 0) = 1
28327/1: recv(7, 0xFFBFF697, 1, 0) Err#11 EAGAIN
28327/1: waitid(P_PID, 28330, 0xFFBFF500, WEXITED|WTRAPPED|WNOHANG) = 0
28327/2: nanosleep(0xFF07BF10, 0x00000000) = 0
28327/1: nanosleep(0xFFBFF6B0, 0x00000000) = 0
28327/1: read(5, 0xFFBFF2B0, 1024) Err#11 EAGAIN
28327/1: recv(7, 0xFFBFF697, 1, 0) Err#11 EAGAIN
28327/1: waitid(P_PID, 28330, 0xFFBFF500, WEXITED|WTRAPPED|WNOHANG) = 0
28327/2: nanosleep(0xFF07BF10, 0x00000000) = 0
28327/1: nanosleep(0xFFBFF6B0, 0x00000000) = 0
28327/1: read(5, 0xFFBFF2B0, 1024) Err#11 EAGAIN
28327/1: recv(7, 0xFFBFF697, 1, 0) Err#11 EAGAIN
28327/1: waitid(P_PID, 28330, 0xFFBFF500, WEXITED|WTRAPPED|WNOHANG) = 0
28327/2: nanosleep(0xFF07BF10, 0x00000000) = 0
Der Output vom funktionierenden System sieht genauso aus.
Ich kann jetzt keine groeberen Unregelmaessigkeiten erkennen, noch kann ich aus dem Code von oben irgendwelche relevanten Rueckschluesse ziehen.
Kann jemand von Euch vll. etwas mit dem obrigen anfangen?
Danke Euch vielmals schon!
.
.
.
EDIT (autom. Beitragszusammenführung) :
.
Folgendes konnte ich noch beim Prozess:
Code:
/opt/se6000/java_1.5.0/usr/java//bin/java -DSUNWsefms=../ -Xms8m -Xmx128m -Djav
feststellen, wenn ich einen truss darauf mache.
Code:
23498/179: connect(15, 0xE857EF58, 32, SOV_DEFAULT) Err#150 EINPROGRESS
23498/179: pollsys(0xE857EE4C, 1, 0xE857EDD8, 0x00000000) = 1
23498/179: getsockopt(15, SOL_SOCKET, SO_ERROR, 0xE857EF78, 0xE857EE48, SOV_DEFAULT) = 0
23498/179: fcntl(15, F_GETFL) = 130
23498/179: fcntl(15, F_SETFL, FWRITE) = 0
23498/179: getsockname(15, 0xE857EF58, 0xE857EF7C, SOV_DEFAULT) = 0
23498/179: close(15) = 0
23498/179: so_socket(PF_INET6, SOCK_STREAM, IPPROTO_IP, "", SOV_DEFAULT) = 15
23498/179: getsockopt(15, SOL_SOCKET, SO_REUSEADDR, 0xE857EE30, 0xE857EE34, SOV_DEFAULT) = 0
23498/179: getsockopt(15, SOL_SOCKET, SO_TYPE, 0xE857EE30, 0xE857EE34, SOV_DEFAULT) = 0
23498/179: setsockopt(15, tcp, TCP_EXCLBIND, 0xE857EE30, 4, SOV_DEFAULT) = 0
23498/179: bind(15, 0xE857EEA0, 32, SOV_SOCKBSD) = 0
23498/179: getsockname(15, 0xE857EEA0, 0xE857EE9C, SOV_DEFAULT) = 0
23498/179: connect(15, 0xE857EC38, 32, SOV_DEFAULT) = 0
23498/179: send(15, "80\0\0 (", 4, 0) = 4
23498/179: send(15, " JAE / R\0\0\0\0\0\0\002".., 40, 0) = 40
23498/179: pollsys(0xE857E690, 1, 0xE857E608, 0x00000000) = 1
23498/179: read(15, "80\0\0 l", 4) = 4
23498/179: pollsys(0xE857E690, 1, 0xE857E608, 0x00000000) = 1
23498/179: read(15, " JAE / R\0\0\001\0\0\0\0".., 108) = 108
23498/179: send(15, "80\0\0 (", 4, 0) = 4
23498/179: send(15, " JAE / S\0\0\0\0\0\0\002".., 40, 0) = 40
23498/179: pollsys(0xE857E750, 1, 0xE857E6C8, 0x00000000) = 1
23498/179: read(15, "80\0 D (", 4) = 4
23498/179: pollsys(0xE857E750, 1, 0xE857E6C8, 0x00000000) = 1
23498/179: read(15, " JAE / S\0\0\001\0\0\0\0".., 17448) = 4096
23498/42: pollsys(0x00000000, 0, 0xEA57FC10, 0x00000000) = 0
23498/43: pollsys(0x00000000, 0, 0xE9F7F6B0, 0x00000000) = 0
23498/42: pollsys(0x00000000, 0, 0xEA57FC10, 0x00000000) = 0
23498/179: pollsys(0xE857E750, 1, 0xE857E6C8, 0x00000000) = 1
23498/179: read(15, "\0\0\002\0\0\0\b\0\0\003".., 13352) = 1460
23498/43: pollsys(0x00000000, 0, 0xE9F7F6B0, 0x00000000) = 0
23498/179: pollsys(0xE857E750, 1, 0xE857E6C8, 0x00000000) = 1
23498/179: read(15, "\0\0\0\v V N S U N ".., 11892) = 2636
23498/179: pollsys(0xE857E750, 1, 0xE857E6C8, 0x00000000) = 1
23498/179: read(15, "\0\0\001\0\0\001\0\0\018".., 9256) = 5556
23498/179: pollsys(0xE857E750, 1, 0xE857E6C8, 0x00000000) = 1
23498/179: read(15, "\0\001 h\0\0\0\0\0\0\0\0".., 3700) = 2636
23498/42: pollsys(0x00000000, 0, 0xEA57FC10, 0x00000000) = 0
23498/42: pollsys(0x00000000, 0, 0xEA57FC10, 0x00000000) = 0
23498/43: pollsys(0x00000000, 0, 0xE9F7F6B0, 0x00000000) = 0
23498/179: pollsys(0xE857E750, 1, 0xE857E6C8, 0x00000000) = 1
23498/179: read(15, "\0\0\0\002\0\0\0\0\007FE".., 1064) = 1064
23498/179: send(15, "80\0\0 (", 4, 0) = 4
23498/179: send(15, " JAE / T\0\0\0\0\0\0\002".., 40, 0) = 40
23498/42: pollsys(0x00000000, 0, 0xEA57FC10, 0x00000000) = 0
23498/42: pollsys(0x00000000, 0, 0xEA57FC10, 0x00000000) = 0
23498/43: pollsys(0x00000000, 0, 0xE9F7F6B0, 0x00000000) = 0
23498/42: pollsys(0x00000000, 0, 0xEA57FC10, 0x00000000) = 0
23498/179: pollsys(0xE857E7A0, 1, 0xE857E718, 0x00000000) = 1
23498/179: read(15, "80\0\0 ", 4) = 4
23498/42: pollsys(0x00000000, 0, 0xEA57FC10, 0x00000000) = 0
23498/43: pollsys(0x00000000, 0, 0xE9F7F6B0, 0x00000000) = 0
23498/179: pollsys(0xE857E7A0, 1, 0xE857E718, 0x00000000) = 1
23498/179: read(15, " JAE / T\0\0\001\0\0\0\0".., 32) = 32
23498/179: close(15) = 0
23498/179: so_socket(PF_INET6, SOCK_STREAM, IPPROTO_IP, "", SOV_DEFAULT) = 15
23498/179: fcntl(15, F_GETFL) = 2
23498/179: fcntl(15, F_SETFL, FWRITE|FNONBLOCK) = 0
23498/179: connect(15, 0xE857EFA8, 32, SOV_DEFAULT) Err#150 EINPROGRESS
23498/179: pollsys(0xE857EE9C, 1, 0xE857EE28, 0x00000000) = 1
23498/179: getsockopt(15, SOL_SOCKET, SO_ERROR, 0xE857EFC8, 0xE857EE98, SOV_DEFAULT) = 0
23498/179: fcntl(15, F_GETFL) = 130
23498/179: fcntl(15, F_SETFL, FWRITE) = 0
23498/179: getsockname(15, 0xE857EFA8, 0xE857EFCC, SOV_DEFAULT) = 0
23498/179: close(15) = 0
23498/42: pollsys(0x00000000, 0, 0xEA57FC10, 0x00000000) = 0
23498/179: so_socket(PF_INET6, SOCK_STREAM, IPPROTO_IP, "", SOV_DEFAULT) = 15
23498/179: fcntl(15, F_GETFL) = 2
23498/179: fcntl(15, F_SETFL, FWRITE|FNONBLOCK) = 0
23498/179: connect(15, 0xE857EE58, 32, SOV_DEFAULT) Err#150 EINPROGRESS
23498/179: pollsys(0xE857ED4C, 1, 0xE857ECD8, 0x00000000) = 1
23498/179: getsockopt(15, SOL_SOCKET, SO_ERROR, 0xE857EE78, 0xE857ED48, SOV_DEFAULT) = 0
23498/179: fcntl(15, F_GETFL) = 130
23498/179: fcntl(15, F_SETFL, FWRITE) = 0
23498/179: getsockname(15, 0xE857EE58, 0xE857EE7C, SOV_DEFAULT) = 0
23498/179: close(15) = 0
Ich bekomme regelmaessig den Errorcode Err#150 EINPROGRESS bei diesem Storage Manager Prozess zurueck und genau dann bricht die Verbindung ab.
Wie kann ich es verhindern, dass er auf dem Kanal in ein Timeout laeuft?
Zuletzt bearbeitet: