jmar83
Hans Müller
Hallo zusammen
Habe gerade festgestellt dass der in meiner Sun Ultra45 verbaute Broadcom BCM5715 ziemlich Probleme hat wenn man über einen POE (Power Over Ethernet)-Switch angebunden ist.
Das Problem tritt aber erst auf, wenn grössere Datenmengen fliessen, ein "unendlich-ping" bspw. reicht scheinbar nicht dazu.
Dabei verwende ich Debian Linux 7.9 (das Problem tritt beim original (3.2.x)- sowie beim backport (3.16.x)-Kernel auf. Der verwendete Switch ist ein "D-Link DGS-1210-10P".
Konkret ist das Problem bei apt-get aufgetreten, ich hatte zuerst bedenken dass es ein Hardware-Defekt ist, dann habe ich den anderen LAN-Port verwendet (ebenfalls mit POE), gleiches Problem.
Heute kam mir in den Sinn, dass das letzte Mal, als es keine Probleme gab, das Kabel an einem der 2 äusseren rechten Ports angeschlossen war - diese haben keine POE-Unterstützung...
Meldung hier:
Jan 17 04:48:01 ultra45 kernel: [ 388.165670] ------------[ cut here ]------------
Jan 17 04:48:01 ultra45 kernel: [ 388.220963] WARNING: at /build/linux-McQIIX/linux-3.2.73/net/sched/sch_generic.c:256 dev_watchdog+0x178/0x290()
Jan 17 04:48:01 ultra45 kernel: [ 388.341879] NETDEV WATCHDOG: eth0 (tg3): transmit queue 0 timed out
Jan 17 04:48:02 ultra45 kernel: [ 388.416874] Modules linked in: nfsd nfs nfs_acl auth_rpcgss fscache lockd sunrpc ext2 loop snd_usb_audio snd_usbmidi_lib snd_hwdep snd_rawmidi snd_seq_device snd_pcm snd_page_alloc snd_timer snd evdev soundcore flash ext4 crc16 jbd2 mbcache sd_mod crc_t10dif sg sr_mod cdrom ata_generic usbhid hid pata_ali libata ohci_hcd mptsas scsi_transport_sas mptscsih xhci_hcd ehci_hcd tg3 mptbase libphy scsi_mod usbcore usb_common [last unloaded: scsi_wait_scan]
Jan 17 04:48:02 ultra45 kernel: [ 388.946054] Call Trace:
Jan 17 04:48:02 ultra45 kernel: [ 388.976271] [0000000000465118] warn_slowpath_fmt+0x2c/0x3c
Jan 17 04:48:02 ultra45 kernel: [ 389.043978] [00000000006c5224] dev_watchdog+0x178/0x290
Jan 17 04:48:02 ultra45 kernel: [ 389.108566] [00000000004721d8] run_timer_softirq+0x250/0x344
Jan 17 04:48:02 ultra45 kernel: [ 389.178360] [000000000046b588] __do_softirq+0x104/0x210
Jan 17 04:48:02 ultra45 kernel: [ 389.242945] [000000000042a944] do_softirq+0x64/0x90
Jan 17 04:48:02 ultra45 kernel: [ 389.303356] [000000000046b86c] irq_exit+0x3c/0x94
Jan 17 04:48:02 ultra45 kernel: [ 389.361695] [000000000042e300] timer_interrupt+0xc0/0xdc
Jan 17 04:48:02 ultra45 kernel: [ 389.427320] [00000000004209d4] tl0_irq14+0x14/0x20
Jan 17 04:48:02 ultra45 kernel: [ 389.486700] [00000000005f77c8] find_next_bit+0x34/0xa8
Jan 17 04:48:02 ultra45 kernel: [ 389.550257] [00000000004381d8] touch_nmi_watchdog+0x70/0x90
Jan 17 04:48:02 ultra45 kernel: [ 389.618993] [000000000042ad7c] cpu_idle+0x4c/0x118
Jan 17 04:48:02 ultra45 kernel: [ 389.678370] [000000000092a618] after_lock_tlb+0x1b4/0x1cc
Jan 17 04:48:02 ultra45 kernel: [ 389.745039] [0000000080000000] 0x80000000
Jan 17 04:48:02 ultra45 kernel: [ 389.795032] ---[ end trace bbc0c6df2007000c ]---
Jan 17 04:48:03 ultra45 kernel: [ 389.851289] tg3 0000:07:04.0: eth0: transmit timed out, resetting
Jan 17 04:48:03 ultra45 kernel: [ 389.932509] tg3 0000:07:04.0: eth0: 0x00000000: 0x167814e4, 0x02b00006, 0x020000a2, 0x00804010
Jan 17 04:48:03 ultra45 kernel: [ 390.036717] tg3 0000:07:04.0: eth0: 0x00000010: 0x00400004, 0x00000000, 0x00310004, 0x00000000
Jan 17 04:48:03 ultra45 kernel: [ 390.140881] tg3 0000:07:04.0: eth0: 0x00000020: 0x00000000, 0x00000000, 0x00000000, 0x1678108e
Jan 17 04:48:03 ultra45 kernel: [ 390.245049] tg3 0000:07:04.0: eth0: 0x00000030: 0xc4af0000, 0x00000040, 0x00000000, 0x004001f9
Jan 17 04:48:03 ultra45 kernel: [ 390.349219] tg3 0000:07:04.0: eth0: 0x00000040: 0x00004807, 0x04430720, 0x40025001, 0x64002000
Jan 17 04:48:03 ultra45 kernel: [ 390.453385] tg3 0000:07:04.0: eth0: 0x00000050: 0x00985803, 0xd8723135, 0x00870005, 0xffff0000
Jan 17 04:48:03 ultra45 kernel: [ 390.557559] tg3 0000:07:04.0: eth0: 0x00000060: 0x00000003, 0x00000003, 0x90010298, 0x76148000
Jan 17 04:48:03 ultra45 kernel: [ 390.661726] tg3 0000:07:04.0: eth0: 0x00000070: 0x000000ea, 0x800000a7, 0x00000000, 0x00000000
Jan 17 04:48:03 ultra45 kernel: [ 390.765892] tg3 0000:07:04.0: eth0: 0x00000080: 0x167814e4, 0x800000f8, 0x04130036, 0x0408d082
Jan 17 04:48:04 ultra45 kernel: [ 390.870063] tg3 0000:07:04.0: eth0: 0x00000090: 0x01004f09, 0x00000000, 0x00000000, 0x00000009
Jan 17 04:48:04 ultra45 kernel: [ 390.974230] tg3 0000:07:04.0: eth0: 0x000000a0: 0x00000000, 0x00000141, 0x00000000, 0x00000198
Jan 17 04:48:04 ultra45 kernel: [ 391.078405] tg3 0000:07:04.0: eth0: 0x00000200: 0x00000000, 0x00000001, 0x00000000, 0x00000001
Jan 17 04:48:04 ultra45 kernel: [ 391.182569] tg3 0000:07:04.0: eth0: 0x00000210: 0x00000000, 0x00000001, 0x00000000, 0x00000001
Jan 17 04:48:04 ultra45 kernel: [ 391.286737] tg3 0000:07:04.0: eth0: 0x00000220: 0x00000000, 0x00000001, 0x00000000, 0x00000001
Jan 17 04:48:04 ultra45 kernel: [ 391.390906] tg3 0000:07:04.0: eth0: 0x00000230: 0x00000000, 0x00000001, 0x00000000, 0x00000001
Jan 17 04:48:04 ultra45 kernel: [ 391.495074] tg3 0000:07:04.0: eth0: 0x00000240: 0x00000000, 0x00000001, 0x00000000, 0x00000001
Jan 17 04:48:04 ultra45 kernel: [ 391.599243] tg3 0000:07:04.0: eth0: 0x00000250: 0x00000000, 0x4f0e6cd6, 0x00000014, 0x4f0e6cd6
Jan 17 04:48:07 ultra45 kernel: [ 394.724305] tg3 0000:07:04.0: eth0: 0x00000430: 0x00000000, 0x00000000, 0x0000008e, 0x000005f2
Jan 17 04:48:08 ultra45 kernel: [ 394.828474] tg3 0000:07:04.0: eth0: 0x00000440: 0x00000000, 0x00000000, 0x00000000, 0x0825c1e1
Jan 17 04:48:08 ultra45 kernel: [ 394.932642] tg3 0000:07:04.0: eth0: 0x00000450: 0x00000001, 0x000c0000, 0x00000000, 0x00000002
Jan 17 04:48:18 ultra45 kernel: [ 404.932845] tg3 0000:07:04.0: eth0: 0x00006800: 0x04130036, 0x0408d082, 0x01004f09, 0x10f0178b
Jan 17 04:48:18 ultra45 kernel: [ 405.037013] tg3 0000:07:04.0: eth0: 0x00006810: 0x81020000, 0xffffffff, 0x00000000, 0x00000000
Jan 17 04:48:18 ultra45 kernel: [ 405.141181] tg3 0000:07:04.0: eth0: 0x00006830: 0xfc003ccf, 0xfffc0fff, 0x00000000, 0x00000000
Jan 17 04:48:18 ultra45 kernel: [ 405.245350] tg3 0000:07:04.0: eth0: 0x00006840: 0x00000024, 0x00000001, 0x00000000, 0x00000000
Jan 17 04:48:18 ultra45 kernel: [ 405.349520] tg3 0000:07:04.0: eth0: 0x00007000: 0x00000188, 0x00000000, 0x00000000, 0x000000c0
Jan 17 04:48:18 ultra45 kernel: [ 405.453688] tg3 0000:07:04.0: eth0: 0x00007010: 0x0a000064, 0x02030273, 0x00570081, 0x68848353
Jan 17 04:48:18 ultra45 kernel: [ 405.557873] tg3 0000:07:04.0: eth0: 0: Host status block [00000001:000000720000:0142:0000)0142:0197)]
Jan 17 04:48:18 ultra45 kernel: [ 405.673488] tg3 0000:07:04.0: eth0: 0: NAPI info [00000071:00000071019e:0197:01ff):01410009:0000:0000:0000)]
Jan 17 04:48:19 ultra45 kernel: [ 405.898910] tg3 0000:07:04.0: tg3_stop_block timed out, ofs=2c00 enable_bit=2
Jan 17 04:48:19 ultra45 kernel: [ 406.088691] tg3 0000:07:04.0: tg3_stop_block timed out, ofs=4800 enable_bit=2
Jan 17 04:48:19 ultra45 kernel: [ 406.189922] tg3 0000:07:04.0: eth0: Link is down
In dem Moment wo das Problem auftaucht, bleibt der blinkende Cursor in der Konsole kurz stehen.
Wenn ich das Kabel kurz rausziehe und wieder einstecke, bringt dies auch nichts.
Ein "ifdown" lässt dann das ganze System crashen mit einem "Highest Priority Error", zwar ist man dann später wieder in der Konsole (nach ein paar Sekunden beängstigender Fehlermeldungen), allerdings ist es dann quasi "tot", init x und shutdown und das alles geht dann nicht mehr.
Nebenfrage: Könnte es sein, dass man einen älteren oder inkompatiblen Ethernet-Controller mit POE schrotten kann? Irgendwie scheint mir ich wäre noch "glimpflich" davongekommen, das System hat zumindest sehr heftig drauf reagiert bei "ifdown". (Die Meldungen erschienen mir fast wie bei einem Hardware-Defekt!!)
Ist das Problem jemandem bekannt und gibt es evtl. eine Lösung? Wenn nicht auch nicht sooooooooo schlimm, mit meinem Post weise ich zumindest drauf hin was die Ursache ist. (Falls jemand anderes das auch hat)
Total strange ist das ganze jedenfalls...!!! ;-)
Habe gerade festgestellt dass der in meiner Sun Ultra45 verbaute Broadcom BCM5715 ziemlich Probleme hat wenn man über einen POE (Power Over Ethernet)-Switch angebunden ist.
Das Problem tritt aber erst auf, wenn grössere Datenmengen fliessen, ein "unendlich-ping" bspw. reicht scheinbar nicht dazu.
Dabei verwende ich Debian Linux 7.9 (das Problem tritt beim original (3.2.x)- sowie beim backport (3.16.x)-Kernel auf. Der verwendete Switch ist ein "D-Link DGS-1210-10P".
Konkret ist das Problem bei apt-get aufgetreten, ich hatte zuerst bedenken dass es ein Hardware-Defekt ist, dann habe ich den anderen LAN-Port verwendet (ebenfalls mit POE), gleiches Problem.
Heute kam mir in den Sinn, dass das letzte Mal, als es keine Probleme gab, das Kabel an einem der 2 äusseren rechten Ports angeschlossen war - diese haben keine POE-Unterstützung...
Meldung hier:
Jan 17 04:48:01 ultra45 kernel: [ 388.165670] ------------[ cut here ]------------
Jan 17 04:48:01 ultra45 kernel: [ 388.220963] WARNING: at /build/linux-McQIIX/linux-3.2.73/net/sched/sch_generic.c:256 dev_watchdog+0x178/0x290()
Jan 17 04:48:01 ultra45 kernel: [ 388.341879] NETDEV WATCHDOG: eth0 (tg3): transmit queue 0 timed out
Jan 17 04:48:02 ultra45 kernel: [ 388.416874] Modules linked in: nfsd nfs nfs_acl auth_rpcgss fscache lockd sunrpc ext2 loop snd_usb_audio snd_usbmidi_lib snd_hwdep snd_rawmidi snd_seq_device snd_pcm snd_page_alloc snd_timer snd evdev soundcore flash ext4 crc16 jbd2 mbcache sd_mod crc_t10dif sg sr_mod cdrom ata_generic usbhid hid pata_ali libata ohci_hcd mptsas scsi_transport_sas mptscsih xhci_hcd ehci_hcd tg3 mptbase libphy scsi_mod usbcore usb_common [last unloaded: scsi_wait_scan]
Jan 17 04:48:02 ultra45 kernel: [ 388.946054] Call Trace:
Jan 17 04:48:02 ultra45 kernel: [ 388.976271] [0000000000465118] warn_slowpath_fmt+0x2c/0x3c
Jan 17 04:48:02 ultra45 kernel: [ 389.043978] [00000000006c5224] dev_watchdog+0x178/0x290
Jan 17 04:48:02 ultra45 kernel: [ 389.108566] [00000000004721d8] run_timer_softirq+0x250/0x344
Jan 17 04:48:02 ultra45 kernel: [ 389.178360] [000000000046b588] __do_softirq+0x104/0x210
Jan 17 04:48:02 ultra45 kernel: [ 389.242945] [000000000042a944] do_softirq+0x64/0x90
Jan 17 04:48:02 ultra45 kernel: [ 389.303356] [000000000046b86c] irq_exit+0x3c/0x94
Jan 17 04:48:02 ultra45 kernel: [ 389.361695] [000000000042e300] timer_interrupt+0xc0/0xdc
Jan 17 04:48:02 ultra45 kernel: [ 389.427320] [00000000004209d4] tl0_irq14+0x14/0x20
Jan 17 04:48:02 ultra45 kernel: [ 389.486700] [00000000005f77c8] find_next_bit+0x34/0xa8
Jan 17 04:48:02 ultra45 kernel: [ 389.550257] [00000000004381d8] touch_nmi_watchdog+0x70/0x90
Jan 17 04:48:02 ultra45 kernel: [ 389.618993] [000000000042ad7c] cpu_idle+0x4c/0x118
Jan 17 04:48:02 ultra45 kernel: [ 389.678370] [000000000092a618] after_lock_tlb+0x1b4/0x1cc
Jan 17 04:48:02 ultra45 kernel: [ 389.745039] [0000000080000000] 0x80000000
Jan 17 04:48:02 ultra45 kernel: [ 389.795032] ---[ end trace bbc0c6df2007000c ]---
Jan 17 04:48:03 ultra45 kernel: [ 389.851289] tg3 0000:07:04.0: eth0: transmit timed out, resetting
Jan 17 04:48:03 ultra45 kernel: [ 389.932509] tg3 0000:07:04.0: eth0: 0x00000000: 0x167814e4, 0x02b00006, 0x020000a2, 0x00804010
Jan 17 04:48:03 ultra45 kernel: [ 390.036717] tg3 0000:07:04.0: eth0: 0x00000010: 0x00400004, 0x00000000, 0x00310004, 0x00000000
Jan 17 04:48:03 ultra45 kernel: [ 390.140881] tg3 0000:07:04.0: eth0: 0x00000020: 0x00000000, 0x00000000, 0x00000000, 0x1678108e
Jan 17 04:48:03 ultra45 kernel: [ 390.245049] tg3 0000:07:04.0: eth0: 0x00000030: 0xc4af0000, 0x00000040, 0x00000000, 0x004001f9
Jan 17 04:48:03 ultra45 kernel: [ 390.349219] tg3 0000:07:04.0: eth0: 0x00000040: 0x00004807, 0x04430720, 0x40025001, 0x64002000
Jan 17 04:48:03 ultra45 kernel: [ 390.453385] tg3 0000:07:04.0: eth0: 0x00000050: 0x00985803, 0xd8723135, 0x00870005, 0xffff0000
Jan 17 04:48:03 ultra45 kernel: [ 390.557559] tg3 0000:07:04.0: eth0: 0x00000060: 0x00000003, 0x00000003, 0x90010298, 0x76148000
Jan 17 04:48:03 ultra45 kernel: [ 390.661726] tg3 0000:07:04.0: eth0: 0x00000070: 0x000000ea, 0x800000a7, 0x00000000, 0x00000000
Jan 17 04:48:03 ultra45 kernel: [ 390.765892] tg3 0000:07:04.0: eth0: 0x00000080: 0x167814e4, 0x800000f8, 0x04130036, 0x0408d082
Jan 17 04:48:04 ultra45 kernel: [ 390.870063] tg3 0000:07:04.0: eth0: 0x00000090: 0x01004f09, 0x00000000, 0x00000000, 0x00000009
Jan 17 04:48:04 ultra45 kernel: [ 390.974230] tg3 0000:07:04.0: eth0: 0x000000a0: 0x00000000, 0x00000141, 0x00000000, 0x00000198
Jan 17 04:48:04 ultra45 kernel: [ 391.078405] tg3 0000:07:04.0: eth0: 0x00000200: 0x00000000, 0x00000001, 0x00000000, 0x00000001
Jan 17 04:48:04 ultra45 kernel: [ 391.182569] tg3 0000:07:04.0: eth0: 0x00000210: 0x00000000, 0x00000001, 0x00000000, 0x00000001
Jan 17 04:48:04 ultra45 kernel: [ 391.286737] tg3 0000:07:04.0: eth0: 0x00000220: 0x00000000, 0x00000001, 0x00000000, 0x00000001
Jan 17 04:48:04 ultra45 kernel: [ 391.390906] tg3 0000:07:04.0: eth0: 0x00000230: 0x00000000, 0x00000001, 0x00000000, 0x00000001
Jan 17 04:48:04 ultra45 kernel: [ 391.495074] tg3 0000:07:04.0: eth0: 0x00000240: 0x00000000, 0x00000001, 0x00000000, 0x00000001
Jan 17 04:48:04 ultra45 kernel: [ 391.599243] tg3 0000:07:04.0: eth0: 0x00000250: 0x00000000, 0x4f0e6cd6, 0x00000014, 0x4f0e6cd6
Jan 17 04:48:07 ultra45 kernel: [ 394.724305] tg3 0000:07:04.0: eth0: 0x00000430: 0x00000000, 0x00000000, 0x0000008e, 0x000005f2
Jan 17 04:48:08 ultra45 kernel: [ 394.828474] tg3 0000:07:04.0: eth0: 0x00000440: 0x00000000, 0x00000000, 0x00000000, 0x0825c1e1
Jan 17 04:48:08 ultra45 kernel: [ 394.932642] tg3 0000:07:04.0: eth0: 0x00000450: 0x00000001, 0x000c0000, 0x00000000, 0x00000002
Jan 17 04:48:18 ultra45 kernel: [ 404.932845] tg3 0000:07:04.0: eth0: 0x00006800: 0x04130036, 0x0408d082, 0x01004f09, 0x10f0178b
Jan 17 04:48:18 ultra45 kernel: [ 405.037013] tg3 0000:07:04.0: eth0: 0x00006810: 0x81020000, 0xffffffff, 0x00000000, 0x00000000
Jan 17 04:48:18 ultra45 kernel: [ 405.141181] tg3 0000:07:04.0: eth0: 0x00006830: 0xfc003ccf, 0xfffc0fff, 0x00000000, 0x00000000
Jan 17 04:48:18 ultra45 kernel: [ 405.245350] tg3 0000:07:04.0: eth0: 0x00006840: 0x00000024, 0x00000001, 0x00000000, 0x00000000
Jan 17 04:48:18 ultra45 kernel: [ 405.349520] tg3 0000:07:04.0: eth0: 0x00007000: 0x00000188, 0x00000000, 0x00000000, 0x000000c0
Jan 17 04:48:18 ultra45 kernel: [ 405.453688] tg3 0000:07:04.0: eth0: 0x00007010: 0x0a000064, 0x02030273, 0x00570081, 0x68848353
Jan 17 04:48:18 ultra45 kernel: [ 405.557873] tg3 0000:07:04.0: eth0: 0: Host status block [00000001:000000720000:0142:0000)0142:0197)]
Jan 17 04:48:18 ultra45 kernel: [ 405.673488] tg3 0000:07:04.0: eth0: 0: NAPI info [00000071:00000071019e:0197:01ff):01410009:0000:0000:0000)]
Jan 17 04:48:19 ultra45 kernel: [ 405.898910] tg3 0000:07:04.0: tg3_stop_block timed out, ofs=2c00 enable_bit=2
Jan 17 04:48:19 ultra45 kernel: [ 406.088691] tg3 0000:07:04.0: tg3_stop_block timed out, ofs=4800 enable_bit=2
Jan 17 04:48:19 ultra45 kernel: [ 406.189922] tg3 0000:07:04.0: eth0: Link is down
In dem Moment wo das Problem auftaucht, bleibt der blinkende Cursor in der Konsole kurz stehen.
Wenn ich das Kabel kurz rausziehe und wieder einstecke, bringt dies auch nichts.
Ein "ifdown" lässt dann das ganze System crashen mit einem "Highest Priority Error", zwar ist man dann später wieder in der Konsole (nach ein paar Sekunden beängstigender Fehlermeldungen), allerdings ist es dann quasi "tot", init x und shutdown und das alles geht dann nicht mehr.
Nebenfrage: Könnte es sein, dass man einen älteren oder inkompatiblen Ethernet-Controller mit POE schrotten kann? Irgendwie scheint mir ich wäre noch "glimpflich" davongekommen, das System hat zumindest sehr heftig drauf reagiert bei "ifdown". (Die Meldungen erschienen mir fast wie bei einem Hardware-Defekt!!)
Ist das Problem jemandem bekannt und gibt es evtl. eine Lösung? Wenn nicht auch nicht sooooooooo schlimm, mit meinem Post weise ich zumindest drauf hin was die Ursache ist. (Falls jemand anderes das auch hat)
Total strange ist das ganze jedenfalls...!!! ;-)