mastermind
Grünschnabel
Hi,
in hoffnung das mir irgendwer einen weiteren Anhlatspunkt geben kann :-). Auf einem DL380 G5 mit 16 GB ram und 2xDual-Core 3,0 GHz läuft ein Vserver-kernel (von http://linux-vserver.org/). Es sind mittlerweile 70 vserver Produktiv drauf installiert. in einem unregelmäßigen zeitabstand von 30 min bis 1h (manchmal noch höher frequnziert manchmal niedriger) schiesst die Load auf $hohezahl (bis zu 500) und nichts geht mehr. Jeder Prozess muss auf CPU-Zeit warten, demenstsprechend ist debuggin auch schwer. Was ich mittlerweile mit einigen Tool rausfinden konnte ist wie im Betreff erwähnt, das es sich hier um eine 100 %tige CPU Auslatung von allen 4 kernen handelt. Die CPU Zeit wieder aber nicht im Userspace verbraucht sondern ist kernel CPUZEIT (also systemcalls usw.)
avg-cpu: %user %nice %system %iowait %steal %idle
0.00 0.25 99.75 0.00 0.00 0.00
Hat jmd von euch eine vernünftige Möglichkeit hier herrauszufinden welche Systemcalls die CPU dicht machen, bzw. welcher Userland prozess soviel kernellast erzeugt, dass alle CPUs dabei drauf gehen.
Ach übrigens bevor mich jmd frag, hier läuft ein alter 2.4.37 Kernel :-).
in hoffnung das mir irgendwer einen weiteren Anhlatspunkt geben kann :-). Auf einem DL380 G5 mit 16 GB ram und 2xDual-Core 3,0 GHz läuft ein Vserver-kernel (von http://linux-vserver.org/). Es sind mittlerweile 70 vserver Produktiv drauf installiert. in einem unregelmäßigen zeitabstand von 30 min bis 1h (manchmal noch höher frequnziert manchmal niedriger) schiesst die Load auf $hohezahl (bis zu 500) und nichts geht mehr. Jeder Prozess muss auf CPU-Zeit warten, demenstsprechend ist debuggin auch schwer. Was ich mittlerweile mit einigen Tool rausfinden konnte ist wie im Betreff erwähnt, das es sich hier um eine 100 %tige CPU Auslatung von allen 4 kernen handelt. Die CPU Zeit wieder aber nicht im Userspace verbraucht sondern ist kernel CPUZEIT (also systemcalls usw.)
avg-cpu: %user %nice %system %iowait %steal %idle
0.00 0.25 99.75 0.00 0.00 0.00
Hat jmd von euch eine vernünftige Möglichkeit hier herrauszufinden welche Systemcalls die CPU dicht machen, bzw. welcher Userland prozess soviel kernellast erzeugt, dass alle CPUs dabei drauf gehen.
Ach übrigens bevor mich jmd frag, hier läuft ein alter 2.4.37 Kernel :-).