Echtzeit-Monitoring gesucht

bitmuncher

bitmuncher

Foren Gott
Hat jemand Tipps bezüglich eines Echtzeit-Monitorings für Server? Überwacht werden sollen vor allem diverse Werte via SNMP (LoadAvg, CPU-Usage etc.) und IPMI (Hardware-Parameter wie Fan-Speed, Temperatur etc.), sowie das Verhalten einiger Prozesse und das Auftreten bestimmter Log-Meldungen. Die Check-Intervalle müssen, wenn schon nicht in Echtzeit, dann wenigstens in Zeiten unter einer Sekunde möglich sein. Check-Intervalle zwischen 200 und 500 Millisekunden sind das Maximum. Bin für jeden Hinweis dankbar. :)
 
Du kennst schon alle Tools zum Thema "Echtzeit"-Monitoring, ganz sicher, sonst bin ich von dir entäuscht *gg*

Also heartbeat würde ich nutzen um zu sehen ob der Server überhaupt lebt. Dann gibt es etliche S.M.A.R.T Tools fürs auslesen der Temperaturen von Festplatten. Für die CPU gibt es "lm_sensors".

Das überwachen von Log-Files nach $X Muster kannst du mit Bash (tail, grep, mail, usw) sehr einfach realisieren (du weißt schon wie ;) ).

Aber um auf den ersten Satz einzugehen: Das ist alles sicher nicht das was du suchst, daher vergiss den Post einfach :D
 
Ja, leider ist es nicht das, was ich suche. Das Hardware-Monitoring kann bzw. will ich über IPMI machen. Darüber kann ich auch abfragen ob ein Server noch läuft usw.. Was ich suche ist etwas wie Nagios mit Nagiosgrapher nur eben mit Check-Intervallen kleiner als eine Sekunde.
 
Einfach nur aus Neugierde: Wofür braucht man sowas?
 
Ja, leider ist es nicht das, was ich suche. Das Hardware-Monitoring kann bzw. will ich über IPMI machen. Darüber kann ich auch abfragen ob ein Server noch läuft usw.. Was ich suche ist etwas wie Nagios mit Nagiosgrapher nur eben mit Check-Intervallen kleiner als eine Sekunde.

http://www.nagios-portal.org/wbb/index.php?page=Thread&threadID=3529
http://nagios.sourceforge.net/docs/2_0/checkscheduling.html
Das vllt?

Ich hab jetzt einfach mal nach "nagios check intervall" gegoogelt.
 
@Tomekk228: Das Problem bei Nagios ist einfach, dass die minimalen Check-Intervalle zu hoch sind (mindestens 1 min) und Plugins wie check_jmx auch nicht unbedingt dazu geeignet sind eine Echtzeit-Überwachung zu machen, da sie sich nach jedem Check vom JMX wieder abmelden. Das Tool müsste schon jeden Service in einem eigenen Thread überwachen und die Verbindung zum IPMI-Daemon, zum JMX usw. halten.

@Maledictus: Zur Überwachung eines Tomcat-Clusters, bei dem Abweichungen von >1s zu Problemen führen können und daher umfassend ausgewertet werden müssen.
 
Hi,

ohne wirklich Ahnung von dem Thema zu haben, ein kurzes 'apt-cache search ipmi' spuckt unter anderem collectd aus (http://collectd.org/). Soweit ich es verstehe erfuellt es noch nicht ganz deine Anforderungen, koennte aber schon in die richtige Richtung gehen. Wie tief sich die Intervalle genau schrauben lassen, steht auf der Website aber leider nicht, nur dass das standard Intervall 10s ist.

Ansonsten koennte diese Wikipedia Liste auch noch einen Blick Wert sein, falls du sie noch nicht abgegrast haben solltest:
http://en.wikipedia.org/wiki/Comparison_of_network_monitoring_systems

Vielleicht ist da ja was bei, mehr Ideen hab ich dann leider auch nicht.

mfg,
bytepool
 
collectd hat leider auch das Problem, dass es mit rrdtool arbeitet. Allein darin liegt meiner Meinung nach schonmal eine Schwäche, da der Zugriff auf RRDs viel zu langsam ist um damit im Millisekunden-Bereich effektiv zu messen. Eine DB-basierte Lösung scheint mir da sinnvoller zu sein, da die Verbindung zur DB gehalten werden kann und nicht jedes Mal neu aufgebaut werden muss. Ich glaube sonst bekommt man so kurze Check-Intervalle nicht zustande.

Die Liste ist mir aber neu. Da werde ich die, die ich noch nicht kenne, mal in Augenschein nehmen. Danke für den Hinweis. :)
 
OpenNMS kannst du im Millisekundenbereich fahren, überwache so die Nodes unserers Mailclusters.
 
monit kannste auch mal versuchen .... wobei monit auf jedem host läuft, was mir persönlich zu unsicher ist, denn wenn der host abschmiert, bekommste keine nachricht mehr ....

Sonst sehe ich auch nur die möglichkeit mit heartbeat, bzw der nachfolger, der auch clusterfähig ist ... name fällt mir gerade nicht ein
 
OpenNMS sieht schonmal sehr gut aus. Ich schau mir gerade an, ob ich damit alle Services unter ein Dach bekommen kann. :)
 
OpenNMS sieht schonmal sehr gut aus. Ich schau mir gerade an, ob ich damit alle Services unter ein Dach bekommen kann. :)

Mit OpenNMS kannst eigentlich alles Monitoren da es in einer Java-ähnlichen Sprache komplett angepasst werden kann. Ansonsten gibts noch zabbix, kann auch in beinahe Realtime laufen, weiß ich aber jetzt nicht ob die Funktionalität für dich ausreicht. Jedenfalls ist es um einiges benutzerfreundlicher wie OpenNMS, hab für OpenNMS mehr als ein Jahr Einarbeitungszeit gebraucht..
 

Ähnliche Themen

Squid nur zum maskieren der eigenen IP, nicht für Webserver auf port 80

Zurück
Oben