Netzwerk überwachen und Missstände erkennen

Hobbystern

Hobbystern

Wahl-Debianer
Moin Gemeinde,

ich habe als Nebenaufgabe unser Handwerksnetz und dessen Pflege.
Unternehmen mit Filialbetrieb (VPN) und Produktionsbetrieb.
Aktuell gibt es knapp 100 Netzwerkgeräte im lokalen Netz und je Filialnetz ca. 10 Geräte.

Alles ist dokumentiert und alles hat Regeln.

Lokal ist 10.0.0.x
zBsp. VoIP Geräte liegen auf 10.0.0.180-199
Drucker auf 10.0.0.17x
etc

Remote VPN sind unter 10.x.0.1 ff.

Ich lasse Nagios laufen (3.x) und liebe dieses Tool, Arpwatch erkennt neue IPs, welche da nicht sein sollten oder IP <> MAC Ändereungen und mailt mir diese zu.

Neulich gab es ein "falsch gestecktes Netzwerkkabel" durch einen Monteur für Industriemaschinen, der verband einen Switch doppelt mit dem anderen. Hat ewig gedauert, bis ich das gefunden habe.

Gibt es ein einfach zu handhabendes Service-Tool, ähnlich Nagios (oder eine bessere Administrationsoberfläche), welches ggf. auch solche Missstände erkennt und mich warnt?

Denn unterm Strich, möchte ich gerne diese Zusatzaufgabe nach 19 jahren gerne abgeben können, daher auch die klare Struktur bei allen Geräten..

Freue mich auf Eure Meinung / Erlebnisse...!
Grüsse und schönes WE!

Stefan
 
Für Schleifenerkennung kenne ich selbst nichts.

Bzgl. Netzwerkmonitoring bin ich mit Check_MK ganz glücklich. Da ist viel automatische Erkennung von Diensten mit drin(z. B. Schnittstellenfehlerzähler, Schnittstellen up+down Anzeige/überwachung, Trafficmessung auf den Ports).

https://mathias-kettner.de/

Check_MK verwendet als Unterbau entweder Nagios oder Icinga-1.

Es ist ein Monitoring-System für Netzwerke und Server. Es kann sehr viel. Die Lernkurve ist sehr angenehm. Man kommt ohne großes Wissen auch schon weit, kann sich aber auf Wunsch noch viel tiefer einarbeiten. Es gibt vieles was man irgendwann mal brauchen kann(Abfrage-Sprache für die Monitoringdaten. API zum Einrichten. Flexible Arten Checks selbst zu schreiben. ...).

Es gibt eine kostenfreie(Open Source) und eine kommerzielle Variante. Ich habe hier eine 3 stellige Anzahl an Servern und hohe 4 Stellige Anzahl an überwachten Diensten und nutze die Open Source Variante. Was in der Open Source Variante fehlt ist das Reporting(PDF-Reports) und der schnelle Check_MK Micro Core, mit dem man wesentlich mehr Dienste auf der gleichen Hardware überwachen kann.
 
Wenn er schon ein Nagios im Einsatz hat wird ihm der Umstieg auf CheckMK nicht viel bringen.

Das was der TE will - lässt sich mMn. auch nicht automatisiert erreichen. Eher durch restriktive Konfiguration - z.B. nur die auch benötigten Switch-Ports am Switch auch wirklich freigeben / aktivieren und so verhindern, daß ein versehentlich gesteckter Loop Auswirkungen hat.
... ggf. dann noch ein erweitertes Monitoring auf die einzelnen SwitchPorts - sprich "Kabel gesteckt".

Ob der Zugewinn den Aufwand rechtfertigt ist ggf. fraglich und zu prüfen :-)
 
Wenn er schon ein Nagios im Einsatz hat wird ihm der Umstieg auf CheckMK nicht viel bringen.

Nagios mit und ohne Check_MK: Da sind Welten dazwischen! Meiner Meinung nach wäre das ein Schritt in die Richtung, dass die Schwelle für andere dort einzusteigen sehr gesenkt wird.

Aber je nachdem wie individuell das bisherige Nagios gebaut ist, ist dass natürlich auch evtl. kein kleiner Aufwand.
 
in der Konfiguration und der Oberfläche - ja.

in den Features, was die Möglichkeiten der zu überwachten Geräte angeht - mMn. nein.

(wobei ich mir den direkten Vergleich schon längers nicht mehr gegeben habe - mag sein, daß sich da in den letzten 1,2 Jahren einiges getan hat, "den großen Wurf" würde ich aber nicht erwarten - zudem - ein gut laufendes Montoring-System tauscht man nicht mal einfach so aus im prod. Betrieb...)
 
Ich habe mit der 1.2er vor ein paar Jahren angefangen. Die höheren 1.2.x-er Versionen waren schon richtig gut. Irgendwann auf die 1.4 hochgezogen. Hier war es die Umarbeitung der Alarmierung, die sich wesentlich verbessert hat. Waren ansonsten eigentlich keine dramatischen Geschichten dabei. Die aktuelle 1.5er kenne ich nicht. Vom lesen her war vielleicht nochmal das ein oder andere nette Bonbon dabei aber auch nix weltbewegendes.

Für mich ist plain - Nagios pain in the ass. Das würde ich niemals (wieder) tun, nachdem ich es einmal gehabt habe. Ich hatte es vor dem Umstieg auf check_mk. Das jetzige System(check_mk) ist dem vorigen(plain Nagios) in jeder Hinsicht überlegen und hat vieles gebracht, was im Alltag einfach nur vieles erleichtert hat und Gold wert ist.

Wenn es wirklich gut läuft, dann hat man natürlich keine Lust es auszutauschen. Und so etwas macht ja üblicherweise auch eher weniger der scheidende Admin, der sich das jahrelang in liebevoller Mühe angepasst hat, wie er es wirklich gut findet, als eher der Neue, der ob der vielen Eigenheiten eher schockiert ist und alles besser machen will.

@marce: So wie Du schreibst, frage ich mich ob Du jemals daß eine oder das andere wirklich verwendet hast. Featurelisten oder Webseiten lesen auf der einen Seite und produktiv einsetzen andererseits sind zwei verschiedene Paar Schuhe.
 
Nagios / Icinga 1.x habe ich seit ca. 15 Jahren im Einsatz. Den Umstieg auf die 2er habe ich aktuell immer noch gescheut bzw. sehe aktuell keinen direkten Mehrwert darin.

"Eben weil" bei Nagios die Konfig immer "recht aufwändig" ist schaue ich mir aber regelmäßig (so alle 2 Jahre - weil das kostet dann immer gleich mal 6 Monate, bis man da mit allen Tests und Kandidaten durch ist...) Alternativen an - erst mal in einer lokalen Mini-Installation, dann evtl. wenn es nicht komplett direkt "versagt" in einem kleinen Test-Netz mit ein ein paar Hosts - und evtl. auch mal parallel auf den Produktionssystemen.

Monit, Bloonix, Zabbix, CheckMK und ein paar weitere, an die ich mich gerade nicht mehr erinnern kann waren im letzten Durchlauf enthalten.

Für Neueinsteiger - würde ich auch nicht Icinga / Nagios 1.x verwenden oder empfehlen - ich finde aber, für einen Umstieg muss der Mehrwert der Alternative (und zugegeben, das ist jeweils eine sehr "lokale" oder persönliche Definition, worin dieser liegt) hinreichend groß sein.
 
Schön zu lesen, dass Du also weisst, wovon Du redest.

Abgesehen von der Tatsache, dass eine Monitoring-Umstellung also schwierig ist und dass man also nicht unbedingt mehr als ein Monitoring-System pflegen möchte, hier nochmal die Gedanken, warum ich das genannte System in der konkreten Fragestellung als hilfreich erachte.

Die Fragestellung ist ja: Gibt es ein System mit Oberfläche, dass Netzwerkprobleme einfach darstellt und eine Unterstützung im Fehlerfall ist?

Was ich bzgl. Check_MK, da im Sinn habe:
  • Es bietet viele sinnvolle Voreinstellungen, die nach Aufnahme der entsprechenden System automatisch erkannt und bei Fehlern angezeigt werden(Z. B. Portstatus, Portgeschwindigkeit(Wechseln der Portgeschwindigkeit deutet auf Verkabelungsprobleme hin), Portfehlerrate, Trafficauslastung, CPU-Auslastung von Routern und Switchen).
  • Es bietet automatische Erkennung über von Systemen angebotenen Leistungs- und Warnungsindikatoren(speziell auch bei SNMP).
  • Die Integration in Serversysteme ist wieder ein bisschen aufwändiger, da pro Server der Agent installiert werden muss. Der Vorteil hier ist natürlich auch, durch die ganzen automatisch ermittelten Standardkennzahlen(RAM-Verbrauch, I/O-Last, CPU-Load, CPU-Auslastung) im Fehlerfall ein umfassendes Bild der in den Fehler involvierten Systeme zu haben und vor allem auch das Gesamte System im Blick zu haben und nicht einzelne Elemente hinten runter fallen zu lassen. Werte bei denen man sich dann denkt: Hätte ich das vor 3 Tagen gewusst, dann hätte ich mir den ganzen unnötigen Aufwand gespart.
  • Sehr gute grafische Aufbereitung der Performancedaten auch in der Historie(PNP4Nagios). Auf die Art und Weise kann man erkennen, ob sich z. B. eine Last eines Gerätes im Laufe der Zeit entwickelt oder ob es sich ein um irregulär aufgetretenes Störungsbild handelt.
Off-Topic

Wie Du allerdings vom Funktionsumfang Check-MK und Nagios gleichstellen kannst, wundert mich doch sehr, da ersteres, von der Funktionsvielfalt immens mehr mitbringt und auch von der Benutzbarkeit um Welten woanders steht, auch wenn Check_MK unten drunter einen Nagios-Core verwendet bzw. verwenden kann. Wenn es um ein Monitoring-System geht, dass gut handhabbar ist und viel Funktionalität bietet und Leute hat, die noch keine Profis in einem anderen Monitoring-System sind, dann ist Check_MK für kleinere bis mittlere Umgebungen für mich das beste, was es im Open Source Bereich gibt. Dass da unten drunter der alte Core von Nagios oder Icinga 1 werkelt, finde ich dabei erst einmal unerheblich.

Icinga 2 ist allerdings hat hinsichtlich der Ausrichtung auf technologisch exzellente Umsetzung, Offenheit, Integrationsfähigkeit und Performance deutlich die Nase vorn und wird wahrscheinlich in der mittleren Zukunft Check_MK auch in dessen Kernstärken überholen, sowie wie vermutlich viele anderen in dem Bereich.

Monit, Bloonix, Zabbix, CheckMK...

Wenn Du Dir die Systeme angeschaut hast, würde mich Deine Meinung und Deine Erkenntnisse dazu interessieren.

Mit Zabbix konnte ich mich so überhaupt nicht anfreunden. Das Web-UI war einfach nur extrem grausam und unbenutzbar für mich.
 
Zuletzt bearbeitet:
Eine Antwort auf deine Frage muss ich Dir erst mal schuldig bleiben (kommt aber noch - bin nur heute erst aus dem Urlaub zurück und darf mich nun erst mal durch 3 Wochen Mail- und todo-Historie kämpfen) - aber nebenbei als Tipp für den TE:

Was für Switche habt ihr denn im Einsatz? Von vielen "ernsthaften" Herstellern gibt's Management-Tools, mit denen man die Netzwerktopologie recht umfangreich sowohl überwachen als auch konfigurieren kann. Bedingt natürlich, daß da eben einigermaßen einheitlich managed-Switche eines solchen Herstellers verbaut sind...
 
Hallo Ihr zwei,

Danke für die Rückmeldung.
Ich habe mir check_mx mal auf einer virtuellen Kiste angesehen und in der RAW Version somit Nagios mit Oberfläche gefunden, sieht gut aus - ist gut und einfach.

Größter Wehrmutstropfen, welchen ich aktuell nicht lösen kann: "Gibt es da keine App?" J

Ich lebe und liebe meine "aNAG" - App, welche mir den Status aller WARN ERR etc. mal eben auf das Handy pushed (und nebenher auch auf das anderer Mitarbeiter, wenn es ihr Zirkus ist) - das habe ich versucht mit check_mk zu adaptieren, es ist ja Nagios..aber bisher erfolglos.

Was für Switche habt ihr denn im Einsatz? Von vielen "ernsthaften" Herstellern gibt's Management-Tools, mit denen man die Netzwerktopologie recht umfangreich sowohl überwachen als auch konfigurieren kann. Bedingt natürlich, daß da eben einigermaßen einheitlich managed-Switche eines solchen Herstellers verbaut sind...

Habe ich selbstredend verbaut, mit Nagios 3.x habe ich bisher nie SNMP abgefragt, das hat check_mk ja out of the box gut im Griff...anbei habe ich Nagios hier seit 2006, also mittlerweile auch ein paar Jahre, allerdings nur command-line im Einsatz. Seit 2011 mit App und das war eigentlich der Durchbruch.

Als einfachste "physische" Gegenmaßnahme zum "Stecker stecken" hat jedes Kabel nun einen kleinen roten Anhänger erhalten, Nummer und Namen drauf. Fehlt ein Anhänger weiß man immerhin schonmal das da was nicht stimmt...

Grüsse, Stefan
 
Größter Wehrmutstropfen, welchen ich aktuell nicht lösen kann: "Gibt es da keine App?"

Das Check_MK-Webinterface ist für Mobile Geräte optimiert(responsive). Ich selbst habe da jetzt keine App vermißt. Man kann auch umschalten zwischen Responsive und Desktop-Oberfläche(Die Responsive-Oberfläche hat nicht ganz so viele Funktionen wie die Desktop-Variante). Zusätzlich zur E-Mailalarmierung reicht das bei uns.

Um das für verschiedene Mitarbeiter / Verantwortungsbereiche zu nutzen, wären verschiedene Hostgruppen nützlich.
 
Zuletzt bearbeitet:
Alternativ z.B. in eine Mattermost-Instanz eine Notification machen - geht mit Nagios recht problemlos, sollte daher auch mit CheckMK gehen.
 
@hellfire
Das Check_MK-Webinterface ist für Mobile Geräte optimiert(responsive). Ich selbst habe da jetzt keine App vermißt.

Verstehe Deinen Ansatz. Die App selbst ist mir auch herzlich egal - die Push Notfication dagegen ist hervorragend. Emails gehen hier auf eine dedizierte Adresse, aber es ist leichter das Push zu bestätigen, als erst die Emails zu lesen...

#Notification-Groups
Die existieren natürlich.

@marce
kannte ich jetzt nicht, aber grdsl. ist es ja ein IM-Dienst. Meine aNAG App werde ich, da die Grundlage Nagios ist auch anbinden können - ich muss nur noch rausfinden woie ich an die CGIs komme...wird schon.

Ich weiß nur bei all dem nicht, ob mir es die Zeit nochmal wert ist... :-)
 
Zurück
Oben