PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Monitoring / Nagios3-Integration



julius_ehrlich
01.09.2013, 17:22
Hallo,

wir möchten firemergency in unser monitoring integrieren. In unserem Setup verwenden wir firemergency um FME-Alarmierung auszuwerten und dann per SMS / Fax zu alarmieren.

Hierzu müssen wir gerne verschiedene Komponenten überwachen:
* Ist firEmergency korrekt konfiguriert (Gibt es Fehler / Warnungen beim Starten einzelner Prozesse? Laufen die Prozesse? Gibt es nicht-anwendbare Teile der Konfiguration)?
* Können FME Alarme dekodiert werden (wie lange liegt die letzte erfolgreiche Dekodierung zurück?)
* Ist der SMS-Versand möglich? (D.h. sind die Server erreichbar - falls mgl. soll im Rahmen der Überprüfung kein SMS-Versand erfolgen)
* Ist der Fax-Versand möglich?

Technisch wird die Überprüfung von unserem Monitoring-System initiiert. D.h. auf dem firEmergency-Server wird regelmäßig (z.B. alle 2 Minuten) ein Programm gestartet, dass die o.g. Fragen beantworten muss. Alternativ zum Programmstart kann auch eine Abfrage per Netzwerk erfolgen.

Hat jmd. von Euch Erfahrung mit der Integration in nagios? Wie kann firEmergency die o.g. Fragen beantworten?

Danke, Julius

limberu
02.09.2013, 09:05
Nein, ich habe auf dem Gebiet noch keine praktische Erfahrung mit FE, allerdings könnte ich mir folgendes Vorstellen:

* Ist firEmergency korrekt konfiguriert (Gibt es Fehler / Warnungen beim Starten einzelner Prozesse? Laufen die Prozesse? Gibt es nicht-anwendbare Teile der Konfiguration)?
Also bei mir laufen bei dem Server zwei Prozesse:
http://www.funkmeldesystem.de/foren/attachment.php?attachmentid=15050&stc=1&d=1378105351
Diese kannst du natürlich mit nagios überwachen, ob diese da sind.

* Können FME Alarme dekodiert werden (wie lange liegt die letzte erfolgreiche Dekodierung zurück?)
Einfach die Einsätze loggen lassen mit "Einsatz protokollieren" und "jeder Alarm in eigene Datei" einschalten. Über das Verzeichnis wirst du nagios dann überprüfen lasssen, wann die letzte Datei geschrieben wurde.

Für die anderen beiden habe ich zur Zeit keine Idee.

firEmergency
02.09.2013, 10:48
* Ist der SMS-Versand möglich? (D.h. sind die Server erreichbar
Das ist relativ einfach. Ping einfach das Gateway (die URL) des Anbieters an, mit dem du auch seine SMS verschicken willst.
Wenn die URL erreichbar ist, sollte auch der SMS Versand aus FE heraus gehen.



Gesendet via Mobile App

julius_ehrlich
03.09.2013, 08:47
Hallo,

danke für Deine Hinweis.

Nein, ich habe auf dem Gebiet noch keine praktische Erfahrung mit FE, allerdings könnte ich mir folgendes Vorstellen:

Also bei mir laufen bei dem Server zwei Prozesse:
http://www.funkmeldesystem.de/foren/attachment.php?attachmentid=15050&stc=1&d=1378105351
Diese kannst du natürlich mit nagios überwachen, ob diese da sind.
Einfach die Einsätze loggen lassen mit "Einsatz protokollieren" und "jeder Alarm in eigene Datei" einschalten. Über das Verzeichnis wirst du nagios dann überprüfen lasssen, wann die letzte Datei geschrieben wurde.

Das wäre eher eine Notlösung. Wenn ich die Prozesse auf mit dem Betriebssystem überwache, weiß ich nicht, ob sie tatsächlich noch leben. Sinnvoll wäre imho, eher die Anwendung (insb. den Java-Server Teil) direkt abzufragen (RMI, monitoring-Servlet) um einen kleinen Selbsttest durchzuführen.

Alles Gute
Julius

julius_ehrlich
03.09.2013, 08:51
Hallo,


Das ist relativ einfach. Ping einfach das Gateway (die URL) des Anbieters an, mit dem du auch seine SMS verschicken willst.
Wenn die URL erreichbar ist, sollte auch der SMS Versand aus FE heraus gehen.
Gesendet via Mobile App
Ehm - nein. Die Erreichbarkeit des Gateways per PING sagt nichts darüber aus, ob firEmergency tatsälich SMS darüber versenden kann. (Ein Monitoring auf TCP oder HTTP-Ebene ist - falls möglich - in jedem Fall sinnvoller)
Eine bessere Idee wäre bspw. einen Testalarm zu starten und nach Fehlern im Log zu suchen.
Gibt es eine Doku dazu, was firEmergency eigentlich genau loggt?


Alles Gute
Juliius

firEmergency
03.09.2013, 08:57
Hallo,


Ehm - nein. Die Erreichbarkeit des Gateways per PING sagt nichts darüber aus, ob firEmergency tatsälich SMS darüber versenden kann. (Ein Monitoring auf TCP oder HTTP-Ebene ist - falls möglich - in jedem Fall sinnvoller)
Eine bessere Idee wäre bspw. einen Testalarm zu starten und nach Fehlern im Log zu suchen.
Gibt es eine Doku dazu, was firEmergency eigentlich genau loggt?


Alles Gute
Juliius

Davon würde ich in deinem Fall ausgehen. Wenn der Server erreichbar ist, FE aber keine SMS verschicken kann, dann muss entweder was in deinen Einstellungen falsch sein (falsches PW oder so), oder was ganz anderes ist faul.
Aber ich denke die Erreichbarkeit des Servers via Ping zu testen ist ja schon mal ein Anfang.

Eine Doku zum Logging gibt es nicht. Aber wenn du einmal einen Alarm ausgelöst hast, siehst du ja was alles geloggt wird.

apolo
03.09.2013, 11:33
Ich weiß nicht ob es vieleicht was hilft aber ich überwache meinen FE server per socket auf dem port 1087 (service port soweit ich weiß) der schließt sich wenn sich FE aufhängt bei mir eigendlich immer, oder ist nicht mehr zu ereichen! aber nicht mit Nagios....

julius_ehrlich
04.09.2013, 12:37
Hallo,

Davon würde ich in deinem Fall ausgehen. Wenn der Server erreichbar ist, FE aber keine SMS verschicken kann, dann muss entweder was in deinen Einstellungen falsch sein (falsches PW oder so), oder was ganz anderes ist faul.
Aber ich denke die Erreichbarkeit des Servers via Ping zu testen ist ja schon mal ein Anfang.

Eine Doku zum Logging gibt es nicht. Aber wenn du einmal einen Alarm ausgelöst hast, siehst du ja was alles geloggt wird.
Genau darum geht es mir. Nagios soll überwachen, dass die Einstellungen richtig sind (bspw. wenn jmd. beim SMS-Dienstleister das Kennwort ändert, aber es nicht in firErmergency nachzieht) soll ein nagios-alert kommen.
Das gilt auch für "was ganz anderes ist faul" - auch hier brauche ich einen Nagios-Alarm.
In den wenigstens Fällen hilft ein Ping auf die Gateway-Adresse.

Ohne Brauchbare Doku zum Logging hilft mir Logging wenig - ich muss schon einschätzen können, welche Fehler in welchen Situationen auftreten. Alle Fehler einmal nachzustellen und ins log zu schauen ist leider nur schwer möglich.

Alles Gute
Julius

firEmergency
04.09.2013, 17:18
Also so tief kannst du in FE nicht hineinschauen (bezüglich geändertem Passwort im Plugin).
Das würde nach einer wirklichen Programmierschnittstelle verlangen, mit welcher dann auf Benutzer, Einheiten etc. zugegriffen werden kann. Das ist ziemlich aufwendig weswegen dafür auch die Zeit fehlt.

Beim Logging ist es grundsätzlich so:
Alles mit ERROR repräsentiert einen Fehler. Wenn ein Stacktrace der Exception dabei ist, handelt es sich dabei (meistens) um einen unerwarteten Fehler.

Ob Fehler aufgetreten sind, erfährst du ja aber dann immer erst nach einem Alarm. Die tägliche Email weist dich darauf hin.

Auf die Logs kannst du auch direkt zugreifen. Dafür bietet unser Logging-Framework einige Möglichkeiten (http://logback.qos.ch/manual/appenders.html)