PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Ausfallsicherheit



der_retter
04.01.2012, 11:06
Guten Morgen FE Team,

vielleicht habt Ihr schon darüber nachgedacht und es uns einfach noch nicht wissen lassen...
Eine SMS Alarmierung ist mittlerweile eine doch sehr elementare Alarmierungskomponente.

Wäre es möglich FE Ausfallsicher zu machen, ich denke da an zwei FE Server an zwei verschiedenen Standorten, beide via DSL angebunden. Dabei sollte man bei jedem der beiden Server einstellen können ob er der primäre oder sekundäre Server ist.
Beide FE Server tauschen regelmäßig einen "Heartbeat" aus, z.B. alle 10 Sekunden.
Sollte nun eine Alarmierung stattfinden, und der sekundäre Server hat in den letzten 20 sekunden einen Heartbeat empfangen, dann löst er nicht aus, sondern nur der primäre....

Ihr wisst was ich meine.

Freue mich auf Feedback

firEmergency
04.01.2012, 13:27
Ja, das hatten wir auch (bereits sehr früh sogar) mal diskutiert.
Wir wollten es sogar so umsetzen, wie du beschrieben hast (Master/Slave).

Warum wir es dann doch haben sein lassen:

Eine Master/Slave Funktion einzubauen wäre wohl nicht allzu schlimm. Aber was dann noch hinzukommt:
Wenn ich zwei Rechner habe, dann brauch ich im Endeffekt ja auch zwei Scanner. Weiß jetzt nicht wie realistisch das ist.

Wir werden es mal auf die ToDo Liste setzen.

t1m02k10
04.01.2012, 15:00
Zwei Scanner haben wir jetzt schon dran.
Einen für POC den anderen für Funk via TeamSpeak und FMS :P

Finde den einfach dennoch gut.

Gruß

der_retter
04.01.2012, 15:34
Wir haben auch schon zwei Scanner im Einsatz.
Die SMS Alarmierung hat LEIDER schon einen zu hohen Priorität/Stellenwert um zu mindest in unserem Einsatzszenario darauf verzichten zu können. Zudem was kostet heute ein Scanner (~50-70 Teuros) und was ein FME? Nicht das wir auf FME verzichten, aber nur zu den Anschaffungskosten.

Ich denke auch dass es umsetzungstechnisch hoffentlich zu schwer ist.

Grüße

Dr.MirakulixX
04.01.2012, 18:34
Also für sinnvoll halte ich es durchaus auch zumindest etwas in der Richtung. Bei uns ist SMS nur eine Spielerei aber wenn es mal nicht klappt ist das Geschreis groß. Wie schon in einem anderen Thread besprochen ist aber die Zuverlässigkeit bzw ein Backup der SMS "Sendeeinrichtung" genauso wichtig ich denke hier vorallem an Internet Down dann bekommt der "Slave" das zwar mit aber wenn er im gleichen Bereich steht wird er unterständen das gleiche Problem haben. Wie sieht das mit einer Watchdog Funktion für den Server aus ? Hatte es selber schon (gestern bemerkt) das der Server sich "aufgehängt" hatte. War allerdings die Vorgänger Version. Klar wenn das Hauptsystem ausfällt wird es schwer und langsam sehr umfangreich aber evtl. schon mal ein kleiner Schritt.

feodor
05.01.2012, 15:56
Wie FE schon sagte, hatten wir auch schon mit dem Gedanken gespielt.
Wie der_retter schon sagte macht es aber am meisten Sinn bei zwei voneinander unabhängigen Standorten und Internetanbindungen. Aber natürlich würde es auch einen gewissen Vorteil am selben Standort auf zwei unterschiedlichen PCs bringen, wenn man den reinen Programmausfall in Betracht zieht.

Die Möglichkeit für die Ausfallsicherheit des SMS Versands werden wir auch über die Möglichkeit bieten, SMS selber mit einem GSM Modem / Surfstick zu verschicken. Dazu aber später mehr.


Wie sieht das mit einer Watchdog Funktion für den Server aus ?

Sagt mir jetzt auf Anhieb nichts, kannst du ein Beispiel geben oder mehr dazu sagen?

Was wir uns gedacht haben ist ein Admin-Plugin (Name etwas irreführend, da kein echtes Plugin): Völlig unabhängig von irgendeiner Pipeline verschickt es eine E-Mail an einen vorkonfigurierten Benutzer mit Fehlerzeilen aus dem LOG und anderem Text, je nach dem was alles Sinn macht. Möglich wären Details wie Prozessorauslastung, aktueller RAM Verbrauch, oder Details der JVM. Dadurch sieht man zum einen auf einen Blick ob etwas schief läuft.

Was man momentan sonst schon nutzen kann ist das Alive Plugin (Inputplugin)

Gruß

Dr.MirakulixX
05.01.2012, 18:01
Also die Watchdog Funktion soll einfach überwachen ob alles Ordentlich läuft. Deswegen wäre das auch ein weiteres Program. Meldet der Server sich nicht im 5min Takt (Beispiel) oder merkt der Watchdog das der Server nicht mehr richtig arbeitet so startet er den Server oder sogar den Rechner neu. Was jetzt sicher zu weit gehen würde ist eine Hardware die einen Reset des Rechners auslöst im fall eines Falles. Hardware mässig wäre das nicht das Problem man muss "nur" einen Port (USB ?) haben der bei Bedarf ein Relais schaltet welches dann den Reset erledigt. Generell finde ich das eine Option über die man nachdenken kann. Also nicht nur als Watchdog sondern als "Gegenstück" zu dem "Eingangsmodul" was hier schonmal Diskutiert wurde. Ich denke es gibt hier genug Leute die euch dabei helfen würden die Hardware zu "Entwickeln" wenn ihr Sie ansteuert. Dann könnte man über eine Geheime Nummer ein Relais schalten -> Alarmierung. Die Heizung im Gerätehaus Überwachen -> SMS an FB Technik. Ein I/O Modul 4in, 4out oder so mit Anbindung an eure Software. Sicher nicht für jeden gedacht aber der ein oder andere könnte da sicher was brauchen.

apolo
05.01.2012, 20:12
Also die Watchdog Funktion soll einfach überwachen ob alles Ordentlich läuft. Deswegen wäre das auch ein weiteres Program. Meldet der Server sich nicht im 5min Takt (Beispiel) oder merkt der Watchdog das der Server nicht mehr richtig arbeitet so startet er den Server oder sogar den Rechner neu. Was jetzt sicher zu weit gehen würde ist eine Hardware die einen Reset des Rechners auslöst im fall eines Falles. Hardware mässig wäre das nicht das Problem man muss "nur" einen Port (USB ?) haben der bei Bedarf ein Relais schaltet welches dann den Reset erledigt. Generell finde ich das eine Option über die man nachdenken kann. Also nicht nur als Watchdog sondern als "Gegenstück" zu dem "Eingangsmodul" was hier schonmal Diskutiert wurde. Ich denke es gibt hier genug Leute die euch dabei helfen würden die Hardware zu "Entwickeln" wenn ihr Sie ansteuert. Dann könnte man über eine Geheime Nummer ein Relais schalten -> Alarmierung. Die Heizung im Gerätehaus Überwachen -> SMS an FB Technik. Ein I/O Modul 4in, 4out oder so mit Anbindung an eure Software. Sicher nicht für jeden gedacht aber der ein oder andere könnte da sicher was brauchen.

Sowas gibts schon ein kleines aber sehr feines Tool nennt sich "Restart on Crash" und funktioniert auch super, es überwacht bei mir BosMon und FE und wenn´s mal "keine rückmeldung" gibt oder sich einfach was beendet wirds nach 30 sec beendet und neu gestartet!

Ganz perfekt ist es nicht aber besser als nichts :-)

Nur funktionierts es nicht wenn im Programm ein Fehler auftritt und das Programanz nicht abstürtzt oder sich beendet... :-) aber insgsammt kann ich damit bis jetzt gut Leben!

Aber eine verlagerung auf 2 Rechner wäre schon sehr geil, um die Redundanz zu erhöhen

Gruß
Thomas

Hier mal der Link zumProgramm:

http://www.tipprodeo.de/2205/restart-on-crash-startet-abgestuerzte-programme-automatisch-neu/