Zitat Zitat von Michel
Was ist ein "hochverfügbarer Cluster"?
Ich bin zufällig zertifizierter Systems Engineer für Clustersysteme eines bekannten Deutschen IT-Lieferanten ;-), daher erlaube ich mir hier noch ein paar Worte zum Prinzip von Hochverfügbarkeit und solchen Clustern:

Cluster sind wie schon aus dem Wikipedia-Artikel bekannt Rechnerverbünde, die aus verschiedenen Knoten (Einzelrechner) bestehen und der Aussenwelt vorgaukeln, sie seien ein einziger Rechner. Die Knoten sind über einen sog. Cluster-Interconnect (prinzipiell eine besondere Netzwerkleitung) miteinander verbunden und senden sich darüber Heartbeats, also Lebenstakte zu. Darüber wissen alle Knoten eines Clusters immer, ob die anderen Knoten noch leben. Über den Cluster Interconnect laufen nur die Heartbeats und keine anderen Dinge. Üblicherweise haben die Knoten einen redundanten Cluster-Interconnect (also zwei oder mehr) und darüberhinaus weitere Netze, mit denen sie untereinander und mit der Aussenwelt verbunden sind. Die Daten eines Clusters liegen typischerweise nicht auf den Knoten selbst, sondern auf einem nachgeschalteten Storage-System, welches meist als RAID 5 oder gar als RAID 50 bzw. als Storage Area Network (SAN) ausgelegt ist.

Hochverfügbarkeit (HV) bedeutet nun, dass eine beliebige Applikation - z.B. ein Serverprozess des Einsatzleitrechners - auf einem (und nur auf einem!) dieser Knoten läuft. Gibt es ein Problem mit diesem Knoten oder der darauf laufenden Applikation, so wird dieser Knoten von den anderen als fehlerhaft erkannt und kontrolliert "getötet". Wenn der getötete Knoten meldet, dass er definitiv heruntergefahren/getötet ist (der geneigte Leser wird sich jetzt fragen, wie ein getöteter Rechner noch etwas melden kann, aber dies ist unter anderem ein Grund, warum die Cluster-Hersteller sich gut bezahlen lassen ;-) ), wird auf einem zweiten Knoten die Applikation automatisch neu angefahren. Für den Benutzer der Applikation steht diese nach einem Zeitdelta, welches für die Umschaltung gebraucht wird (Applikation auf einem Knoten töten und auf dem anderen wieder anfahren), wieder in der gleichen Weise zur Verfügung wie vor der Umschaltung.

Wichtig ist, dass eine Applikation immer nur auf einem einzigen Knoten läuft. Wenn die gleiche Applikation auf zwei Knoten gleichzeit läuft, könnte sie die gemeinsame Datenbasis zerstören.

Im Unterschied hierzu ist ein Parallelrechner zu sehen, der wirklich "heiss" mitläuft und in Bruchteilen von Sekunden - also ohne das Zeitdelta für die Umschaltung - die Applikation auf einem anderen Knoten zur Verfügung stellt. Das kostet allerdings noch viel mehr als ein HV-Cluster und ist recht selten...

Ein streched Cluster ist prinzipiell für den genannten Fall geeignet, aber man sollte generell in der Leitstelle einen aus mindestens zwei Knoten bestehenden Cluster vorsehen. Fallen beide aus, könnte der Knoten im ELW übernehmen. Cluster nehmen nicht viel Platz weg. Unserer (alerdings recht kleiner) ist nur wenige Höheneinheiten hoch (die zugehörige USV ist mit 10 HE größer als Cluster und Storage-System).

Habe ich für genug Verwirrung gesorgt ;-)?