IT-Infrastruktur und Serverlandschaften müssen kontinuierlich hinsichtlich ihrer ordnungsgemäßen Funktion überwacht werden. Dazu ist es sinnvoll, automatisierte Tests regelmäßig auszuführen. Diese Tests können im einfachsten Fall nur die Erreichbarkeit eines Webservers testen. Es besteht jedoch auch die Möglichkeit zur Durchführung sehr komplexer Tests, wie zum Beispiel automatisiert und regelmäßig Nachrichten durch einen Message Broker wie RabbitMQ zu senden.
Moderne Monitoring-Systeme verlassen sich heute nicht ausschließlich auf punktuelle Tests, sondern speichern typischerweise auch eine Vielzahl von Messwerten, aus denen sich bei richtiger Auswahl der Daten und der Betrachtung des Grafenverlaufs eine Prognose für die Zukunft ableiten lässt.
Das grundsätzliche Ziel eines Monitoring-Systems ist die Vermeidung oder mindestens die Verkürzung von Ausfällen wichtiger Systeme oder Infrastrukturkomponenten.
Monitoring-Konzept
Mit einem Monitoring-Konzept wird sichergestellt, alle Aspekte der Anforderungen des Betreibers erfasst zu haben. Im Rahmen einer Konzepterstellung wird auch die Methodik des eigentlichen Monitorings festgelegt.
Hierbei unterscheiden wir zwischen faktenprüfenden Systemen und trendbasierten Systemen. Beide Technologien werden in der Regel komplementär eingesetzt.
Zu einem Konzept gehören auch entsprechende Maßnahmenkataloge. Diese können von simpler Störungsanzeige über komplexe Benachrichtigungskaskaden bis hin zu automatischen Failover-Steuerungen reichen.
Unter dem Stichwort Alerting – zu Deutsch: Alarmierung – fasst man alle automatisch getroffenen Maßnahmen zusammen, mit denen ein Monitoring-System die zuständigen Administratoren auf eine mögliche Störung aufmerksam machen kann.
Benachrichtigungsarten
Hier ist eine simple Anzeige auf einer Webseite, eine E-Mail oder SMS möglich. Auch können diverse Chatsysteme wie IRC, Slack, Mattermost, WhatsApp und Telegram angebunden werden, in die ein Monitoring-System Warnungen oder Störungsmeldungen sendet. In weiteren Ausbaustufen können auch Telefonanrufe oder SMS-Mitteilungen genutzt werden.
Gelegentlich werden auch Meldeeinrichtungen wie Blitzleuchten und Tongeber in diesen Kontexten eingesetzt.
Eskalation
In solchen Alerting-Systemen sind auch Eskalationen möglich, die zum Teil komplexe Bedingungen bearbeiten. Denkbar sind Eskalationen nach Schwere der einzelnen Störung oder Anzahl der Störungen in einem definierten Zeitraum oder auch das Ausbleiben einer Reaktion des Notfallkontaktes innerhalb einer maximal definierten Reaktionszeit.
Logging
Im Kontext des Monitorings bezieht sich Logging auf die Aufzeichnung von Störungen oder Warnzuständen innerhalb des Monitoring-Systems.
Dies ist nicht zu verwechseln mit einem zentralisierten Logging verschiedener Systeme und der automatisierten Auswertung von Logdateien. Letzteres kann jedoch auch ein möglicher Test innerhalb eines Monitoring-Konzeptes sein.
Ziel dieser Informationssammlung innerhalb des Monitorings ist es, dem Betrieb eine Historie über entsprechende Störungen zu liefern, mit der ggf. schnell und zielgerichtet sinnvolle Maßnahmen abgeleitet werden können.
Trendanalyse
In der Trendanalyse moderner Monitoring-Konzepte geht es darum, einerseits frühzeitig entstehende Probleme zu erkennen, bevor sie sich im Betrieb tatsächlich bemerkbar machen. So kann zum Beispiel eine langsam, aber sicher volllaufende Speichereinheit frühzeitig erkannt werden. Je nach Qualität kann aus den verfügbaren Daten sogar eine Prognose für die Zukunft abgeleitet werden.
Andererseits kann es ein Ziel sein, periodische Schwankungen auszugleichen. Hierhin entwickeln sich diese Systeme derzeit. Beispielsweise kann es in der Realität vorkommen, dass eine bestimmte, regelmäßig ausgeführte Aufgabe auf einem Server jeden Montag um 19:00 Uhr die Festplatte zu 90% füllt und danach leert. In einem klassischen, schwellwertbasierten System würde dies entweder jeden Montag eine Warnung auslösen oder einen für den sicheren Betrieb möglicherweise zu hohen Schwellwert von z.B. 95% nutzen. Ein trendbasiertes System kann aber im Idealfall dieses Muster entsprechend herausfiltern.
Sie haben Fragen zum Thema Monitoring? Dann sind wir der richtige Partner für Sie!
Haben wir Ihr Interesse geweckt?
Unsere Experten beantworten gerne Ihre individuellen Fragen und unterstützen Sie bei der Wahl der passenden Open Source Lösung für Ihr Vorhaben.
Das credativ®
Open Source Support Center
Unsere Antworten auf die häufigsten Fragen: