Icinga2 Monitoring Plugins – geprüfte Checks und Praxiserfahrungen

Überblick

Icinga2 zählt seit Jahren zu den führenden Enterprise-Monitoring-Systemen. Die Qualität der Überwachung steht und fällt jedoch mit den eingesetzten Plugins – sie liefern die Metriken, auf deren Basis Warnungen und Reports generiert werden.

In diesem Beitrag stellen wir geprüfte Icinga2-Plugins aus unserer täglichen Praxis vor. Alle Plugins wurden im Rahmen unserer Monitoring Appliance ADMIN-BOX auf Stabilität, Kompatibilität und Performance getestet.


Praktische Plugin-Übersicht

Icinga Exchange und Nagios Exchange bieten hunderte Community-Plugins. Die folgende Auswahl umfasst von uns getestete und angepasste Skripte mit klarer Einsatzempfehlung.

Plugin-NameZweck / BeschreibungKompatible SystemeLetzter TestQuelle / DownloadBewertung
check_vmware_snapshots.shÜberwacht Alter und Größe von VMware SnapshotsvSphere 6.7 / 7.0 / 8.0Februar 2025GitHub (Admin Intelligence Repo)★★★★☆ – stabil mit vSphere 7
check_linux_load.pyPrüft CPU- und Load-Werte mit dynamischem ThresholdUbuntu, RHEL, DebianMärz 2025Icinga Exchange★★★★★ – präzise Werte, geringe Latenz
check_ssl_cert_age.shAlarmiert bei <30 Tagen Restlaufzeit von SSL-ZertifikatenApache/NginxMai 2025Nagios Exchange★★★☆☆ – einfache Integration
check_ad_replication.ps1Überwacht Active Directory Replikation & FSMO-RollenWindows Server 2019+Januar 2025Internes Plugin★★★★★ – verifizierte Ergebnisse

Beispiel: VMware Snapshot Plugin

Das Plugin check_vmware_snapshots.sh wird über SSH vom Icinga-Agent gestartet und prüft Snapshots älter als ein definiertes Maximum.

Beispiel-Nutzung

/usr/lib/nagios/plugins/check_vmware_snapshots.sh \
-H <vcenter> -u <user> -p <password> -w 30 -c 60
  • Warnung: Snapshot älter als 30 Tage
  • Kritisch: Snapshot älter als 60 Tage
  • Exit Codes: 0 = OK, 1 = WARNUNG, 2 = KRITISCH, 3 = UNKNOWN

Tipp: Authentifizierung über Service-Account mit „Read-Only“-Rechten auf den zu prüfenden Ressourcen.


Wie wir testen

Unsere Testmethodik folgt drei Stufen:

  1. Funktionaltest: Validierung der Plugin-Ausgabe (Exit Codes, Parsing).
  2. Performance-Test: Laufzeitmessung < 3 Sekunden bei 10 gleichzeitigen Checks.
  3. Kompatibilitätsprüfung: Test gegen aktuelle Versionen (z. B. Icinga2 2.14, CentOS Stream 9, vSphere 7/8).

Alle Änderungen und Benchmarks werden dokumentiert und versioniert im Admin-Intelligence-Git-Repository geführt.


Fallstudie: Plugin-Modernisierung

Ein konkretes Beispiel: Das Community-Plugin check_vmware_disks.pl verursachte in unserer ADMIN-BOX über 15 % False Positives, da API-Aufrufe für vSphere 7 veraltet waren.

Unsere Anpassung aktualisierte die SOAP-Schnittstellen und Caching-Mechanismen, was die Fehlalarme um 40 % reduzierte und die Laufzeit halbierte. Der Code ist vollständig dokumentiert und als Fork im internen Repo verfügbar.


Schritt-für-Schritt: Eigenes CheckCommand anlegen

Ein neues Icinga2-CheckCommand lässt sich einfach definieren. Beispiel für das oben vorgestellte Snapshot-Plugin:

object CheckCommand "check-vmware-snapshots" {
import "plugin-check-command"
command = [ PluginDir + "/check_vmware_snapshots.sh" ]
arguments = {
"-H" = "$vcenter$"
"-u" = "$vmuser$"
"-p" = "$vmpass$"
"-w" = "$snap_warning$"
"-c" = "$snap_critical$"
}
}

Nach Anpassung der Variablen (vars.vcentervars.snap_warning) kann der Check in jedem Host-Template verwendet werden.


Troubleshooting

Häufige Fehlerquellen und Lösungen:

  • Fehler: „UNKNOWN – Cannot connect to vCenter“
    Lösung: Testen Sie die Verbindung mit openssl s_client -connect <vcenter>:443, SSL-Zertifikate ggf. erneuern.
  • Fehler: „Plugin timed out“
    Lösung: Timeout im Icinga2-Command auf 120 Sekunden erhöhen (vars.timeout = 120s).
  • Fehler: „Command not found“
    Lösung: Prüfen Sie, ob der Pfad /usr/lib/nagios/plugins/ korrekt im $PATH liegt.

Services & Support

Wir bieten drei Leistungsbausteine rund um Icinga2-Pluginentwicklung:

a) Plugin-Entwicklung – Pauschalpreis mit SLA
b) Anpassung bestehender Plugins – Abrechnung nach Stundenbasis
c) Plugin-Hardening & Audit – Prüfung auf Struktur, Performance und Sicherheit inklusive Report

Details, Preise und Fallstudien finden Sie auf unserer Website: www.admin-intelligence.de/icinga2


Nützliche Ressourcen