Für eine digitale Zukunft
Diese Fallstudie untersucht anhand verschiedener Anwendungsszenarien, wie eine AIOps-Lösung dazu beitragen kann, branchenspezifische Herausforderungen im Umfeld von Banken und Versicherungen zu bewältigen und die Schwächen bestehender klassischer Monitoring-Systeme zu kompensieren.
Besondere Herausforderungen
- Hochreguliertes Umfeld: Strenge Vorschriften und Richtlinien, wie beispielsweise durch MaRisk, BAIT und BaFin vorgegeben, müssen befolgt werden: AIOps kann durch Predictive Analytics dazu beitragen, Risiken und compliance-relevante Probleme und meldepflichtige Ereignisse frühzeitig zu erkennen.
- Zero-Trust-Umgebung: Nicht zuletzt durch das umfassende Logging sicherheitsrelevanter Aktivitäten werden große Datenvolumina generiert, die nur unter Einbezug von ML-Verfahren sinnvoll ausgewertet werden können.
- Offline On-Premise: Kritische Systeme und Daten werden häufig im eigenen Rechenzentrum vorgehalten, AIOps-Lösungen müssen oftmals ohne Konnektivität zu externen Ressourcen auskommen.
- Transparenz von Assets, Zugriffen und Datenflüssen: AIOps-Tools können Echtzeit-Einblicke in die IT-Infrastruktur bieten, indem sie Datenflüsse, Asset-Nutzung und Zugriffsmuster transparent machen und auswerten.
- Einbindung ins IT Service Continuity Management (ITSCM): AIOps kann durch die Analyse von Ausfallmustern dazu beitragen, Ausfallzeiten zu reduzieren und die Betriebskontinuität zu verbessern.
- Hochkomplexe, häufig mehrfach redundant ausgelegte IT-Infrastruktur: AIOps kann dabei helfen, Abhängigkeiten innerhalb der Infrastruktur zu verstehen und Störfaktoren schneller zu diagnostizieren und zu beheben.
IT-Betrieb in Banken und Versicherungen:
Einblick in eine typische Kundenumgebung
Das folgende Ausgangsszenario beschreibt exemplarisch einen Teilbereich einer IT-Kundenumgebung, wie wir sie immer wieder im Umfeld von Banken und Versicherungen vorfinden und eine IT-Betriebseinheit, die für die Betreuung des spezifischen Bereichs zuständig ist:
- Es sind verschiedene Datenbank-Management-Systeme (DBMS) im Einsatz, auf denen geschäftskritische Anwendungen laufen
- Die DBMS werden auf einer redundant ausgelegten, virtualisierten Serverlandschaft betrieben, wobei für die Datenbank-Systeme wiederum ein Hochverfügbarkeits-Setting etabliert ist
- Die Datenbank-Systeme sind in ein zentral verwaltetes Backup-System eingebunden, über welches regelmäßig verschiedene Arten von Sicherungen gesteuert werden
- Die Fachbereiche, deren Applikationen auf den Datenbanksystemen laufen, stellen bei Störungen des Applikationsbetriebs oder Performanz-Problemen über ein Ticketsystem entsprechende Anfragen an den IT-Betrieb
- Der IT-Betrieb, der die DBMS betreut, stellt wiederum Tickets an weitere Betriebseinheiten, sofern eine diagnostizierte Störung außerhalb des eigenen Scopes liegt
- Es gibt mindestens ein klassisches Monitoring-System, das auf Basis fest definierter Schwellwerte verschiedene Signale der Hosts (CPU-Auslastung, Memory etc.), der Datenbanken sowie des zugrunde liegenden Filesystems überwacht. Der IT-Betrieb prüft den Status der Systeme über das Monitoring-Tool, erhält aber auch entsprechende Benachrichtigungen aus dem Monitoring-System, sofern Schwellwerte überschritten wurden. Des Weiteren können bestimmte Fehlerkategorien oder vorab definierte Text-Messages aus den textbasierten Fehler-Logs der Datenbanken überwacht werden
- Auf Basis der Monitoring-Meldungen oder der Anfragen aus dem Applikationsbereich prüft der IT-Betrieb u.a. verschiedene zeitreihenbasierte Log-Texte und versucht, entsprechende Ursachen für Probleme oder Störungen zu ermitteln und diese anschließend zu beseitigen
Die folgenden Fallbeispiele illustrieren nur eine Teilmenge der durch uns für einen Kunden implementierten AIOps-Lösung, spiegeln aber wider, was aus unserer eigenen Praxiserfahrung beim Betrieb von IT-Systemen bei verschiedenen Kunden immer wieder als relevant erachtet wird. Dabei werden sowohl fachliche Herausforderungen aus Sicht des IT-Betriebs beschrieben als auch ein Einblick in die technischen Herausforderungen bei der Umsetzung der AIOps-Lösung gegeben.
Wie könnte eine AIOps-Architektur aussehen?
Hier sind beispielhaft einige (etablierte) Open-Source-Komponenten beschrieben, die zur Konzeption einer Datenpipeline verwendet werden können: