Dieser Blog behandelt die wichtigsten Wissensbereiche des Incident Management.
- Überblick über das Incident Management
- Lebenszyklus von Vorfällen
- Vorfall-Eskalation
- Funktionale vs. hierarchische Eskalation
- Vorteile, Kosten und Herausforderungen
Das Wichtigste zuerst: Bevor wir tiefer in die einzelnen Bereiche einsteigen, ist es am besten, eine gute Vorstellung von den grundlegenden, fundamentalen Terminologien zu haben. Für diejenigen unter Ihnen, die vorhaben, die ITIL-Prüfung abzulegen, ist es sehr wichtig, diese zu kennen. Was ist zum Beispiel ein "Vorfall"?
Laut ITIL-Glossar:
Incident: (Service Operations) Eine ungeplante Unterbrechung eines IT-Services oder eine Minderung der Qualität eines IT-Services. Das Versagen eines Konfigurationselements, das sich noch nicht auf den Service ausgewirkt hat, ist ebenfalls ein Vorfall. Zum Beispiel: Ausfall einer Festplatte in einem Spiegelsatz.
Incident Management: (Service Operations) Der Prozess, der für die Verwaltung des Lebenszyklus aller Incidents verantwortlich ist. Das Hauptziel des Incident Managements ist es, den IT-Service so schnell wie möglich wieder für die Benutzer bereitzustellen.
Diese beiden Definitionen sind sehr wichtig und werden in der ITIL-Prüfung recht häufig abgefragt.
Überblick über das Incident Management
- Verringerung oder sogar Beseitigung der Auswirkungen oder des Auftretens von IT-Unterbrechungen, -Störungen oder Qualitätsminderungen
- Benutzer müssen so schnell wie möglich wieder arbeiten können
- Beauftragung geeigneter Spezialisten mit der Erfassung, Klassifizierung und Zuordnung aller Vorfälle
- Die Fortschritte sollten überwacht werden
- Vorfälle müssen ALLE geklärt werden
- Prozess muss NACH der Lösung abgeschlossen werden
Ziele und Vorteile von Incident Management
- Verringerung der Auswirkungen auf das Geschäft
- Verbesserung der Benutzerproduktivität
- Unabhängige, kundenorientierte Überwachung von Vorfällen
- SLA-Informationen (Service Level Agreement) leicht zugänglich machen
- Niedrigere Kosten für die Geschäftstätigkeit
- Reagieren Sie schnell und effizient
- Aktive Überwachung von Benutzerdomänen und Diensten
- Probleme vor der Eskalation bewahren
- Verbesserte Nutzer-/Kundenzufriedenheit
- Genauere Operationen
- Verhindern von "zu vielen Köchen"
Wir haben bereits "Vorkommnisse" definiert. Schauen wir uns jetzt das "Problem" an.
Probleme verursachen Vorkommnisse. Vorkommnisse werden nicht zu Problemen. Das Problem ist die zugrundeliegende, unbekannte Ursache für ein oder mehrere Vorkommnisse. Zum Beispiel ist eine der Festplatten ausgefallen. Wenn eine Festplatte ausfällt, ist das derVorfall. Das Problem ist jedoch die zugrundeliegende Ursache für den Vorfall. Handelt es sich um ein Konfigurationsproblem oder um ein Hardware Problem? Es ist sehr wichtig, sich den Unterschied zwischen einem Vorfall und einem Problem zu merken.
Aufzeichnungen über Vorfälle vs. Problemaufzeichnungen:
- Incident Records sind auf den Endbenutzer ausgerichtet
- Incident Reporting Management konzentriert sich auf die Messung von Ausfallzeiten und Auswirkungen auf das Geschäft
- Problemaufzeichnungen beginnen mit der Entscheidung des IT-Managements, IT-Ressourcen und Ausfallzeiten der Endbenutzer für die Ursachenforschung und die Umsetzung der Lösung zu investieren
- Problemaufzeichnungen konzentrieren sich auf interne IT-Prozesse
- Management Berichterstattung über Probleme mit Schwerpunkt auf den Grundursachen und Umsetzung struktureller Lösungen
Lebenszyklus von Vorfällen
Während Sie als Incident Manager Ihre Service Desk Lösung und Incident Handling zusammenstellen, sehen Sie unten ein typisches Incident Life Cycle Diagramm, mit dem Sie möglicherweise arbeiten könnten.
Der allererste Schritt ist das Erkennen und Aufzeichnen. Dies ist die ursprüngliche Annahme der Anfrage an den Service Desk. Zu diesem Zeitpunkt wird der Incident Record erstellt. Der zweite Schritt ist die Klassifizierung und Unterstützung. Handelt es sich zum Beispiel um ein Problem im Zusammenhang mit software oder hardware oder um eine Serviceanfrage? Der Vorfall wird nach der Art des Vorfalls, dem Status oder den Auswirkungen auf die Organisation kodiert. Ist es dringend? Ist er kritisch? Welche Priorität hat er? Wie verhält es sich mit dem Service Level Agreement? Von dort aus kann der Benutzer vom Service Desk Vorschläge erhalten, die auf dem Skript basieren, oder vielleicht auf der Grundlage von Expertenwissen, um den Vorfall zu lösen oder das Problem zu umgehen, selbst wenn es sich nur um eine vorübergehende Lösung handelt. Wenn es sich um eine Serviceanfrage handelt, würden wir an diesem Punkt zu einem anderen Prozess übergehen, da die Serviceanfrage nicht die Schritte der Untersuchung und Diagnose umfasst.
Wenn es keine bekannten Lösungen für diesen speziellen Vorfall gibt, wird er von der Service-Desk-Gruppe weiter untersucht und diagnostiziert oder durchläuft den Eskalationsprozess. Wenn die Lösung gefunden wurde, kann das Problem "gelöst" werden. Der Schritt "Lösen und Wiederherstellen" muss erfolgen. Wir müssen eine Lösung für den Vorfall haben. Sobald wir eine Lösung für den Vorfall gefunden haben, gehen wir zu "Closure" über. Der Benutzer wird gefragt, ob er mit der Lösung zufrieden ist. Wenn ja, schließen wir den Vorfall ab. Wenn wir diesen Prozess verbessern wollen, können wir eine Umfrage oder eine Folgeuntersuchung durchführen.
Auf jedem Schritt des Weges sollten wir eine kontinuierliche Verfolgung und Fortschrittskontrolle durchführen.
Vorfall-Eskalation
Hier gibt es zwei verschiedene Eskalationsarten: Horizontale Eskalation und vertikale Eskalation (diese Frage wird auch häufig im ITIL Foundation Test gestellt). Kurz gesagt, ist die Eskalation eines Vorfalls die Weitergabe des Problems an eine höhere Fach-/Autoritätsebene.
Jede Organisation sollte über ein Eskalationsmodell verfügen. Lassen Sie uns dies mit einfachen Worten erläutern.
Auf einer sehr grundlegenden Ebene haben wir zunächst Stufe 1. Diese Ebene ist für die Aufzeichnung und Erkennung des Vorfalls zuständig. Dies geschieht in Form einer Art von Anfrage. Sie kann von einem Benutzer, Kunden, System, einer Anwendung usw. kommen. Wenn es sich bei der Anfrage um eine Serviceanfrage handelt, z. B. wenn ein neuer Mitarbeiter ein Domänenkonto einrichten möchte, dann würde diese Art von Anfrage, wie bereits erwähnt, ein Serviceanfrageverfahren durchlaufen. Sobald der Vorfall unsere Tier-1-Leitung erreicht, wird er an den nächsten Schritt, den Support, weitergeleitet. Wenn unser Support Desk in der Lage war, den Vorfall zu lösen, gehen wir direkt zur Wiederherstellung der Lösung über und schließen den Vorfall ab.
Wenn der Support Desk jedoch nicht in der Lage war, den Vorfall zu lösen, kommt die Eskalation ins Spiel, die wir als Stufe 2 bezeichnen. Diese Eskalation kann, wie bereits erwähnt, horizontal oder vertikal erfolgen.
- Die funktionale (horizontale) Eskalation ist ein Prozess, bei dem Mitarbeiter oder interne Mitarbeiter mit besonderen Fähigkeiten oder zusätzlichen Zugriffsrechten hinzugezogen werden.
- Bei der hierarchischen (vertikalen) Eskalation geht es darum, sich an eine höhere Ebene zu wenden. Bei einem Netzwerkproblem würden wir uns beispielsweise an unser Rechenzentrum wenden, das sich außerhalb unserer Organisation befindet.
Vom Standpunkt des Service-Desk-Designs aus betrachtet, würden wir zuerst die horizontale Eskalation entwickeln wollen, um sicherzustellen, dass wir Personal haben, das unsere Benutzer unterstützt.
Nutzen, Kosten und Herausforderungen des Störungsmanagements
Werfen wir zunächst einen Blick auf die Vorteile des Vorfallmanagements:
- Geringere Auswirkungen von Problemen und Vorfällen auf das Geschäft, einschließlich Serviceanfragen, ermöglichen eine höhere Effektivität
- So können Sie proaktiv Verbesserungen und Änderungen vornehmen, die für einen reibungslosen Ablauf Ihres Unternehmens sorgen.
- Geschäftsorientiertes SLA-Management
- Durch bessere Überwachung und Leistung erhalten wir eine bessere Servicequalität
- Bessere Auslastung und Effizienz des Personals
- Indem wir aus Vorfällen und Problemen lernen, können wir zukünftige Vorfälle und Serviceanfragen vermeiden.
- Helfen Sie uns, die Kunden-/Nutzerzufriedenheit zu verbessern
Alles hat seinen Preis und bringt Herausforderungen mit sich. Auch das Vorfallmanagement hat sie:
- Erste Planung und Umsetzung - Kommunikation, Schulungsprozess
- Ausbildung und Anlaufphase
- Hardware und software Tools, die verwendet werden (Überwachungssystem, Ticketingsystem)
- Nutzer/Mitarbeiter umgehen die Verfahren, wenn der Prozess zu komplex oder zu bürokratisch ist
- Rückstau von Vorfällen - Überlastung der Prozesse
- Zu viele Eskalationen
- Mangel an klaren Definitionen, SLAs, Engagement von Mitarbeitern und Management
Wie Sie sehen, bietet die Implementierung eines Vorfallmanagementprozesses viele Vorteile, und jede Organisation sollte über einen klar definierten Vorfallmanagementprozess verfügen, wenn sie ihre internen und externen Kunden wirksam unterstützen will.