Grundlagen für die Incident Response

Abgeschlossen

Organisationen profitieren heutzutage zwar von der Verfügbarkeit, der Effizienz und dem Komfort der Cloud, allerdings müssen sie viele Herausforderungen im Rahmen einer digitalen Transformation meistern, bei der unter anderem Teile des Geschäfts in Clouddienste verlagert werden.

Zu den typischen Herausforderungen, die Sie in Ihrer Organisation möglicherweise bewältigen müssen, gehören:

  • Höhere Anzahl von Dienstunterbrechungen
  • Keine effektive Methode zur Nachverfolgung von Incidents und für die Incident Response (es wird nur aus der Situation heraus reagiert)
  • Nicht akzeptabler für die Lösungsfindung benötigter Zeitraum
  • Für die Lösungsfindung benötigter Zeitraum verbessert sich nicht oder verschlechtert sich
  • Informationen und Status sind schwer zu finden
  • Wiederholtes Auftreten der gleichen Probleme und Fehler

Zur Bewältigung dieser Herausforderungen benötigen Sie einen klar definierten Incident-Response-Plan mit einer soliden Grundlage.

Grundlagen und Säulen

Der Zweck eines Grundsatzplans besteht darin, die gesamte Struktur beizubehalten. In einem separaten Einführungsmodul zu diesem Lernpfad haben wir erläutert, dass die Arbeit in Bezug auf die Zuverlässigkeit auf der grundlegenden Ebene der Überwachung beruht und Incident Responses in der Hierarchie direkt darüber einzuordnen sind.

Für Incident Responses gibt es auch einen Grundsatzplan. Es gibt drei Säulen, die einen guten Plan zur Incident-Response unterstützen:

  • Dienstplan
  • Rollen
  • Übergabeplan

In dieser Lerneinheit erfahren Sie mehr über die einzelnen Säulen und deren Rolle beim Entwerfen einer Incident-Response-Strategie. Diese soll Ihnen dabei helfen, Ihre Ziele hinsichtlich der Zuverlässigkeit zu erreichen.

Dienstplan

Es ist immer von Vorteil, einen guten Plan zu haben. Dieser ist aber nutzlos, wenn er von niemandem genutzt wird. Daher ist es empfehlenswert, am Anfang festzulegen, welcher Mitarbeiter auf bestimmte Probleme reagieren soll und wie diese darüber benachrichtigt werden.

Hier eignet sich das Entwerfen eines Dienstplans. Ein Dienstplan ist eine Liste der Mitglieder des Bereitschaftsdienstteams. Dieses Team sollte aus mehreren Technikern bestehen. Diese Teammitglieder sollten über ausreichend Kenntnisse und Erfahrung in Bezug auf Incident Responses verfügen, um die verschiedenen Arten von Problemen zu beheben, die in Ihrer Umgebung auftreten können.

Eine Liste mit Namen reicht jedoch noch nicht aus. Sie müssen einen kompletten Strukturplan erstellen, der Informationen darüber enthält, welche Person in einem bestimmten Zeitraum arbeitet und welche Aufgaben sie hat. An dieser Stelle kommen die verschiedenen Rollen ins Spiel.

Rollen

Durch das Zuweisen von Rollen kann Chaos im Team vermieden werden, da sonst bestenfalls nur Ad-hoc-Reaktionen möglich sind. Hierfür werden für jede Person bestimmte Aufgaben in einer bestimmten Situation sowie ihre Position in der „Befehlskette“ festgelegt. Rollen können je nach Organisation oder auch nach Art des Incidents variieren, aber die folgenden Rollen sollten in einem organisierten Incident-Response-Team immer vorhanden sein:

  • Erster Ansprechpartner: Dies ist die „Person“, die in der Regel als erstes kontaktiert wird. Das bedeutet, dass es sich hierbei um den Bereitschaftstechniker handeln sollte, der bei Incidents als erstes kontaktiert wird.
  • Zweiter Ansprechpartner: Hierbei handelt es sich um eine Person, die als Backup fungiert und einspringen kann, wenn der erste Ansprechpartner nicht erreichbar ist oder Unterstützung benötigt.
  • Fachexperten (SMEs): Diese Personen haben fundierte Kenntnisse in bestimmten Bereichen Ihrer Arbeit. Sie werden zu Rate gezogen, wenn der erste und der zweite Ansprechpartner das Problem an jemanden mit Fachkenntnissen weiterleiten müssen. Sie arbeiten nicht dauerhaft auf Abruf, können jedoch kontaktiert werden, wenn ihre speziellen Kenntnisse benötigt werden. Sie sollten eine Liste mit Experten für die verschiedenen Bereiche anfertigen (z. B. Datenbanken, Front-End, Netzwerkinfrastruktur, Web-Apps, Cybersicherheit usw.).
  • Einsatzleiter: Dies ist eine wichtige Rolle bei einem umfangreichen Incident oder Ausfall, der verschiedene Komponenten betrifft und/oder eine team- und systemübergreifende Koordination erfordert. Ein Einsatzleiter koordiniert die Kommunikation und die Aktionen, die erforderlich sind, um auf den Incident zu reagieren und das Problem zu beheben. Der Einsatzleiter behält den Überblick, überwacht die Vorgänge und kontrolliert, welcher Mitarbeiter bestimmte Aufgaben ausführt. Ein Einsatzleiter kann sicherstellen, dass die Techniker die ihnen zugeteilten Aufgaben konzentriert erledigen und keine Aufgaben von anderen Personen übernehmen.
  • Schriftführer: Die Aufgabe des Schriftführers besteht darin, die Kommunikation in Bezug auf den Incident so detailliert wie möglich zu dokumentieren. Teams nutzen für den Kontakt mit den anderen Mitgliedern häufig Telefonbrücken, Telefonkonferenzen oder Videochats. Auf diese Weise können sie sich gegenseitig darüber informieren, welche Aufgaben erledigt werden müssen. Wenn die Gespräche allerdings nicht transkribiert werden, ist es für nicht direkt beteiligte Personen möglicherweise schwierig, nachzuvollziehen, was die Techniker detailliert beschrieben haben. Der Schriftführer kann also möglichst viele Informationen für spätere Arbeitsschritte festhalten. Der Schriftführer erfasst alle Daten und notiert nicht nur, was die einzelnen Teammitglieder tun, sondern auch was diese sagen oder fühlen.
  • Kommunikationskoordinator: Dies ist die Person, die in Bezug auf den Incident für die „Öffentlichkeitsarbeit“ zuständig ist. Der Kommunikationskoordinator arbeitet mit dem Einsatzleiter zusammen, um Informationen zum Incident mit den Personen zu teilen, die nicht aktiv an der Behebung des Problems und der Wiederherstellung des gewünschten Zustands beteiligt sind. Dazu zählen Kunden, Vertriebs- und Marketingteams, Mitarbeiter des Kundensupports und andere Beteiligte innerhalb oder außerhalb der Organisation, die über das Geschehen und den Fortschritt beim Beheben des Problems informiert werden müssen.

Übergabeplan

Nun können Sie auf den Dienstplan für das Incident-Response-Team zurückgreifen und die entsprechenden Rollen einsehen. Der nächste und letzte Schritt besteht darin, einen Übergabeplan zu erstellen. Mit diesem Plan werden die Schichten für die Mitglieder des Bereitschaftsdiensts festgelegt.

Es gibt viele verschiedene Möglichkeiten, Schichten festzulegen. Schichtpläne können einen komplexen strategischen Prozess erfordern. Sie sollten nicht willkürlich festgelegt werden. Sie sollten sich Gedanken über die Planung machen, um den Plan effektiv und für die Teammitglieder so angenehm wie möglich zu gestalten.

Einige Methoden für Schichtpläne umfassen Folgendes:

  • 24 x 7: Bei diesem Übergabemodell arbeiten Teammitglieder in einer mehrtägigen Bereitschaftsschicht. Dies ist eine einfache Möglichkeit, Schichten festzulegen. Sie müssen aber darauf achten, die Dauer zu beschränken. Schichten, die länger als drei bis vier Tage dauern, können die allgemeine Gesundheit der Technikmitarbeiter und daher die Zuverlässigkeit des gesamten Systems beeinträchtigen.
  • Einsatz des Zeitzonenmodells: Bei diesem Schichtmodell arbeiten Techniker nur während ihrer normalen Arbeitszeit auf Abruf und übertragen die mit ihrer Rolle verbundene Verantwortung am Ende des Arbeitstages an einen Kollegen in einer anderen Zeitzone.

Dies sind nur einige wenige Beispiele für Schichtübergabemodelle. Der wichtigste Punkt besteht darin, die Schichten bestmöglich auf die einzelnen Teammitglieder aufzuteilen. Es gibt zahlreiche Möglichkeiten, Schichten anzupassen, insbesondere in Bezug auf Wochenenden, an denen Techniker flexibler sein möchten. Techniker sollten ihre Aufgaben bei privaten Problemen immer an Kollegen übertragen können.

Überprüfen Sie Ihr Wissen

1.

Welches dieser Dinge ist eine Säule der Incident Response?

2.

Was ist die Funktion der Rolle „Schriftführer“ im Rahmen der Incident Response?

3.

Benötigen Sie alle in dieser Lerneinheit erwähnten Rollen für eine erfolgreiche Incident Response?