Kenmerken en levenscyclus van een incident
Zoals u in de laatste les hebt geleerd, is een incident een serviceonderbreking die van invloed is op uw klanten en eindgebruikers. Incidenten komen in veel vormen voor, variërend van vertragingen in de prestaties die gebruikers frustreren ('traag is de nieuwe') tot systeemcrashes waardoor de service of site gedurende een bepaalde periode volledig niet beschikbaar is.
Kenmerken van een incident
Incidenten zijn meestal onverwacht en lijken op de slechtst mogelijke tijd (zoals 2:00 uur of wanneer u diep in een belangrijk project bent onderdompeld). Daarom worden incidenten vaak gevreesd en vermeden, zelfs tot op het punt waar mensen soms de betekenis van een incident afsluiden. De interne druk vanuit een organisatie is soms zo groot dat de verleiding bestaat een verstoring anders te bestempelen of in het geheel niet te melden uit angst voor reprimandes.
Incidenten zorgen in ieder geval voor ongepland werk en omdat u de meeste tijd besteedt aan gepland werk met een goed idee van wat u zou moeten doen, denkt u waarschijnlijk aan incidenten als slechte dingen. Er is echter een andere manier om ernaar te kijken: incidenten zijn echt investeringen* in het leveren van de waarde die u wilt leveren aan eindgebruikers. Ongeacht de oorzaak van het incident of de omvang van de impact, hebben alle incidenten één ding gemeen: ze kunnen een waardevolle leerervaring bieden.
U moet incidenten als de puls van uw systemen bekijken. Ze geven meer informatie over het systeem dan u voorheen wist, en die kennis is alleen maar iets positiefs. Wanneer u een sterke basis hebt voor bewaking en meer weet over wat er in uw systeem gebeurt, genereert het onvermijdelijk meer waarschuwingen en incidenten en mogelijkheden om te reageren. In ieder geval vertellen incidenten u wat er aan de hand is en vergroot u zo uw operationele bewustzijn. In een eerdere module over bewaking geven we aan dat dit een belangrijke rol speelde bij betrouwbaar werken.
Levenscyclus van een incident
Als u de status van uw incidentresponsteam wilt uitbreiden naar 'elite/high performer', moet u verder kijken dan het idee van een serviceonderbreking of incident als een eenvoudige lineaire tijdlijn en deze vanuit een cyclisch perspectief benaderen.
U kunt de levenscyclus van een incident scheiden in afzonderlijke fasen die logisch na elkaar volgen in een cyclus die terugkeert naar het begin. Telkens wanneer u deze cyclus doorloopt (en u zult dit meerdere keren doen), als u deze correct verwerkt, is het mogelijk om terug te keren naar het begin met meer inzicht in uw systemen. Bij bepaalde werkzaamheden kunt u beter voorbereid zijn om snel en effectief te reageren wanneer zich de volgende keer een incident voordoet.
De fasen van een incident
De afzonderlijke fasen van het incidentresponsproces kunnen er enigszins anders uitzien, afhankelijk van het model dat u gebruikt. Voor deze module zijn er vijf fasen die u doorloopt als reactie op een incident:
- Detectie: In deze fase komt de bewakingskennis van een vorige module in dit leertraject aan bod. Uw bewakingshulpprogramma's verzamelen de gegevens uit logboeken, analyseren die informatie op basis van de klantgerichte doelstellingen die u hebt geconfigureerd en sturen u bruikbare waarschuwingen om u te laten weten dat menselijke tussenkomst nodig is.
- Antwoord: Deze fase gebeurt nadat u en uw team die waarschuwing hebben ontvangen. In deze module gaan we dieper in op deze fase, dus er is nog veel meer te zeggen over dit idee.
- Herstel: in deze fase herstelt u de systemen terug naar de normale functionaliteit. Hoe u dat doet, is afhankelijk van de oorzaak van de serviceonderbreking. Het herstellen van de service en deze weer beschikbaar maken voor uw klanten heeft de hoogste prioriteit. Uw taak stopt echter niet zodra dat klaar is.
- Analyse: Als u blijvende waarde van incidenten wilt verkrijgen, moet u hiervan leren. Deze fase is het proces van het verzamelen van de informatie over wat er is gebeurd en wanneer tijdens het incident en om te zien wat u ervan kunt leren door de juiste vragen te stellen. Er is een volledige module over leren van fouten waarmee deze fase wordt opgelost.
- Gereedheid: U moet de geleerde lessen in de analysefase opnemen in uw operationele praktijk. Als er actie-items zijn die ervoor kunnen zorgen dat een vergelijkbare storing in de toekomst wordt voorkomen, zouden die ook deel moeten uitmaken van deze fase.
Voordat u een plan voor incidentrespons maakt, moet u de kenmerken en waarde van incidenten begrijpen en vertrouwd zijn met de fasen van de levenscyclus van het incident. De volgende stap is om ervoor te zorgen dat uw responsstrategie een solide basis krijgt.