Caratteristiche e ciclo di vita di un evento imprevisto
- 4 minuti
Come si è appreso nell'ultima unità, un evento imprevisto è un'interruzione del servizio che influisce sui clienti e sugli utenti finali. Gli incidenti si presentano in molte forme, che vanno dai rallentamenti delle prestazioni che frustrano gli utenti ("lento è il nuovo guasto") ai crash del sistema che rendono il servizio o il sito totalmente indisponibile per un periodo di tempo.
Caratteristiche di un evento imprevisto
Gli incidenti sono in genere inaspettati e sembrano verificarsi nel momento peggiore possibile (ad esempio alle 2:00 di notte, o quando sei profondamente immerso in un progetto importante). Questo è il motivo per cui gli incidenti sono comunemente temsi ed evitati, anche al punto in cui le persone a volte abbassano il significato di un evento imprevisto. La pressione interna è talvolta così grande in un'organizzazione c'è una tentazione di etichettare erroneamente o di non segnalare un'interruzione per paura di rimproverare.
Almeno, gli eventi imprevisti creano un lavoro non pianificato e, poiché si dedica la maggior parte del tempo al lavoro pianificato con una buona idea di ciò che si dovrebbe fare, è probabile che si pensi a eventi imprevisti come cose cattive. Tuttavia, esiste un altro modo per esaminarlo: gli eventi imprevisti sono realmente investimenti* nel fornire il valore che si sta tentando di offrire agli utenti finali. Indipendentemente dalla causa dell'evento imprevisto o dall'entità dell'impatto, tutti gli eventi imprevisti hanno un'unica cosa in comune: possono offrire esperienze di apprendimento preziose.
È consigliabile visualizzare gli eventi imprevisti come impulso dei sistemi. Ti dicono di più sul sistema di quanto tu abbia capito in precedenza, e che la conoscenza è una cosa buona. Quando si ha una solida base di monitoraggio e si sa di più su cosa sta succedendo nel sistema, genera inevitabilmente più avvisi e eventi imprevisti e opportunità di risposta. Quantomeno, gli incidenti indicano cosa sta succedendo e quindi aumentano la consapevolezza operativa. In un modulo precedente sul monitoraggio, abbiamo suggerito che questo fosse un importante precursore del lavoro sull'affidabilità.
Ciclo di vita di un evento imprevisto
Se si vuole elevare lo stato del team di risposta agli eventi imprevisti a "elite/high performer", è necessario guardare oltre l'idea di un'interruzione del servizio o di un evento imprevisto come una semplice sequenza temporale lineare e avvicinarla dal punto di vista ciclico.
È possibile separare il ciclo di vita di un evento imprevisto in fasi distinte che seguono logicamente uno dopo l'altro in un ciclo che torna all'inizio. Ogni volta che si percorre questo ciclo (e lo farai molte volte), se lo si gestisce correttamente, è possibile tornare all'inizio con una maggiore comprensione dei propri sistemi. Con un certo lavoro intenzionale, è anche possibile essere più preparati a rispondere rapidamente ed efficacemente la prossima volta che si verifica un incidente.
Fasi di un evento imprevisto
Le singole fasi del processo di risposta agli eventi imprevisti hanno un aspetto leggermente diverso a seconda del modello usato. Ai fini di questo modulo, sono disponibili cinque fasi per rispondere a un evento imprevisto:
- Rilevamento: questa fase è la posizione in cui entra in gioco la conoscenza di monitoraggio di un modulo precedente in questo percorso di apprendimento. Gli strumenti di monitoraggio raccolgono le informazioni dai log, analizzano tali informazioni in base agli obiettivi incentrati sui clienti configurati e inviano avvisi interattivi per informare che è necessario l'intervento umano.
- Risposta: questa fase è ciò che accade dopo che l'utente e il team ricevono tale avviso. Questa fase verrà descritta in dettaglio in questo modulo, quindi ci saranno molte altre informazioni su questa idea in un attimo.
- Correzione: questa fase consente di ripristinare le normali funzionalità dei sistemi. Questa operazione dipende dalla causa dell'interruzione del servizio. Far tornare operativo il servizio e renderlo disponibile ai tuoi clienti è la tua massima priorità. Tuttavia, il lavoro non si arresta una volta completato.
- Analisi: per ottenere un valore duraturo dagli eventi imprevisti, è necessario imparare da essi. Questa fase è il processo di raccolta delle informazioni su ciò che è accaduto e quando durante l'evento imprevisto e vedere ciò che si può imparare da esso ponendo le domande giuste. È disponibile un intero modulo sull'apprendimento da errore che risolve questa fase.
- Idoneità: è necessario incorporare le lezioni apprese nella fase di analisi nella pratica operativa. Se in futuro sono presenti elementi di azione che consentono di evitare un'interruzione simile, farebbero anche parte di questa fase.
Prima di creare un piano di risposta agli eventi imprevisti, è necessario comprendere le caratteristiche e il valore degli eventi imprevisti e acquisire familiarità con le fasi del ciclo di vita degli eventi imprevisti. Il passaggio successivo consiste nel garantire che la strategia di risposta sia basata su una solida base.