Tracciamento degli eventi imprevisti
- 7 minuti
Gli eventi imprevisti hanno un ciclo di vita. Per rispondere in modo più efficace, è necessario essere in grado di tenere traccia dell'evoluzione dell'evento imprevisto stesso e dell'evoluzione della risposta, fin dall'inizio del ciclo di vita.
Valutare le informazioni che si conoscono
Un buon modo per valutare la procedura di rilevamento degli eventi imprevisti usando un evento imprevisto specifico consiste nel porsi una serie di domande:
- Quando hai conosciuto per la prima volta il problema? Se l'obiettivo è ridurre il tempo necessario per il ripristino da eventi imprevisti, è necessario iniziare a acquisire informazioni dal momento in cui si diventa consapevoli dei problemi.
- Come hai scoperto il problema? Il sistema di monitoraggio ha avvisato dell'evento imprevisto? Hai mai sentito parlare di esso dai tuoi clienti che si lamentano, direttamente o sui social media?
- Se stai solo cercando di capire il problema, sei il primo a saperlo? In tal caso, a chi devi notificare? In caso contrario, chi è a conoscenza del problema?
- Se altri sono consapevoli, cosa viene fatto (se qualcosa) su di esso? Tutti presupporre che qualcun altro lo stia esaminando o che qualcuno abbia iniziato a intervenire per risolverlo?
- Quanto male è? Potremmo non avere alcuna nozione di gravità o impatto, e non c'è posto per noi per scoprire quanto sia grave il problema e chi è interessato.
Queste possono essere domande difficili da rispondere se non viene monitorato nulla.
Standardizzare la posizione in cui verranno rilevate le informazioni sugli eventi imprevisti
Ci sono molti luoghi possibili in cui è possibile conservare e condividere l'elenco degli incidenti (attivi o meno) e tutte le informazioni aggiornate su tali incidenti. Possono essere semplici come un'area di file condivisa con documenti di Word e complessi come software e servizi di rilevamento degli eventi imprevisti altamente specializzati. Tra questi due estremi ci sono i sistemi di gestione dei ticket e di monitoraggio del lavoro che è possibile utilizzare per questa attività. Quale sistema scelto è in realtà meno importante di come usarlo. Indipendentemente dal sistema usato, tutti coloro che potrebbero avere qualsiasi connessione a eventi imprevisti (tecnici, assistenza clienti, gestione, pubbliche relazioni, legali e così via) devono sapere dove trovare il sistema, come generare un evento imprevisto e come accedere ai dati quando appropriato. Un modo sicuro per non riuscire con il rilevamento degli eventi imprevisti consiste nel fare in modo che le persone che supporteranno non sappiano come arrivare al sistema ("qual è l'URL del nostro sistema?") quando ne hanno bisogno.
In questo modulo, useremo la funzionalità degli elementi di lavoro di Azure DevOps per il nostro sistema di tracciamento di esempio.
Creare un ponte di conversazione
Per rispondere ad alcune delle domande della sezione Valutazione degli elementi noti e per avviare il processo di risposta agli eventi imprevisti, è necessario avere un modo per comunicare con altri utenti sull'evento imprevisto. Idealmente, questo sarà un mezzo elettronico di "collaborazione di squadra" per la conversazione, anche i ponti telefonici funzionano bene. I ponti telefonici e tramite teleconferenza sono meno preferibili perché è più difficile rivedere retroattivamente le comunicazioni sugli eventi imprevisti (da cui il ruolo del "trascrittore" citato prima).
Qualunque mezzo tu scelga, dovresti essere sicuro di ritagliare un canale unico strettamente limitato alla discussione su questo incidente e nient'altro. È importante tenere fuori discussioni irrilevanti da questo canale, perché è necessario poter acquisire e analizzare i dati in un secondo momento nella revisione post-incidente.
In questo modulo si userà Microsoft Teams come metodo di comunicazione degli eventi imprevisti.
Automatizzare l'avvio del rilevamento degli eventi imprevisti
Quindi, esaminiamo i pezzi che abbiamo messo insieme finora. Abbiamo un:
- Elenco delle persone reperibili (e una rotazione definita per loro).
- Ruolo che è possibile assegnare alle persone che lavorano su un evento imprevisto.
- Luogo specifico in cui dichiareremo l'evento imprevisto e lo monitoreremo.
- Unico canale per le persone che lavorano su quell'incidente per comunicare a riguardo.
È possibile e si dovrebbe automatizzare la creazione e la gestione di tutti questi elementi nel modo più completo possibile. Quando si verifica un problema urgente, non è necessario ricordare tutti i passaggi necessari per generare un evento imprevisto, portare le persone giuste in e monitorarlo. Tutto quello che vuoi veramente fare è essere in grado di premere il pulsante "vai" affinché il lavoro possa iniziare immediatamente ad affrontare il problema.
Usare App per la logica per l'automazione senza codice
Un modo per automatizzare la risposta iniziale consiste nell'usare App per la logica, che consente di semplificare il processo di pianificazione, automazione e orchestrazione di attività, processi aziendali e flussi di lavoro.
Logic Apps è un servizio cloud di Azure per la creazione di soluzioni di integrazione. Usa i connettori per creare flussi di lavoro automatizzati . I trigger avviano l'app per la logica quando si verifica un evento specifico o quando i dati soddisfano i criteri specificati. Le azioni sono le operazioni che vengono quindi eseguite nel flusso di lavoro dell'app per la logica.
Per il nostro esempio, utilizzeremo i seguenti connettori di Logic App per il tracciamento degli incidenti:
- Azure Boards (parte di Azure DevOps), che è possibile usare per creare e tenere traccia di problemi o eventi imprevisti.
- Archiviazione di Azure, in cui è possibile archiviare e recuperare informazioni su chi è in chiamata, in modo da poter assegnare le persone appropriate per rispondere all'evento imprevisto. In questo esempio, useremo Azure Table Storage perché offre un archivio "chiave-valore" molto semplice che semplifica l'archiviazione di un elenco di tecnici e la loro disponibilità.
- Microsoft Teams, che è possibile usare per creare un nuovo canale di eventi imprevisti univoco per tenere traccia delle conversazioni dei team di progettazione in tempo reale mentre comunicano su eventi imprevisti specifici. In questo modo è possibile mantenere le interazioni in relazione alla sequenza temporale degli eventi in un secondo momento durante l'esecuzione di una revisione post-evento imprevisto.
A questo punto è possibile collegare tutto questo insieme a un'app per la logica. Per prima cosa, dai un'occhiata all'app completa come mostrata nel Logic Apps Designer, poi la esamineremo passo dopo passo.
Il primo passaggio consiste nel gestire un trigger, ovvero la richiesta HTTP menzionata. Viene effettuata una richiesta HTTP POST all'app per la logica che contiene un payload JSON con informazioni sull'evento imprevisto da dichiarare. Analizziamo il payload e inviamo un riconoscimento di ricezione:
Usando queste informazioni, viene creato un nuovo elemento di lavoro nell'organizzazione Azure DevOps che rappresenta questo evento imprevisto.
Verrà quindi creato un nuovo canale di Teams per l'evento imprevisto:
Dopo aver creato il canale, l'elemento di lavoro creato un attimo fa viene aggiornato con un collegamento al nuovo canale. In questo modo tutte le informazioni si trovano nella stessa posizione (l'elemento di lavoro) e consentono agli utenti di esaminarlo in un secondo momento per sapere dove andare se vogliono unirsi a tale canale.
A questo punto è il momento di coinvolgere la persona in servizio. Viene eseguita una ricerca in Azure Table Storage per l'indirizzo email dell'ingegnere elencato come reperibile. Verrà restituita una risposta JSON, che verrà quindi analizzata.
Poiché la query restituirà un elenco, è necessario scorrere ogni elemento dell'elenco come passaggio successivo. L'elemento di lavoro viene assegnato a ogni persona, che diventa "proprietaria" dell'evento imprevisto.
Quindi, come passaggio finale, viene inviato un messaggio al canale di Microsoft Teams con un collegamento all'elemento di lavoro per le persone che si uniscono al canale e vogliono sapere dove sono archiviate le informazioni autorevoli per quell'incidente.
Questo è solo un esempio di come è possibile automatizzare la configurazione dei meccanismi per il rilevamento e la comunicazione degli eventi imprevisti. Nell'unità successiva verranno approfonditi alcuni aspetti della comunicazione relativi a un evento imprevisto.