Condividi tramite


Automazione del flusso di lavoro nell'agente SRE di Azure

Suggerimento

  • Gestisci gli incidenti dall'inizio alla fine senza svegliare nessuno.
  • Eseguire automaticamente le attività pianificate con supervisione umana quando necessario.
  • Applicare le conoscenze degli eventi imprevisti passati in modo coerente ogni volta.

Il problema: i trasferimenti manuali rallentano tutto

I flussi di lavoro operativi si estendono su più strumenti e richiedono a un utente di ricordare le novità successive. Si controlla lo stato in un sistema, si decide, si esegue in un altro e si invia una notifica al team in un terzo. Ogni trasferimento aggiunge latenza e rischi.

Funzionamento dell'automazione del flusso di lavoro

Usando l'automazione del flusso di lavoro, è possibile raggiungere gli obiettivi seguenti:

  • Creare flussi di lavoro automatizzati eseguiti in base alla pianificazione o in risposta a eventi imprevisti.
  • Usare subagenti con strumenti specifici per attività specializzate.
  • Costruire flussi end-to-end che attivano, analizzano, eseguono azioni e inviano notifiche.

Quando un trigger viene attivato (ora pianificata o evento imprevisto), l'agente segue questa procedura:

  1. Riceve il trigger quando viene eseguita un'attività pianificata o un incidente corrisponde a un piano di risposta.
  2. Richiama il subagente: il sottoagente configurato inizia con gli strumenti e le istruzioni.
  3. Esegue il flusso di lavoro: il subagente analizza, esegue azioni e coordina con altri subagenti, se necessario.
  4. Notifica al team: i risultati vengono pubblicati in Teams, nella posta elettronica o nella piattaforma degli eventi imprevisti.

Ogni subagente ha accesso a strumenti specifici (dai connettori) e segue le istruzioni in modo autonomo o con approvazione, a seconda della modalità di esecuzione.

Cosa rende questo diverso

Questa sezione descrive il confronto tra l'automazione del flusso di lavoro e altri approcci.

A differenza degli script, l'agente si adatta quando cambiano i modelli. Gli script si interrompono quando gli input variano. L'agente decide come agire in base a quanto rileva.

A differenza dei runbook, l'agente esegue il flusso di lavoro, non solo la documenta. I runbook indicano cosa devono fare le persone. L'agente lo fa.

A differenza dell'automazione in stile IFTTT, l'agente analizza prima di agire. Non viene eseguito automaticamente quando un trigger viene attivato. Valuta la situazione e decide la risposta appropriata.

Prima e dopo

Nella tabella seguente viene illustrato come l'automazione del flusso di lavoro modifica le attività operative comuni.

Prima Dopo
Controllare lo stato nello strumento di monitoraggio Interrogazioni automatiche dell'agente
Decidere cosa fare in base ai dati Motivi dell'agente e proposte di azione
Eseguire correzioni in un altro sistema L'agente viene eseguito tramite strumenti connessi
Inviare una notifica al team in Slack/Teams Agent invia una notifica contestuale
Registrare cosa è successo L'agente registra le azioni nel thread

Creare un flusso di lavoro

I flussi di lavoro combinano tre blocchi costitutivi.

Blocco di base Funzionamento Dove configurare
Connettori Fornire strumenti da sistemi esterni (Outlook, Teams, GitHub, PagerDuty) Builder > Connettori
Subagenti Lavoratori specializzati con impostazioni specifiche di accesso e autonomia degli strumenti Costruttore > Subagente generatore
Trigger Avviare i flussi di lavoro in base alla pianificazione o in risposta agli eventi imprevisti Attività pianificate del costruttore > / Piani di risposta agli incidenti

Per la configurazione dettagliata, vedere Passaggio 5: Automatizzare le azioni nella guida introduttiva.

Esempio: report sulla salute giornaliero con posta elettronica

Questo flusso di lavoro controlla l'integrità delle risorse di Azure e invia un riepilogo ai messaggi di posta elettronica.

  1. Connettore: aggiungere Invia messaggio di posta elettronica (Office 365 Outlook).

  2. Subagent: crea health-reporter con il SendOutlookEmail strumento.

  3. Attività pianificata: collegarsi al subagent con questo prompt:

    Check the health of Azure resources in prod-rg:
    1. Query Azure Resource Health for any degraded resources
    2. Check Application Insights for error rate trends
    3. Summarize findings
    4. Email the report using SendOutlookEmail
    

L'agente esegue questa operazione ogni giorno, indaga e invia l'email senza passaggi manuali.

Delega di subagente

Usare più subagenti quando un flusso di lavoro necessita di competenze diverse in passaggi diversi.

Passo Subagente Ragione
Diagnostica del database @DatabaseExpert Query KQL specializzate
Inviare notifiche @Notifier Strumenti di posta elettronica e Teams
Creare eventi imprevisti @IncidentCreator Integrazione di PagerDuty/ServiceNow

L'agente di orchestrazione delega le attività ai subagenti in base alle esigenze. Per altre informazioni, vedere Subagenti.

Procedure consigliate

La tabella seguente riepiloga le procedure consigliate per l'automazione del flusso di lavoro.

Pratica Perché è importante
Testare prima in Playground Verificare il comportamento del subagente prima di collegarsi a un trigger
Avvia in modalità revisione Verificare il giudizio dell'agente prima dell'automazione completa
Eseguire il test con "Esegui attività ora" Convalidare i flussi di lavoro pianificati prima della messa in produzione
Uno strumento per subagent Più facile da controllare, eseguire il debug e l'aggiornamento
Usare nomi descrittivi Confronto tra email-health-report e subagent-1

Suggerimento

Testare i subagenti nel Playground

Prima di allegare un'attività pianificata, testare il sottoagente:

  1. Passare a Generatore>Generatore subagente.
  2. Selezionare Test playground view (Visualizza parco giochi di test ).
  3. Selezionare un subagente dall'elenco a discesa e selezionare Applica.
  4. Digita le istruzioni pianificate nel pannello Test e verifica che l'agente le esegua correttamente.

Una volta sicuri del comportamento, allegare il trigger.

Passo successivo

Capability Elementi aggiunti
Attività pianificate Monitoraggio proattivo e modelli di attività ricorrenti
Implementare mitigazioni Azioni che i flussi di lavoro possono eseguire
Inviare notifiche Modelli e canali di notifica
Risposta agli eventi imprevisti Attivatori del piano di risposta
Subagenti Configurazione dettagliata del subagente
Connettori Integrazioni degli strumenti disponibili