Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Tempo stimato: 10 minuti
Connettere la piattaforma degli eventi imprevisti e creare un piano di risposta. Quando arrivano gli eventi imprevisti, l'agente analizza automaticamente e genera piani di esecuzione dettagliati.
Ciò che si ottiene
Al termine di questo passaggio, l'agente:
- Riceve eventi imprevisti da Monitoraggio di Azure, PagerDuty o ServiceNow
- Analizza automaticamente gli eventi imprevisti corrispondenti
- Genera piani di esecuzione di intelligenza artificiale dalle istruzioni
- Raccoglie le prove e fornisce raccomandazioni
Prerequisiti
| Requisito | dettagli |
|---|---|
| Agente creato | Completare il passaggio 1: Creare prima l'agente . |
| Piattaforma eventi imprevisti | Monitoraggio di Azure (impostazione predefinita), PagerDuty o ServiceNow. |
Suggerimento
Anche se non è necessario, completare il passaggio 2: Aggiungere informazioni e passaggio 3: Connettere il codice sorgente migliora significativamente la risposta agli eventi imprevisti. L'agente fa riferimento ai runbook e correla i problemi a modifiche specifiche del codice, trasformando le indagini generiche in un'analisi della causa fondamentale specifica del team.
Connetti la piattaforma degli incidenti
Scegliere e configurare la piattaforma degli eventi imprevisti usata dal team.
Monitoraggio di Azure (impostazione predefinita)
Azure Monitor si connette automaticamente quando crei l'agente. Non è necessaria alcuna configurazione aggiuntiva.
PagerDuty o ServiceNow
Per connettere PagerDuty o ServiceNow come piattaforma di eventi imprevisti:
- Selezionare Impostazioni nella barra laterale sinistra.
- Selezionare Piattaforma incidenti.
- Scegliere la piattaforma dall'elenco a discesa:
- PagerDuty: immettere la chiave di accesso all'API REST.
- ServiceNow: immettere l'URL e le credenziali dell'istanza.
- Seleziona Salva.
L'agente riceve ora eventi imprevisti dalla piattaforma.
Creare un piano di risposta
Creare piani di risposta dall'area di disegno del costruttore di subagenti. È possibile vedere quali trigger instradano a quali subagenti.
- Selezionare Builder nella barra laterale sinistra.
- Selezionare Generatore subagente.
- Trova il subagente che vuoi utilizzare per gestire gli incidenti e fai clic sul pulsante + sul lato sinistro.
- Selezionare Aggiungi trigger eventi imprevisti.
- Configurare il trigger: impostare un nome, selezionare i livelli di gravità (ad esempio P1 e P2), scegliere il servizio interessato e, facoltativamente, aggiungere un filtro per parole chiave title.
- Scegliere il livello di autonomia (è consigliabile iniziare la revisione ).
- Visualizzare in anteprima gli eventi imprevisti corrispondenti e quindi selezionare Crea.
Il trigger viene visualizzato come nodo connesso al subagente nell'area di disegno.
Suggerimento
Quando si connette per la prima volta una piattaforma di eventi imprevisti, il sistema potrebbe creare automaticamente un piano di risposta di avvio rapido predefinito. Se si configurano trigger personalizzati tramite il generatore subagente, eliminare il piano predefinito dal Generatore>piani di risposta agli incidenti per evitare conflitti. Due piani sovrapposti possono causare la gestione degli incidenti da parte del subagente sbagliato o portare a duplicati.
Per la guida dettagliata completa con screenshot, vedere l'esercitazione Configurare un trigger di eventi imprevisti.
Cosa accade quando arriva un evento imprevisto
Quando un incidente corrisponde al tuo piano, l'agente lo gestisce automaticamente.
- Recupera i dettagli degli eventi imprevisti dalla piattaforma.
- Cerca nella memoria per incidenti passati simili e documentazione pertinente.
- Esegue il piano eseguendo comandi e raccogliendo prove.
- Riepilogo dei risultati con marche temporali e raccomandazioni.
Risultati di esempio
L'esempio seguente mostra i risultati di un evento imprevisto dell'app contenitore:
Summary:
- Il contenitore è stato riavviato intorno alle 01:27Z con una diminuzione brusca della memoria.
- Configurazione corrente: 2 Gi memoria, 1 CPU, minReplicas=2, maxReplicas=4.
Causa probabile: Riavvio temporaneo del contenitore (OOM o distribuzione).
Azioni consigliate:
- Aumentare minReplicas a 3-4 per ridurre l'impatto sul riavvio.
- Esaminare le sonde di integrità dei contenitori.
L'agente fornisce consigli interattivi basati su prove, non consigli generici.