Udostępnij za pośrednictwem


Krok 4. Konfigurowanie reagowania na zdarzenia w agencie usługi Azure SRE

Szacowany czas: 10 minut

Połącz platformę zdarzeń i utwórz plan reagowania. Po nadejściu zdarzeń agent automatycznie bada i generuje szczegółowe plany wykonania.

Co osiągasz

Po zakończeniu tego kroku agent:

  • Odbiera zdarzenia z usługi Azure Monitor, PagerDuty lub ServiceNow
  • Automatyczne badanie pasujących zdarzeń
  • Generuje plany wykonawcze dla AI na bazie twoich instrukcji
  • Zbiera dowody i udostępnia zalecenia

Wymagania wstępne

Wymaganie Szczegóły
Utworzono agenta Wykonaj krok 1. Najpierw utwórz agenta .
Platforma incydentów Azure Monitor (wartość domyślna), PagerDuty lub ServiceNow.

Wskazówka

Chociaż nie jest to wymagane, ukończenie kroku 2. Dodawanie wiedzy i krok 3. Łączenie kodu źródłowego znacznie zwiększa odpowiedź na zdarzenia. Twój agent odwołuje się do runbooków i wiąże problemy z określonymi zmianami kodu, przekształcając ogólne badania w analizę głównej przyczyny specyficznej dla danego zespołu.

Połącz swoją platformę incydentów

Wybierz i skonfiguruj platformę incydentów używaną przez zespół.

Azure Monitor (ustawienie domyślne)

Usługa Azure Monitor łączy się automatycznie podczas tworzenia agenta. Nie jest wymagana żadna dodatkowa konfiguracja.

PagerDuty lub ServiceNow

Aby połączyć rozwiązanie PagerDuty lub ServiceNow jako platformę zdarzeń:

  1. Wybierz pozycję Ustawienia na pasku bocznym po lewej stronie.
  2. Wybierz Platforma incydentów.
  3. Wybierz platformę z listy rozwijanej:
    • PagerDuty: wprowadź klucz dostępu interfejsu API REST.
    • ServiceNow: wprowadź adres URL swojego wystąpienia oraz dane uwierzytelniające.
  4. Wybierz opcję Zapisz.

Agent odbiera teraz zdarzenia z twojej platformy.

Stwórz plan reagowania

Tworzenie planów odpowiedzi na podstawie kanwy konstruktora subagent . Zobaczysz, które wyzwalacze kierują do których podagentów.

  1. Wybierz pozycję Konstruktor na pasku bocznym po lewej stronie.
  2. Wybierz pozycję Konstruktor podrzędny.
  3. Znajdź subagenta, którego chcesz, aby obsługiwał incydenty, i wybierz przycisk + po lewej stronie.
  4. Wybierz pozycję Dodaj wyzwalacz zdarzenia.
  5. Skonfiguruj wyzwalacz: ustaw nazwę, wybierz poziomy ważności (na przykład P1 i P2), wybierz usługę, której dotyczy ten wpływ, i opcjonalnie dodaj filtr słowa kluczowego tytułu.
  6. Wybierz poziom autonomii (zaleca się rozpoczęcie od poziomu Przegląd).
  7. Wyświetl podgląd pasujących zdarzeń, a następnie wybierz pozycję Utwórz.

Wyzwalacz jest wyświetlany jako węzeł połączony z podagentem na kanwie.

Wskazówka

Po pierwszym połączeniu platformy zdarzeń system może automatycznie utworzyć domyślny plan odpowiedzi szybkiego startu . Jeśli skonfigurujesz własne wyzwalacze za pomocą konstruktora Subagent, usuń plan domyślny zplanów reagowania na zdarzenia>, aby uniknąć konfliktów. Dwa nakładające się plany mogą powodować, że zdarzenia są obsługiwane przez niewłaściwego podagenta lub są zduplikowane.

Pełny przewodnik krok po kroku z zrzutami ekranu można znaleźć w samouczku Konfigurowanie wyzwalacza zdarzenia.

Plany odpowiedzi wyświetlane na kanwie konstruktora podrzędnego.

Co się stanie po nadejściu zdarzenia

Gdy incydent jest zgodny z planem, agent obsługuje go automatycznie.

  1. Pobiera szczegóły zdarzenia z platformy.
  2. Wyszukuje pamięć pod kątem podobnych zdarzeń z przeszłości i odpowiedniej dokumentacji.
  3. Wykonuje plan , uruchamiając polecenia i zbierając dowody.
  4. Podsumowuje wyniki ze znacznikami czasu i zaleceniami.

Wyszukiwanie w pamięci pokazujące wcześniejsze incydenty i odpowiednią dokumentację.

Przykładowe ustalenia

W poniższym przykładzie pokazano wyniki zdarzenia aplikacji kontenera:

Summary:

  • Kontener został ponownie uruchomiony około 01:27Z, a zużycie pamięci gwałtownie spadło.
  • Bieżąca konfiguracja: 2 Gi pamięci, 1 procesor CPU, minReplicas=2, maxReplicas=4.

Prawdopodobna przyczyna: Przejściowe ponowne uruchomienie kontenera (OOM lub wdrożenie).

Zalecane akcje:

  1. Zwiększ wartość minReplicas do 3–4, aby zmniejszyć wpływ ponownego uruchomienia.
  2. Przejrzyj sondy kondycji kontenera.

Agent udostępnia zalecenia umożliwiające podejmowanie działań na podstawie dowodów, a nie ogólnych porad.

Następne kroki