Поделиться через


Руководство: Выполнение глубокого анализа с агентом SRE Azure

Глубокое исследование дает агенту структурированную методологию для сложных проблем. Агент формирует несколько гипотез и проверяет каждый из них с доказательствами. В этом руководстве вы запускаете глубокое исследование из чата и изучаете результаты.

В этом руководстве вы узнаете, как:

  • Запуск глубокого исследования из интерфейса чата
  • Утверждение запроса авторизации
  • Прочитайте интерактивное дерево гипотез
  • Настройка автоматического глубокого исследования в планах реагирования

Необходимые условия

  • Агент Azure SRE в состоянии выполнения
  • По крайней мере один подключенный источник данных (Azure Monitor, Application Insights или пользовательский соединитель)
  • Разрешения для чата с агентом

Начало глубокого исследования из чата

Используйте этот режим, если вы хотите исследовать конкретный вопрос с помощью структурированной причины. Этот режим работает для динамических проблем, проблем с производительностью или сложных вопросов о вашей среде.

Активировать глубокое исследование

В чате агента нажмите + кнопку в левом нижнем углу области ввода чата. Это действие открывает меню конфигурации.

В раскрывающемся списке

Выберите "Глубокое исследование " в меню.

Если вы впервые включаете глубокое исследование, появится диалоговое окно подтверждения, объясняющее, что запросы глубокого исследования направлены на несколько источников данных и могут занять несколько минут. Выберите Да для продолжения.

Диалоговое окно подтверждения с просьбой продолжить глубокое исследование с флажком, чтобы закрыть будущие предупреждения.

Подсказка

Если вы планируете регулярно использовать глубокое исследование, установите флажок Больше не показывать это сообщение. Вы можете отключить его, выбрав X на значке глубокого исследования.

Подтверждение активного глубокого исследования

После подтверждения отображаются два индикатора:

  • Сообщение о состоянии в верхней части чата: "Глубокая проверка включена" со значком в виде искры.
  • Блестящий значок рядом с кнопкой + в нижнем колонтитуле чата, с X, чтобы удалить.

Сообщение чата показывает, что функция

Задайте вопрос

Введите вопрос о преимуществах структурированного исследования. Подходящие кандидаты включают:

Investigate why the java-app container app has high memory usage.
Check logs, metrics, and recent deployments to identify the root cause.
Why are API response times for the payment service degraded since yesterday?

Our AKS cluster nodes keep scaling up. Investigate what's driving the resource pressure.

Correlate the recent deployment with the spike in 500 errors on the orders endpoint.

Нажмите Отправить (или нажмите клавишу ВВОД).

Утверждение авторизации

Для расследований, инициируемых чатом, агент запрашивает авторизацию перед продолжением. Карточка авторизации отображается в чате с двумя параметрами:

Запрос на авторизацию с карточкой исследования, сообщением об утверждении и кнопками

  • Продолжить. Утверждайте расследование и предоставьте агенту повышенные разрешения для запроса ресурсов Azure.
  • Отмена: отклонение расследования. Агент переключается на стандартный ответ.

Замечание

Если вы не отвечаете в течение 10 минут, расследование отменяется автоматически, а агент выполняет стандартное расследование.

Нажмите кнопку "Продолжить", чтобы утвердить. Карточка обновляется, чтобы отобразить зеленую галочку Утверждено.

Просмотрите ход исследования

Откроется панель сведений о расследовании справа от чата, показывающая динамическую визуализацию работы агента.

В ходе исследования показан утвержденный статус, фаза исследования инцидента и шаги расследования.

Расследование следует четырем этапам:

Этап 1, исследование инцидентов: Агент выбирает средства исследования и собирает контекст. Сводная карточка показывает, какие данные были собраны и выполнены действия по расследованию.

Этап исследования инцидентов, показывающий сводку результатов и четыре завершенных этапа расследования.

Этап 2, формирование гипотез: На основе собранного контекста агент создает две до четырех гипотез о потенциальных первопричинах. Каждая карточка гипотезы показывает название и краткое описание.

Три гипотезы, появляющиеся в дереве, каждая с синим индикатором статуса 'Проверяется'.

Этап 3, проверка гипотез: Агент проверяет каждую гипотезу параллельно (до трех одновременно). Состояние таблетки обновляются по мере завершения проверки:

Статус Цвет Значение
Проверка Синий В настоящее время тестируется
Validated Green Доказательства поддерживают эту гипотезу
Недействительный Red Доказательство исключает это
С неопределенным результатом Yellow Недостаточно доказательств для подтверждения или исключения

Проверенные гипотезы на мелких уровнях могут создавать под-гипотезы (до трех уровней глубоко), создавая ветвление дерева путей исследования.

Этап 4, заключение: Агент синтезирует выводы в структурированном выводе. Узел заключения в нижней части дерева суммирует первопричину с поддерживающими доказательствами и рекомендованными действиями.

Подсказка

Выберите любой узел в дереве гипотез, чтобы открыть панель сведений. На этой панели показана полная сводка по расследованию, этапы проверки, собранные доказательства и причины этого этапа.

Отключите глубокое исследование

Режим глубокого исследования остается активным для последующих сообщений. Чтобы отключить его, выполните приведенные далее действия.

  • Нажмите на значок X на значке со сверкающим эффектом рядом с кнопкой +.
  • Выберите +, чтобы отменить выбор глубокого исследования.

Сообщение о состоянии подтверждает: "Глубокая проверка отключена".

Настройка глубокого исследования в планах реагирования на инциденты

Для инцидентов, которые автоматически требуют тщательного анализа (например, сбоев в производственной среде или оповещений критической важности), настройте глубокое исследование в планах реагирования.

Перейдите к Builder>планам реагирования на инциденты на боковой панели портала.

Создание или изменение плана ответа

Создайте новый план ответа или измените существующий. В конфигурации обработчика:

  1. Задайте приоритет на нужные уровни серьезности (например, P1, P2).
  2. Включите переключатель глубокого исследования в параметрах исследования.

Сохранение плана ответа

Сохраните план. Когда инцидент соответствует критериям плана реагирования, агент автоматически запускает глубокое расследование без утверждения.

Замечание

Глубокое расследование, инициированное инцидентом, использует разрешения управляемого удостоверения агента, а не ваше личное удостоверение. Убедитесь, что у управляемого удостоверения агента есть необходимые роли (Reader или Monitoring Reader) на тех ресурсах, которые вы хотите исследовать. Дополнительные сведения см. в разделе Разрешения.

Альтернатива: определение в виде кода

Для команд, управляющих несколькими агентами, определите планы реагирования как YAML:

api_version: azuresre.ai/v2
kind: IncidentFilter
metadata:
  name: production-critical-handler
spec:
  incidentPlatform: PagerDuty
  isEnabled: true
  handlingAgent: production-agent
  priorities:
    - P1
    - P2
  agentMode: Autonomous
  maxAutomatedInvestigationAttempts: 5
  deepInvestigationEnabled: true

Отмена глубокого исследования

Если расследование больше не требуется, его можно отменить в любой момент.

Метод Когда использовать Как
Кнопка "Остановить" Расследование выполняется Нажмите синюю кнопку "Остановить " в нижнем колонтитуле чата.
Отмена авторизации Агент ожидает утверждения Нажмите кнопку "Отмена" на карточке авторизации.
Позвольте завершиться таймауту Вы забыли ответить Через 10 минут срок действия авторизации истекает автоматически.

Частичные результаты всегда сохраняются. Выберите карточку расследования в чате, чтобы просмотреть все, что было завершено до отмены.

Verify

После завершения глубокого исследования подтвердите следующие условия:

  • В карточке исследования в чате отображается зеленая галочка с состоянием Complete.
  • Дерево гипотезы показывает по крайней мере одну проверенную или неуклюзивную гипотезу.
  • Узел вывода отображается в нижней части дерева с рекомендуемыми действиями.
  • При выборе любого узла гипотезы откроется панель сведений с шагами подтверждения и проверки.

Следующий шаг