Поделиться через


Память и знания в агенте Azure SRE

Агент становится более эффективным с течением времени, запоминая, что работало в прошлых инцидентах и ссылается на вашу документацию.

Схема, показывающая SearchMemory, запрашивающая три источника: прошлые инциденты, воспоминания о пользователях и документы для предоставления обоснованных ответов с ссылкой.

Как работает память

Когда вы задаете вопрос, агент выполняет поиск по всем источникам знаний одновременно.

Исходный материал То, что он находит лучше всего подходит для
Прошлые инциденты Действия, которые устраняли аналогичные проблемы "Как мы исправили это раньше?"
Воспоминания пользователей Факты, которые вы явно сохраняете "Помните, что моя среда использует..."
База знаний Загруженные руководства для выполнения и документы "Следуйте нашей стандартной процедуре"

Агент возвращает обоснованный ответ с кликабельными цитатами, которые показывают, откуда пришла информация.

Автоматическое обучение

Агент учится на каждой беседе. Обучение вручную не требуется.

Схема, показывающая, как агент автоматически извлекает инсайты по завершении каждого сеанса: симптомы, шаги решения, первопричины и подводные камни, которых следует избегать.

После завершения каждого потока агент записывает следующие сведения.

Что нужно сделать Описание
Симптомы, наблюдаемые Сообщения об ошибках, поведение, шаблоны
Действия, которые работали Путь разрешения, успешно выполненный
Коренная причина Что вызвало проблему
Подводные камни, которых следует избегать То, что не работало, неудачи

Этот процесс происходит автоматически. Через тридцать минут после того, как поток затихает, агент оценивает беседу и индексирует полученные знания.

Приоритет одинаковых ресурсов

При изучении проблемы с ресурсом агент определяет приоритеты прошлых сеансов в том же ресурсе.

"App Service app-prod-01 is returning 503 errors"

Агент сначала проверяет, были ли у него проблемы app-prod-01 раньше. Если да, эти учебные курсы появляются сначала, так как они имеют самую высокую релевантность.

Упреждающее сохранение знаний

Помимо обучения на завершенных потоках, ваш агент активно сохраняет то, что он обнаруживает во время бесед. Когда ваш агент сталкивается с чем-то важным (сложной конфигурацией, неочевидной зависимостью или неожиданной проблемой при отладке), он записывает полученные знания в файлы постоянных знаний, сохраняющиеся между сеансами.

Принцип работы

Агент хранит директорию знаний на memories/synthesizedKnowledge/. Агент автоматически загружает специальный файл overview.md в системный командный запрос в начале каждой беседы. Этот подход дает агенту немедленный доступ к наиболее важному контексту в вашей среде.

Компонент Что он делает
overview.md Сводка и индекс службы. Всегда загружается в контекст (примерно 2000 символов в рамках бюджета).
Файлы раздела Подробные заметки о конкретных темах (например, aks-networking-gotchas.md).
Ссылки из обзора overview.md ссылки на файлы разделов, чтобы агент знал, какие подробные знания существуют.

Что сохраняет ваш агент

Агент заранее записывает аналитические сведения во время бесед.

Категория Примеры
Ограничения проблем Эта служба не может масштабироваться более чем до 10 реплик из-за ограничений квоты.
Стратегии, которые работали Перезапуск pod с --grace-period=0 решил проблему зависшего развертывания
Стратегии, которые провалились "Увеличение ограничения памяти не помогло. Проблема заключалась в регулировании ЦП"
Неясные зависимости Фронтенд приложения зависит от прокси-сервера сайдкара, который должен запуститься первым.
Сведения о конфигурации "В рабочей среде используются пользовательские сертификаты TLS, хранящиеся в Key Vault"

Организация знаний

Агент упорядочивает знания семантически по темам, а не хронологично. Каждый файл является автономной ссылкой.

Файл То, что он захватывает
overview.md Сводка по службам, ключевые ссылки, индекс файлов тем (~2000 символов)
team.md Участники команды, функции, экспертиза (~500 символов)
architecture.md Компоненты, подключения, среды (~1500 символов)
logs.md Источники журналов, таблицы, ключевые поля, полезные запросы (~1500 символов)
deployment.md Сведения о конвейере, поиск версий, процедуры отката (~1000 символов)
auth.md Механизмы аутентификации, потоки аутентификации (~800 символов)
debugging.md Распространенные проблемы, руководства по устранению неполадок, ссылки на рабочие инструкции (~1000 символов)
queries/*.md Извлеченные запросы, организованные по разделу (около 1000 символов каждый)

При обновлении существующих знаний агент считывает текущий файл, объединяет новые сведения и удаляет все, что становится устаревшим или неверным.

Подсказка

Вы также можете попросить агента сохранить знания

Помимо автоматической сохраняемости, вы можете явно попросить агента сохранить информацию в его файлах знаний:

Save this to your knowledge: our Redis cache uses Premium tier with 6GB,
and failover takes about 90 seconds.

Агент создает или обновляет файл знаний и связывает его из overview.md.

Этот подход отличается от #remember команд (описанных в следующем разделе), которые сохраняют дискретные факты в отдельном хранилище памяти. Файлы знаний — это структурированные, постоянные ссылки, к которым ваш агент обращается в начале каждой беседы. Воспоминания пользователя — это отдельные факты, доступные для поиска.#retrieve

Воспоминания пользователей

Помимо того, что ваш агент обучается и сохраняет информацию автоматически, вы можете явно сохранить отдельные факты, чтобы агент их запомнил. Воспоминания пользователей идеально подходят для деталей, специфичных для среды, которые могут не проявляться в инцидентах, но важны для контекста.

В следующей таблице описаны хорошие кандидаты для памяти пользователя.

Категория Примеры
Факты среды "В промышленной среде используются три кластера AKS в регионе Запад США 2"
Параметры команды "Мы предпочитаем CLI вместо портала для развертываний"
Сведения об архитектуре "app-service-01 зависит от sql-prod"
Пути эскалации "PagerDuty, затем канал Teams, а затем телефон"

Команды памяти

Управление воспоминаниями пользователей с помощью этих команд чата.

Command Что он делает Пример
#remember Сохранение фактов для будущей ссылки #remember our Redis cache uses Premium tier
#retrieve Поиск сохраненных воспоминаний #retrieve what's our caching setup?
#forget Удаление сохраненной памяти #forget the outdated Redis info

В следующем примере показан типичный рабочий процесс памяти.

Сохраните важный контекст:

#remember Production uses 3 AKS clusters in West US 2
#remember Our escalation path: PagerDuty, then Teams channel, then phone
#remember Database failover takes approximately 15 minutes

Получите позже:

#retrieve how long does database failover take?

Агент отвечает на основе сохраненной памяти: "Переключение базы данных занимает примерно 15 минут".

База знаний

Отправьте документацию и подключите внешние источники, чтобы предоставить агенту более широкую справочную библиотеку.

Схема, показывающая знания, поступающие из отправленных документов и соединителей MCP, все доступные для поиска вместе.

Отправить документы

Перейдите в базу знаний Builder>, чтобы отправить документацию.

Тип документа Хорошо для
Руководства по эксплуатации Пошаговые процедуры инцидентов
Руководства по архитектуре Общие сведения о среде
Сборники схем по вызову Процедуры эскалации и реагирования
Документация по API Знания, относящиеся к службе
Командные процедуры Документация по рабочим процессам и операциям

Поддерживаемые форматы: Markdown (.md), обычный текст (.txt). Максимальный размер файла составляет 16 МБ.

Подключение внешних источников

Доступ к знаниям непосредственно из внешних систем с помощью соединителей.

Connector Что он предоставляет
Azure DevOps Запросите страницы вики ADO
GitHub Репозитории поиска, вики-сайты, проблемы
Microsoft Learn Официальная документация Майкрософт
Пользовательский MCP Любой настроенный источник знаний

Настройте соединители в Параметры > Соединители. Дополнительные сведения см. в разделе Соединители.

Использование знаний в беседах

Ваш агент автоматически выполняет поиск информации, когда это актуально для вопроса.

How should I handle a database failover?

Если вы отправляете модуль Runbook, агент отвечает на запрос с заземленным ответом:

На основе базы данных Runbook(ссылка на ссылку на базу данных) приведены действия по отработки отказа:

  1. Проверьте работоспособность вторичной реплики...

Выберите ссылки на цитирование, чтобы просмотреть полный исходный документ.

Аналитика сеансов

После каждого потока сообщений (синхронной чата или асинхронной автоматически запускаемой задачи) агент создает информацию о сеансе. Аналитика сеансов — это то, как агент становится более умным с течением времени.

Что фиксируется

Каждая инсайт сеанса извлекает структурированные выводы, которые становятся поисковой памятью.

Компонент То, что он захватывает Пример
Симптомы, наблюдаемые Шаблоны ошибок, поведение "Ошибки HTTP 503, память на 95%"
Действия по разрешению Что работало "Масштабированный номер SKU службы приложений"
Коренная причина Почему это произошло "Утечка памяти в развертывании версии 2.3"
Подводные камни, которых следует избегать Что не работало "Перезапуск не помог"

При создании аналитических сведений

В следующей таблице описывается, когда генерируются аналитические сведения о сеансах.

Тип потока Когда Автоматическое или ручное
Синхронизация чата 30 минут после последнего сообщения Автоматический
Асинхронные задачи 30 минут после завершения Автоматический
отзывы пользователей Когда вы оцениваете ответ Вы активируете его

Просмотр аналитических сведений о сеансах

Перейдите к разделу "Мониторинг > аналитики сеансов ", чтобы просмотреть:

  • Временная шкала действий агента
  • Оценки
  • Извлеченные ключевые выводы
  • Ссылки на исходный поток: каждая карточка аналитики ссылается обратно на потоки, которые его создали, чтобы вы могли отслеживать любые сведения до исходной беседы.

Подробные метрики и управление см. в разделе "Мониторинг использования агента".

Лучшие практики

Следуйте этим рекомендациям, чтобы получить наибольшее значение из возможностей памяти и знаний агента.

Выберите, что нужно отправить или подключить.

Upload Подключение через соединитель
Модули Runbook для инцидентов Интерактивные вики-страницы (ADO, GitHub)
Схемы архитектуры Репозитории исходного кода
Процедуры эскалации Данные мониторинга в режиме реального времени
Документация по статическим API Часто обновляемые документы

Хранение знаний в актуальном состоянии

Устаревшие документы вызывают неправильные ответы. Просмотрите базу знаний ежеквартально. Чтобы узнать, какие документы у вашего агента сейчас есть, попросите:

What knowledge documents do you have?

Удалите устаревшие документы в базе знаний Builder>.

Четкое название документов

Используйте описательные имена файлов, чтобы помочь агенту и вашей команде быстро найти нужную документацию.

Не используйте Вместо этого используйте
doc1.txt production-database-failover.md
runbook.md Руководство-по-масштабированию-кластера-aks.md
notes.txt процедуры-эскалации-2026.txt

Следующий шаг

  • Коннекторы: Подключите внешние источники знаний к вашему агенту.
  • Подагенты: создание специализированных агентов с узкими возможностями.