Поделиться через


Память и знания в агенте Azure SRE

Агент становится более эффективным с течением времени, запоминая, что работало в прошлых инцидентах и ссылается на вашу документацию.

Схема, показывающая SearchMemory, запрашивающая три источника: прошлые инциденты, воспоминания о пользователях и документы для предоставления обоснованных ответов с ссылкой.

Как работает память

Когда вы задаете вопрос, агент выполняет поиск по всем источникам знаний одновременно.

Исходный материал То, что он находит лучше всего подходит для
Прошлые инциденты Действия, которые устраняли аналогичные проблемы "Как мы исправили это раньше?"
Воспоминания пользователей Факты, которые вы явно сохраняете "Помните, что моя среда использует..."
База знаний Загруженные руководства для выполнения и документы "Следуйте нашей стандартной процедуре"

Агент возвращает обоснованный ответ с кликабельными цитатами, которые показывают, откуда пришла информация.

Автоматическое обучение

Агент учится на каждой беседе. Он не нуждается в ручном обучении.

Схема, показывающая, как агент автоматически извлекает инсайты по завершении каждого сеанса: симптомы, шаги решения, первопричины и подводные камни, которых следует избегать.

После завершения каждого потока агент записывает следующие сведения.

Что нужно сделать Описание
Симптомы, наблюдаемые Сообщения об ошибках, поведение, шаблоны
Действия, которые работали Путь разрешения, успешно выполненный
Коренная причина Что вызвало проблему
Подводные камни, которых следует избегать То, что не работало, неудачи

Этот процесс происходит автоматически. Через тридцать минут после того, как поток затихает, агент оценивает беседу и индексирует полученные знания.

Приоритет одинаковых ресурсов

При изучении проблемы с ресурсом агент определяет приоритеты прошлых сеансов в том же ресурсе.

"App Service app-prod-01 is returning 503 errors"

Агент сначала проверяет, были ли у него проблемы app-prod-01 раньше. Если да, эти уроки появляются сначала, потому что они наиболее актуальны.

Упреждающее сохранение знаний

Помимо обучения на завершенных потоках, ваш агент активно сохраняет то, что он обнаруживает во время бесед. Когда ваш агент обнаруживает что-то важное (сложная конфигурация, неочевидная зависимость или сложный момент отладки), он записывает полезные сведения в постоянные файлы знаний, которые сохраняются между сессиями.

Принцип работы

Агент хранит директорию знаний на memories/synthesizedKnowledge/. Агент автоматически загружает специальный файл overview.md в системный командный запрос в начале каждой беседы. Этот подход дает агенту немедленный доступ к наиболее важному контексту в вашей среде.

Компонент Что он делает
overview.md Сводка и индекс службы. Загружается в контекст (бюджет около 2000 символов).
Файлы раздела Подробные заметки о конкретных темах (например, aks-networking-gotchas.md).
Ссылки из обзора overview.md ссылки на файлы разделов, чтобы агент знал, какие подробные знания существуют.

Что сохраняет ваш агент

Агент заранее записывает аналитические сведения во время бесед.

Категория Примеры
Ограничения проблем Эта служба не может масштабироваться более чем на 10 реплик из-за ограничений квоты.
Стратегии, которые работали "Перезапуск pod с --grace-period=0 решил проблему с зависшим развертыванием."
Стратегии, которые провалились "Увеличение ограничения памяти не помогло. Проблема заключалась в регулировании ЦП".
Неясные зависимости Фронтенд приложения зависит от сайдкар-прокси, который должен запускаться первым.
Сведения о конфигурации "В рабочей среде используются пользовательские сертификаты TLS, хранящиеся в Key Vault".

Организация знаний

Агент упорядочивает знания семантически по темам, а не хронологично. Каждый файл является автономной ссылкой.

Файл То, что он захватывает
overview.md Сводка службы, ключевые ссылки, индекс файлов тем (~2000 символов)
team.md Участники группы, роли, опыт (~500 символов)
architecture.md Компоненты, подключения, среды (~1500 символов)
logs.md Источники журналов, таблицы, ключевые поля, полезные запросы (~1500 символов)
deployment.md Сведения о конвейере, поиск версий, процедуры отката (около 1000 символов)
auth.md Механизмы проверки подлинности, потоки удостоверений (~800 символов)
debugging.md Распространенные проблемы, руководства по устранению неполадок, ссылки на инструкции по использованию (около 1000 символов)
queries/*.md Извлеченные запросы, упорядоченные по разделу (~1000 символов каждый)

При обновлении существующих знаний агент считывает текущий файл, объединяет новые сведения и удаляет все, что становится устаревшим или неверным.

Подсказка

Вы также можете попросить агента сохранить знания

Помимо автоматической сохраняемости, вы можете явно попросить агента сохранить информацию в его файлах знаний:

Save this to your knowledge: our Redis cache uses Premium tier with 6GB,
and failover takes about 90 seconds.

Агент создает или обновляет файл знаний и связывает его из overview.md.

Этот подход отличается от #remember команд (описанных в следующем разделе), которые сохраняют дискретные факты в отдельном хранилище памяти. Файлы знаний — это структурированные, постоянные ссылки, к которым ваш агент обращается в начале каждой беседы. Воспоминания пользователя — это отдельные факты, доступные для поиска.#retrieve

Воспоминания пользователей

Помимо того, что ваш агент обучается и сохраняет информацию автоматически, вы можете явно сохранить отдельные факты, чтобы агент их запомнил. Воспоминания пользователей идеально подходят для деталей, специфичных для среды, которые могут не проявляться в инцидентах, но важны для контекста.

В следующей таблице описаны хорошие кандидаты для памяти пользователя.

Категория Примеры
Факты среды "В промышленной среде используются три кластера AKS в регионе Запад США 2"
Параметры команды "Мы предпочитаем CLI вместо портала для развертываний"
Сведения об архитектуре "app-service-01 зависит от sql-prod"
Пути эскалации "PagerDuty, затем канал Teams, а затем телефон"

Команды памяти

Управление воспоминаниями пользователей с помощью этих команд чата.

Command Что он делает Пример
#remember Сохранение фактов для будущей ссылки #remember our Redis cache uses Premium tier
#retrieve Поиск сохраненных воспоминаний #retrieve what's our caching setup?
#forget Удаление сохраненной памяти #forget the outdated Redis info

В следующем примере показан типичный рабочий процесс памяти.

Сохраните важный контекст:

#remember Production uses 3 AKS clusters in West US 2
#remember Our escalation path: PagerDuty, then Teams channel, then phone
#remember Database failover takes approximately 15 minutes

Получите позже:

#retrieve how long does database failover take?

Агент отвечает на основе сохраненной памяти: "Переключение базы данных занимает примерно 15 минут".

База знаний

Отправьте документацию и подключите внешние источники, чтобы предоставить агенту более широкую справочную библиотеку.

Схема, показывающая знания, поступающие из отправленных документов и соединителей MCP, все доступные для поиска вместе.

Отправить документы

Перейдите вбазу знаний>, чтобы отправить документацию. Полные сведения о поддерживаемых форматах, ограничениях и том, как агент автоматически создает знания, см. в разделе "Отправка документов знаний".

Тип документа Хорошо для
Руководства по эксплуатации Пошаговые процедуры инцидентов
Руководства по архитектуре Общие сведения о среде
Сборники схем по вызову Процедуры эскалации и реагирования
Документация по API Знания, относящиеся к службе
Командные процедуры Документация по рабочим процессам и операциям

Поддерживаемые форматы: Markdown, обычный текст, PDF, Word, PowerPoint, Excel, изображения и многое другое. Максимальный размер составляет 16 МБ на файл. Полный список см. в разделе «Загрузка документов знаний».

Подключение внешних источников

Доступ к знаниям непосредственно из внешних систем с помощью соединителей. Полный список поддерживаемых источников см. в разделе "Соединители".

Connector Что он предоставляет
Azure DevOps Запросите страницы вики ADO
GitHub Репозитории поиска, вики-сайты, проблемы
Пользовательский MCP Любой настроенный источник знаний

Настройте соединители в Builder>Соединители. Дополнительные сведения см. в разделе Соединители.

Использование знаний в беседах

Ваш агент автоматически выполняет поиск информации, когда это актуально для вопроса.

How should I handle a database failover?

Если вы отправляете модуль Runbook, агент отвечает на запрос с заземленным ответом:

На основе базы данных Runbook(ссылка на ссылку на базу данных) приведены действия по отработки отказа:

  1. Проверьте работоспособность вторичной реплики...

Выберите ссылки на цитирование, чтобы просмотреть полный исходный документ.

Аналитика сеансов

После каждого потока сообщений (синхронной чата или асинхронной автоматически запускаемой задачи) агент создает информацию о сеансе. Аналитика сеансов — это то, как агент становится более умным с течением времени.

Что фиксируется

Каждая инсайт сеанса извлекает структурированные выводы, которые становятся поисковой памятью.

Компонент То, что он захватывает Пример
Симптомы, наблюдаемые Шаблоны ошибок, поведение "Ошибки HTTP 503, память на 95%"
Действия по разрешению Что работало "Масштабированный номер SKU службы приложений"
Коренная причина Почему это произошло "Утечка памяти в развертывании версии 2.3"
Подводные камни, которых следует избегать Что не работало "Перезапуск не помог"

Когда система создает аналитические сведения

В следующей таблице описывается, когда система создает аналитические сведения о сеансах.

Тип потока Когда Автоматическое или ручное
Синхронизация чата 30 минут после последнего сообщения Автоматический
Асинхронные задачи 30 минут после завершения Автоматический
отзывы пользователей Когда вы оцениваете ответ Вы активируете его

Просмотр аналитических сведений о сеансах

Перейдите к разделу "Мониторинг>аналитики сеансов ", чтобы просмотреть:

  • Временная шкала действий агента
  • Оценки
  • Извлеченные ключевые выводы
  • Ссылки на исходный поток: каждая карточка аналитики ссылается обратно на потоки, которые его создали, чтобы вы могли отслеживать любые сведения до исходной беседы.

Подробные метрики и управление см. в разделе "Мониторинг использования агента".

Лучшие практики

Следуйте этим рекомендациям, чтобы получить наибольшее значение из возможностей памяти и знаний агента.

Выберите, что нужно отправить или подключить.

Upload Подключение через соединитель
Модули Runbook для инцидентов Интерактивные вики-страницы (ADO, GitHub)
Схемы архитектуры Репозитории исходного кода
Процедуры эскалации Данные мониторинга в режиме реального времени
Документация по статическим API Часто обновляемые документы

Хранение знаний в актуальном состоянии

Устаревшие документы вызывают неправильные ответы. Просмотрите базу знаний ежеквартально. Чтобы узнать, какие документы у вашего агента сейчас есть, попросите:

What knowledge documents do you have?

Удалите устаревшие документы в базе знаний Builder>.

Четкое название документов

Используйте описательные имена файлов, чтобы помочь агенту и вашей команде быстро найти нужную документацию.

Не используйте Вместо этого используйте
doc1.txt production-database-failover.md
runbook.md Руководство-по-масштабированию-кластера-aks.md
notes.txt процедуры-эскалации-2026.txt
Ресурс Почему это важно
Загрузка документов знаний Подробная поддержка формата файлов, ограничения и знания, созданные агентом
Соединители Как соединители переносят внешние данные в агент
Пользовательские агенты Как настраиваемые агенты используют знания в рабочих процессах