Поделиться через


Память в службе агента Microsoft Foundry Agent (предварительная версия)

Это важно

Память (предварительная версия) в службе агента Foundry и API хранилища памяти (предварительная версия) лицензируются вам в рамках подписки Azure и подпадают под условия, применимые к "предварительным версиям" в Условиях использования продуктов Microsoft и Дополнении о защите данных для продуктов и услуг Microsoft, а также условиям предварительной версии Служб генеративных AI в Дополнительных условиях использования предварительных версий Microsoft Azure.

Память в службе Microsoft Foundry Agent — это управляемое, долгосрочное решение для памяти. Он обеспечивает бесперебойную работу агента в сеансах, на устройствах и в рабочих процессах. Создавая хранилища памяти и управляя ими, можно создавать агенты, которые сохраняют пользовательские предпочтения, поддерживают журнал бесед и предоставляют персонализированные возможности.

В этой статье представлен обзор памяти агента, включая ее понятия, варианты использования и ограничения. Инструкции по использованию см. в статье "Создание и использование памяти в службе агента Foundry".

Что такое память?

Память — это постоянные знания, сохраненные агентом в сеансах. Как правило, память агента входит в две категории:

  • Краткосрочная память отслеживает беседу текущего сеанса и поддерживает немедленный контекст для текущих взаимодействий. Платформы оркестрации агентов обычно управляют этой памятью в рамках контекста сеанса.

  • Долгосрочная память сохраняет дистиллированные знания через сеансы. Модель может вспомнить предыдущие взаимодействия с пользователем и развивать их со временем. Для долгосрочной памяти требуется постоянная система, которая извлекает, объединяет и управляет знаниями.

Память в службе агента Foundry предназначена для долгосрочной памяти. Он извлекает значимые сведения из бесед, объединяет его в устойчивые знания и делает его доступным для сеансов.

Как работает память

За кулисами воспоминания хранятся в виде элементов в управляемом хранилище памяти. Система может применять логику консолидации и разрешения конфликтов, если применимо (например, для слияния повторяющихся или перекрывающихся сведений профиля пользователя).

Замечание

Поведение консолидации может отличаться по типу памяти и может изменяться во время предварительной версии. Сведения о последнем поведении см. в статье "Создание и использование памяти в службе агента Foundry".

Память работает на следующих этапах:

  1. Извлечения: Когда пользователь взаимодействует с агентом, система активно извлекает ключевые сведения из беседы, такие как предпочтения пользователей, факты и соответствующий контекст. Например, предпочтения, такие как "аллергия на молочные продукты" и сводки последних действий, определяются и хранятся.

  2. Консолидация: Извлеченные воспоминания консолидируются для повышения эффективности и актуальности хранилища памяти. Система использует LLM для слияния аналогичных или повторяющихся разделов, чтобы агент не сохранял избыточные сведения. Конфликтующие факты, например новая аллергия, устраняются для поддержания точности памяти.

  3. Извлечение: Когда агенту нужно вспомнить информацию, он ищет в хранилище памяти наиболее релевантные воспоминания. Это позволяет агенту быстро отображать правильный контекст, делая беседы естественными и информированными. Чтобы добиться лучших результатов, соберите стабильную информацию профиля пользователя в начале беседы, чтобы агент мог персонализировать ответы.

Ниже приведен пример того, как память может улучшить и персонализировать взаимодействие между агентом рецепта и пользователем, который ранее выразил аллергию на пищу:

Диаграмма, показывающая извлечение, хранение и восстановление памяти агента в разных сеансах.

Подсказка

Нужна помощь в принятии решений о том, когда следует использовать память? Рассмотрим следующие рекомендации:

  • Используйте память для контекста конкретного пользователя, который сохраняется с течением времени.
  • Используйте базу знаний Foundry IQ для основы вашего агента на кураторском содержании организации.
  • Используйте средство поиска файлов для поиска предоставленных пользователем документов во время взаимодействия.

Типы памяти

Память в службе Foundry Agent извлекает и сохраняет два типа долговременной памяти:

Тип Description Конфигурация
Память профиля пользователя Сведения и предпочтения пользователя, такие как предпочтительное имя, диетическое ограничение и предпочтения языка. Эти воспоминания считаются статическими в отношении беседы, так как они обычно не зависят от текущего контекста чата. Извлекайте воспоминания профиля пользователя единожды в начале каждой беседы. Укажите user_profile_details в хранилище памяти.
Сводная память чата Сводка по каждому разделу или потоку, охватываемому в сеансе чата. Эти воспоминания позволяют пользователям продолжать беседы или ссылаться на предыдущие сеансы, не повторяя более ранний контекст. Получение сводки переписки на основе текущей беседы для отображения соответствующих потоков. Установите значение chat_summary_enabledtrue в хранилище памяти.

Работа с памятью

Существует два способа использования памяти для взаимодействия с агентом:

  • Средство поиска памяти: Подключите средство поиска памяти к агенту запроса, чтобы включить чтение и запись в хранилище памяти во время бесед. Этот подход идеально подходит для большинства сценариев, так как упрощает управление памятью. Дополнительные сведения см. в разделе "Использование воспоминаний с помощью средства агента".

  • API хранилища памяти: Взаимодействуйте непосредственно с хранилищем памяти с помощью низкоуровневых API. Этот подход обеспечивает больший контроль и гибкость для расширенных вариантов использования. Дополнительные сведения см. в статье "Использование воспоминаний через API".

Случаи использования

В следующих примерах показано, как память может улучшить различные типы агентов.

  • Агент поддержки клиентов, который запоминает ваше имя, предыдущие проблемы и решения, номера билетов и предпочитаемый метод контакта (чат, электронная почта или обратный вызов). Эта память помогает избежать повторения информации, поэтому беседы являются более эффективными и удовлетворяющими.

  • Личный помощник по покупкам, который запоминает ваш размер в определенных брендах, предпочитаемые цвета, прошлые возвраты и последние покупки. Агент может предлагать соответствующие элементы сразу после начала сеанса и избегать рекомендаций продуктов, которые вы уже владеете.

Угрозы безопасности

При работе с памятью в службе агента Foundry большая языковая модель (LLM) извлекает и объединяет воспоминания на основе бесед. Защита памяти от угроз, таких как инъекция команд и повреждение памяти. Эти риски возникают, когда неправильные или вредные данные хранятся в памяти агента, потенциально влияя на ответы и действия агента.

Чтобы снизить риски безопасности, рассмотрите следующие действия:

  • Используйте средства безопасности содержимого Azure AI и обнаружение внедрения команд: Проверьте все запросы на ввод или вывод из системы хранения для предотвращения вредоносного содержимого.

  • Стресс-тестирование и тестирование на стойкость к атакам: Регулярно подвергайте вашего агента стресс-тесту на уязвимости инъекций через контролируемые упражнения.

Ограничения и квоты

  • В настоящее время для работы с памятью требуется наличие совместимых развертываний чата и моделей встраивания Azure OpenAI. Список поддерживаемых моделей см. в разделе модели и регионы Azure OpenAI для Службы агента Foundry.
  • Необходимо явно задать scope значение. В настоящее время автоматическое заполнение идентификации пользователя, указанной в запросе, не поддерживается.

Quotas

  • Максимальные пределы для хранилища памяти: 100
  • Максимальное количество памяти на область: 10 000
  • Память поиска: 1000 запросов в минуту
  • Обновление памяти: 1000 запросов в минуту

Более широкие квоты и ограничения службы агента Foundry см. в разделе " Квоты и ограничения службы агента Foundry".

Pricing

Память в настоящее время находится в общедоступной предварительной версии. Цены и выставление счетов за память и API хранилища памяти могут изменяться во время предварительной версии.

Плата взимается за использование базового чата и встраиваемых моделей, которые вы настраиваете. Сведения о текущих ценах см. в разделе "Цены на службу агента Foundry".