Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Это важно
Память (предварительная версия) в службе агента Foundry и API хранилища памяти (предварительная версия) лицензируются вам в рамках подписки Azure и подпадают под условия, применимые к "предварительным версиям" в Условиях использования продуктов Microsoft и Дополнении о защите данных для продуктов и услуг Microsoft, а также условиям предварительной версии Служб генеративных AI в Дополнительных условиях использования предварительных версий Microsoft Azure.
Память в службе Microsoft Foundry Agent — это управляемое, долгосрочное решение для памяти. Он обеспечивает бесперебойную работу агента в сеансах, на устройствах и в рабочих процессах. Создавая хранилища памяти и управляя ими, можно создавать агенты, которые сохраняют пользовательские предпочтения, поддерживают журнал бесед и предоставляют персонализированные возможности.
В этой статье представлен обзор памяти агента, включая ее понятия, варианты использования и ограничения. Инструкции по использованию см. в статье "Создание и использование памяти в службе агента Foundry".
Что такое память?
Память — это постоянные знания, сохраненные агентом в сеансах. Как правило, память агента входит в две категории:
Краткосрочная память отслеживает беседу текущего сеанса и поддерживает немедленный контекст для текущих взаимодействий. Платформы оркестрации агентов обычно управляют этой памятью в рамках контекста сеанса.
Долгосрочная память сохраняет дистиллированные знания через сеансы. Модель может вспомнить предыдущие взаимодействия с пользователем и развивать их со временем. Для долгосрочной памяти требуется постоянная система, которая извлекает, объединяет и управляет знаниями.
Память в службе агента Foundry предназначена для долгосрочной памяти. Он извлекает значимые сведения из бесед, объединяет его в устойчивые знания и делает его доступным для сеансов.
Как работает память
За кулисами воспоминания хранятся в виде элементов в управляемом хранилище памяти. Система может применять логику консолидации и разрешения конфликтов, если применимо (например, для слияния повторяющихся или перекрывающихся сведений профиля пользователя).
Замечание
Поведение консолидации может отличаться по типу памяти и может изменяться во время предварительной версии. Сведения о последнем поведении см. в статье "Создание и использование памяти в службе агента Foundry".
Память работает на следующих этапах:
Извлечения: Когда пользователь взаимодействует с агентом, система активно извлекает ключевые сведения из беседы, такие как предпочтения пользователей, факты и соответствующий контекст. Например, предпочтения, такие как "аллергия на молочные продукты" и сводки последних действий, определяются и хранятся.
Консолидация: Извлеченные воспоминания консолидируются для повышения эффективности и актуальности хранилища памяти. Система использует LLM для слияния аналогичных или повторяющихся разделов, чтобы агент не сохранял избыточные сведения. Конфликтующие факты, например новая аллергия, устраняются для поддержания точности памяти.
Извлечение: Когда агенту нужно вспомнить информацию, он ищет в хранилище памяти наиболее релевантные воспоминания. Это позволяет агенту быстро отображать правильный контекст, делая беседы естественными и информированными. Чтобы добиться лучших результатов, соберите стабильную информацию профиля пользователя в начале беседы, чтобы агент мог персонализировать ответы.
Ниже приведен пример того, как память может улучшить и персонализировать взаимодействие между агентом рецепта и пользователем, который ранее выразил аллергию на пищу:
Подсказка
Нужна помощь в принятии решений о том, когда следует использовать память? Рассмотрим следующие рекомендации:
- Используйте память для контекста конкретного пользователя, который сохраняется с течением времени.
- Используйте базу знаний Foundry IQ для основы вашего агента на кураторском содержании организации.
- Используйте средство поиска файлов для поиска предоставленных пользователем документов во время взаимодействия.
Типы памяти
Память в службе Foundry Agent извлекает и сохраняет два типа долговременной памяти:
| Тип | Description | Конфигурация |
|---|---|---|
| Память профиля пользователя | Сведения и предпочтения пользователя, такие как предпочтительное имя, диетическое ограничение и предпочтения языка. Эти воспоминания считаются статическими в отношении беседы, так как они обычно не зависят от текущего контекста чата. Извлекайте воспоминания профиля пользователя единожды в начале каждой беседы. | Укажите user_profile_details в хранилище памяти. |
| Сводная память чата | Сводка по каждому разделу или потоку, охватываемому в сеансе чата. Эти воспоминания позволяют пользователям продолжать беседы или ссылаться на предыдущие сеансы, не повторяя более ранний контекст. Получение сводки переписки на основе текущей беседы для отображения соответствующих потоков. | Установите значение chat_summary_enabledtrue в хранилище памяти. |
Работа с памятью
Существует два способа использования памяти для взаимодействия с агентом:
Средство поиска памяти: Подключите средство поиска памяти к агенту запроса, чтобы включить чтение и запись в хранилище памяти во время бесед. Этот подход идеально подходит для большинства сценариев, так как упрощает управление памятью. Дополнительные сведения см. в разделе "Использование воспоминаний с помощью средства агента".
API хранилища памяти: Взаимодействуйте непосредственно с хранилищем памяти с помощью низкоуровневых API. Этот подход обеспечивает больший контроль и гибкость для расширенных вариантов использования. Дополнительные сведения см. в статье "Использование воспоминаний через API".
Случаи использования
В следующих примерах показано, как память может улучшить различные типы агентов.
Агент поддержки клиентов, который запоминает ваше имя, предыдущие проблемы и решения, номера билетов и предпочитаемый метод контакта (чат, электронная почта или обратный вызов). Эта память помогает избежать повторения информации, поэтому беседы являются более эффективными и удовлетворяющими.
Личный помощник по покупкам, который запоминает ваш размер в определенных брендах, предпочитаемые цвета, прошлые возвраты и последние покупки. Агент может предлагать соответствующие элементы сразу после начала сеанса и избегать рекомендаций продуктов, которые вы уже владеете.
Угрозы безопасности
При работе с памятью в службе агента Foundry большая языковая модель (LLM) извлекает и объединяет воспоминания на основе бесед. Защита памяти от угроз, таких как инъекция команд и повреждение памяти. Эти риски возникают, когда неправильные или вредные данные хранятся в памяти агента, потенциально влияя на ответы и действия агента.
Чтобы снизить риски безопасности, рассмотрите следующие действия:
Используйте средства безопасности содержимого Azure AI и обнаружение внедрения команд: Проверьте все запросы на ввод или вывод из системы хранения для предотвращения вредоносного содержимого.
Стресс-тестирование и тестирование на стойкость к атакам: Регулярно подвергайте вашего агента стресс-тесту на уязвимости инъекций через контролируемые упражнения.
Ограничения и квоты
- В настоящее время для работы с памятью требуется наличие совместимых развертываний чата и моделей встраивания Azure OpenAI. Список поддерживаемых моделей см. в разделе модели и регионы Azure OpenAI для Службы агента Foundry.
- Необходимо явно задать
scopeзначение. В настоящее время автоматическое заполнение идентификации пользователя, указанной в запросе, не поддерживается.
Quotas
- Максимальные пределы для хранилища памяти: 100
- Максимальное количество памяти на область: 10 000
- Память поиска: 1000 запросов в минуту
- Обновление памяти: 1000 запросов в минуту
Более широкие квоты и ограничения службы агента Foundry см. в разделе " Квоты и ограничения службы агента Foundry".
Pricing
Память в настоящее время находится в общедоступной предварительной версии. Цены и выставление счетов за память и API хранилища памяти могут изменяться во время предварительной версии.
Плата взимается за использование базового чата и встраиваемых моделей, которые вы настраиваете. Сведения о текущих ценах см. в разделе "Цены на службу агента Foundry".
Связанный контент
- Следуйте комплексной настройке. Создание и использование памяти в службе агента Foundry
- Подтверждение доступности модели: Модели и регионы Azure OpenAI для службы агента Foundry
- Создание полноценного агента: краткое руководство по Microsoft Foundry