Ескертпе
Бұл бетке кіру үшін қатынас шегін айқындау қажет. Жүйеге кіруді немесе каталогтарды өзгертуді байқап көруге болады.
Бұл бетке кіру үшін қатынас шегін айқындау қажет. Каталогтарды өзгертуді байқап көруге болады.
ОБЛАСТЬ ПРИМЕНЕНИЯ: все уровни Управление API
Политика azure-openai-semantic-cache-store кэширует ответы на запросы API завершения чата OpenAI в настроенный внешний кэш. Кэширование ответов снижает требования к пропускной способности и обработке, введенные серверной частью API OpenAI, и снижает задержку, воспринимаемую потребителями API.
Примечание.
- Эта политика должна иметь соответствующие ответы get cached responses to Azure OpenAI API requests policy.
- Предварительные требования и шаги для включения семантического кэширования см. в статье "Включение семантического кэширования для API OpenAI Azure" в Azure Управление API.
Примечание.
Задайте элементы политики и дочерние элементы в порядке, указанном в правиле политики. Узнайте, как устанавливать или изменять политики службы управления API.
Поддерживаемые модели Azure OpenAI в модели Azure AI Foundry
Политика используется с API, добавленными в управление API из Azure OpenAI в моделях AI Foundry следующих типов:
| Тип API | Поддерживаемые модели |
|---|---|
| Завершение чата | gpt-3.5gpt-4gpt-4ogpt-4o-minio1o3 |
| Внедрение | text-embedding-3-largetext-embedding-3-smalltext-embedding-ada-002 |
| Ответы (предварительная версия) |
gpt-4o(версии: 2024-11-20, 2024-08-062024-05-13)gpt-4o-mini (Версия: 2024-07-18)gpt-4.1 (Версия: 2025-04-14)gpt-4.1-nano (Версия: 2025-04-14)gpt-4.1-mini (Версия: 2025-04-14)gpt-image-1 (Версия: 2025-04-15)o3 (Версия: 2025-04-16)o4-mini (Версия: '2025-04-16) |
Примечание.
Традиционные API завершения доступны только в устаревших версиях модели и ограничена поддержка.
Текущие сведения о моделях и их возможностях см. в статье Azure OpenAI в модели Foundry.
Правило политики
<azure-openai-semantic-cache-store duration="seconds"/>
Атрибуты
| Атрибут | Описание | Обязательное поле | По умолчанию. |
|---|---|---|---|
| продолжительность | Срок жизни кэшированных записей (в секундах). Допустимы выражения политики. | Да | Н/П |
Использование
- Разделы политики: outbound.
- Области политики: global, product, API, operation.
- Шлюзы: классическая, версия 2, потребление, локальное размещение
Примечания об использовании
- Эту политику можно использовать только один раз в разделе политики.
- Если поиск кэша завершается сбоем, вызов API, использующий операцию, связанную с кэшем, не вызывает ошибку, и операция кэша успешно завершается.
- Мы рекомендуем настроить политику ограничения скорости (или политику ограничения скорости по ключу ) сразу после поиска кэша. Это помогает сохранить серверную службу от перегрузки, если кэш недоступен.
Примеры
Пример с соответствующей политикой поиска azure-openai-semantic-cache-lookup
В следующем примере показано, как использовать azure-openai-semantic-cache-lookup политику вместе с azure-openai-semantic-cache-store политикой для получения семантически аналогичных кэшированных ответов с пороговым значением оценки сходства 0,05. Кэшированные значения секционируются по идентификатору подписки вызывающего объекта.
Примечание.
Добавьте политику ограничения скорости (или политику ограничения скорости по ключу ) после поиска кэша, чтобы ограничить количество вызовов и предотвратить перегрузку серверной службы в случае, если кэш недоступен.
<policies>
<inbound>
<base />
<azure-openai-semantic-cache-lookup
score-threshold="0.05"
embeddings-backend-id ="azure-openai-backend"
embeddings-backend-auth ="system-assigned" >
<vary-by>@(context.Subscription.Id)</vary-by>
</azure-openai-semantic-cache-lookup>
<rate-limit calls="10" renewal-period="60" />
</inbound>
<outbound>
<azure-openai-semantic-cache-store duration="60" />
<base />
</outbound>
</policies>
Связанные политики
Связанный контент
Дополнительные сведения о работе с политиками см. в нижеуказанных статьях.
- Руководство. Преобразование и защита API
- Полный перечень операторов политик и их параметров см. в справочнике по политикам.
- Выражения политики
- Настройка или изменение политик
- Повторное использование конфигураций политик
- Репозиторий фрагментов политик
- Репозиторий игровой площадки политики
- Набор средств политики Управление API Azure
- Получение помощи Copilot для создания, объяснения и устранения неполадок политик