Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
APLICA-SE A: todas as camadas do Gerenciamento de API
A azure-openai-semantic-cache-store política armazena em cache as respostas às solicitações da API de Conclusão de Chat do Azure OpenAI para um cache externo configurado. O armazenamento em cache das respostas reduz os requisitos de largura de banda e processamento impostos à API do OpenAI do Azure de back-end e diminui a latência percebida pelos consumidores da API.
Observação
- Essa política deve ter uma política correspondente de Obter respostas em cache para as solicitações da API do OpenAI do Azure.
- Para obter pré-requisitos e etapas para habilitar o cache semântico, consulte Habilitar o cache semântico das APIs do OpenAI do Azure no Gerenciamento de API do Azure.
Observação
Defina os elementos da política e os elementos filho na ordem fornecida na declaração da política. Saiba mais sobre como definir e editar as políticas de Gerenciamento de API.
Azure OpenAI com suporte em modelos do Azure AI Foundry
A política é usada com APIs adicionadas ao Gerenciamento de API do Azure OpenAI em modelos de AI Foundry dos seguintes tipos:
| Tipo de API | Modelos com suporte |
|---|---|
| Conclusão do chat | gpt-3.5gpt-4gpt-4ogpt-4o-minio1o3 |
| Incorporações | text-embedding-3-largetext-embedding-3-smalltext-embedding-ada-002 |
| Respostas (versão prévia) |
gpt-4o (Versões: 2024-11-20, 2024-08-06, 2024-05-13)gpt-4o-mini (Versão: 2024-07-18)gpt-4.1 (Versão: 2025-04-14)gpt-4.1-nano (Versão: 2025-04-14)gpt-4.1-mini (Versão: 2025-04-14)gpt-image-1 (Versão: 2025-04-15)o3 (Versão: 2025-04-16)o4-mini (Versão: '2025-04-16) |
Observação
As APIs de conclusão tradicionais só estão disponíveis com versões de modelo herdadas e o suporte é limitado.
Para obter informações atuais sobre os modelos e suas funcionalidades, consulte Azure OpenAI em Modelos de Fundimento.
Declaração de política
<azure-openai-semantic-cache-store duration="seconds"/>
Atributos
| Atributo | Descrição | Obrigatório | Padrão |
|---|---|---|---|
| duração | Vida útil das entradas armazenadas em cache, especificada em segundos. Expressões de política são permitidas. | Sim | N/D |
Uso
- Seções de política: saída
- Escopos de política: global, produto, API, operação
- Gateways: clássico, v2, consumo, auto-hospedado
Observações de uso
- Essa política só pode ser usada uma vez em uma seção de política.
- Se a pesquisa de cache falhar, a chamada à API que usa a operação relacionada ao cache não gerará um erro e a operação de cache será concluída com sucesso.
- Recomendamos configurar uma política de limite de taxa (ou política de limite de taxa por chave ) imediatamente após qualquer pesquisa de cache. Isso ajuda a impedir que seu serviço de back-end seja sobrecarregado se o cache não estiver disponível.
Exemplos
Exemplo com a política correspondente azure-openai-semantic-cache-lookup
O exemplo a seguir mostra como usar a azure-openai-semantic-cache-lookup política junto com a azure-openai-semantic-cache-store política para recuperar respostas em cache semanticamente semelhantes com um limite de pontuação de similaridade de 0,05. Os valores armazenados em cache são particionados pela ID da assinatura do chamador.
Observação
Adicione uma política de limite de taxa (ou política de limite de taxa por chave ) após a busca no cache para ajudar a limitar o número de chamadas e evitar sobrecarga no serviço backend caso o cache não esteja disponível.
<policies>
<inbound>
<base />
<azure-openai-semantic-cache-lookup
score-threshold="0.05"
embeddings-backend-id ="azure-openai-backend"
embeddings-backend-auth ="system-assigned" >
<vary-by>@(context.Subscription.Id)</vary-by>
</azure-openai-semantic-cache-lookup>
<rate-limit calls="10" renewal-period="60" />
</inbound>
<outbound>
<azure-openai-semantic-cache-store duration="60" />
<base />
</outbound>
</policies>
Políticas relacionadas
Conteúdo relacionado
Para obter mais informações sobre como trabalhar com políticas, consulte:
- Tutorial: Transformar e proteger sua API
- Referência de Política para uma lista completa das instruções de política e suas configurações
- Expressões de política
- Definir ou editar políticas
- Reutilizar configurações de política
- Repositório de snippets de política
- Repositório de playground de políticas
- Kit de ferramentas de políticas do Gerenciamento de API do Azure
- Obter assistência do Copilot para criar, explicar e solucionar problemas de políticas