Nota
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
SE APLICA A: todos los niveles de API Management
La azure-openai-semantic-cache-store directiva almacena en caché las respuestas a las solicitudes de la API de finalización de chat de Azure OpenAI a una caché externa configurada. El almacenamiento en caché de respuesta reduce el ancho de banda y los requisitos de procesamiento impuestos sobre la API de Azure OpenAI de back-end y disminuye la latencia percibida por los consumidores de API.
Nota:
- Esta directiva debe tener una directiva correspondiente Obtener respuestas en caché a las solicitudes de la API de Azure OpenAI.
- Para conocer los requisitos previos y los pasos para habilitar el almacenamiento en caché semántico, consulte Habilitación del almacenamiento en caché semántico para las API de Azure OpenAI en Azure API Management.
Nota:
Establezca los elementos de la directiva y los elementos secundarios en el orden proporcionado en la instrucción de directiva. Obtenga más información sobre el establecimiento o modificación de directivas de API Management.
Modelos admitidos de Azure OpenAI en Azure AI Foundry
La directiva se usa con las API agregadas a API Management desde los modelos de Azure OpenAI en AI Foundry de los siguientes tipos:
| Tipo de API | Modelos admitidos |
|---|---|
| Finalización del chat | gpt-3.5gpt-4gpt-4ogpt-4o-minio1o3 |
| Inserciones | text-embedding-3-largetext-embedding-3-smalltext-embedding-ada-002 |
| Respuestas (versión preliminar) |
gpt-4o (Versiones: 2024-11-20, 2024-08-06, 2024-05-13)gpt-4o-mini (Versión: 2024-07-18)gpt-4.1 (Versión: 2025-04-14)gpt-4.1-nano (Versión: 2025-04-14)gpt-4.1-mini (Versión: 2025-04-14)gpt-image-1 (Versión: 2025-04-15)o3 (Versión: 2025-04-16)o4-mini (Versión: '2025-04-16) |
Nota:
Las API de finalización tradicionales solo están disponibles con versiones de modelo heredadas y la compatibilidad es limitada.
Para obtener información actual sobre los modelos y sus funcionalidades, consulte Azure OpenAI en Foundry Models.
Instrucción de la directiva
<azure-openai-semantic-cache-store duration="seconds"/>
Atributos
| Atributo | Descripción | Necesario | Valor predeterminado |
|---|---|---|---|
| duración | Período de vida de las entradas almacenadas en caché, especificado en segundos. Se permiten expresiones de directiva. | Sí | N/D |
Uso
- Secciones de la directiva: saliente
- Ámbitos de la directiva: global, producto, API y operación
- Puertas de enlace: clásica, v2, consumo, autohospedado
Notas de uso
- Esta directiva solo se puede usar una vez en una sección de directiva.
- Si se produce un error en la búsqueda de caché, la llamada API que usa la operación relacionada con la caché no genera un error y la operación de caché se completa correctamente.
- Se recomienda configurar una directiva de límite de velocidad (o directiva de límite de velocidad por clave ) inmediatamente después de cualquier búsqueda de caché. Esto ayuda a evitar que el servicio back-end se sobrecargue si la memoria caché no está disponible.
Ejemplos
Ejemplo con la directiva azure-openai-semantic-cache-lookup correspondiente
En el ejemplo siguiente se muestra cómo usar la azure-openai-semantic-cache-lookup directiva junto con la azure-openai-semantic-cache-store directiva para recuperar respuestas en caché semánticamente similares con un umbral de puntuación de similitud de 0,05. Los valores almacenados en caché se particionan mediante el identificador de suscripción del autor de la llamada.
Nota:
Añade una política de límite de velocidad (o política de límite por clave ) tras la búsqueda de caché para ayudar a limitar el número de llamadas y evitar sobrecarga en el servicio de backend en caso de que la caché no esté disponible.
<policies>
<inbound>
<base />
<azure-openai-semantic-cache-lookup
score-threshold="0.05"
embeddings-backend-id ="azure-openai-backend"
embeddings-backend-auth ="system-assigned" >
<vary-by>@(context.Subscription.Id)</vary-by>
</azure-openai-semantic-cache-lookup>
<rate-limit calls="10" renewal-period="60" />
</inbound>
<outbound>
<azure-openai-semantic-cache-store duration="60" />
<base />
</outbound>
</policies>
Directivas relacionadas
Contenido relacionado
Para más información sobre el trabajo con directivas, vea:
- Tutorial: Transformación y protección de una API
- Referencia de directivas para una lista completa de instrucciones de directivas y su configuración
- Expresiones de directiva
- Establecimiento o edición de directivas
- Reutilización de configuraciones de directivas
- Repositorio de fragmentos de código de directiva
- Repositorio de área de juegos de directivas
- Kit de herramientas de directivas de Azure API Management
- Obtener ayuda de Copilot para crear, explicar y solucionar problemas de directivas