Reacties op Azure OpenAI API-aanvragen in de cache opslaan

Artikel
05/21/2024

VAN TOEPASSING OP: Basic v2 | Standard v2

Het azure-openai-semantic-cache-store beleid slaat antwoorden op de voltooiings-API voor Azure OpenAI Chat en voltooiings-API-aanvragen op in een geconfigureerde externe cache. Reactiecaching vermindert de bandbreedte en verwerkingsvereisten die zijn opgelegd aan de Back-end Azure OpenAI-API en verlaagt de latentie die wordt waargenomen door API-consumenten.

Notitie

Dit beleid moet een overeenkomend beleid voor get cache-antwoorden hebben op azure OpenAI API-aanvragen .
Zie Semantische caching inschakelen voor Azure OpenAI-API's in Azure API Management voor vereisten en stappen voor het inschakelen van semantische caching.
Dit beleid is momenteel beschikbaar als preview-versie.

Notitie

Stel de elementen en onderliggende elementen van het beleid in de volgorde in die in de beleidsverklaring is opgegeven. Meer informatie over het instellen of bewerken van API Management-beleid.

Beleidsinstructie

<azure-openai-semantic-cache-store duration="seconds"/>

Kenmerken

Kenmerk	Beschrijving	Vereist	Standaardinstelling
duur	Time-to-live van de items in de cache, opgegeven in seconden. Beleidsexpressies zijn toegestaan.	Ja	N.v.t.

Gebruik

Beleidssecties: uitgaand
Beleidsbereik: globaal, werkruimte, product, API, bewerking
Gateways: v2

Gebruiksnotities

Dit beleid kan slechts eenmaal worden gebruikt in een beleidssectie.
Als het opzoeken van de cache mislukt, veroorzaakt de API-aanroep die gebruikmaakt van de bewerking met betrekking tot de cache geen fout en wordt de cachebewerking voltooid.

Voorbeelden

Voorbeeld met het bijbehorende beleid voor azure-openai-semantic-cache-lookup

<policies>
    <inbound>
        <base />
        <azure-openai-semantic-cache-lookup
            score-threshold="0.05"
            embeddings-backend-id ="azure-openai-backend"
            embeddings-backend-auth ="system-assigned" >
            <vary-by>@(context.Subscription.Id)</vary-by>
        </azure-openai-semantic-cache-lookup>
    </inbound>
    <outbound>
        <azure-openai-semantic-cache-store duration="60" />
        <base />
    </outbound>
</policies>

Zie voor meer informatie over het werken met beleid:

Zelfstudie: Uw API transformeren en beveiligen
Beleidsreferentie voor een volledige lijst met beleidsinstructies en hun instellingen
Beleidsexpressies
Beleid instellen of bewerken
Beleidsconfiguraties opnieuw gebruiken
Beleidsfragmentenopslagplaats
Beleid ontwerpen met Behulp van Microsoft Copilot voor Azure

Delen via

Reacties op Azure OpenAI API-aanvragen in de cache opslaan

Beleidsinstructie

Kenmerken

Gebruik

Gebruiksnotities

Voorbeelden

Voorbeeld met het bijbehorende beleid voor azure-openai-semantic-cache-lookup

Feedback

Feedback

Aanvullende resources

Delen via

Reacties op Azure OpenAI API-aanvragen in de cache opslaan

Beleidsinstructie

Kenmerken

Gebruik

Gebruiksnotities

Voorbeelden

Voorbeeld met het bijbehorende beleid voor azure-openai-semantic-cache-lookup

Gerelateerd beleid

Gerelateerde inhoud

Feedback

Feedback

Aanvullende resources