Azure OpenAI API-kérések gyorsítótárazott válaszainak lekérése

Cikk
06/25/2024

A KÖVETKEZŐRE VONATKOZIK: Minden API Management-szint

azure-openai-semantic-cache-lookup A szabályzat használatával gyorsítótárban keresheti meg az Azure OpenAI Chat Completion API-ra és a Befejezési API-kérésekre adott válaszokat egy konfigurált külső gyorsítótárból, a kérés vektoros közelsége és a megadott hasonlósági pontszám küszöbértéke alapján. A válasz gyorsítótárazása csökkenti a háttérbeli Azure OpenAI API-ra vonatkozó sávszélességet és feldolgozási követelményeket, és csökkenti az API-felhasználók által érzékelt késést.

Feljegyzés

Ennek a szabályzatnak rendelkeznie kell egy, az Azure OpenAI API kérési szabályzatára adott gyorsítótár-válaszokkal.
A szemantikai gyorsítótárazás engedélyezésének előfeltételeit és lépéseit az Azure OpenAI API-k szemantikai gyorsítótárazásának engedélyezése az Azure API Managementben című témakörben találja.
Ez a szabályzat jelenleg előzetes verzióban érhető el.

Feljegyzés

Állítsa be a szabályzat elemeit és gyermekelemeit a szabályzatutasításban megadott sorrendben. További információ az API Management-szabályzatok beállításáról és szerkesztéséről.

Szabályzatutasítás

<azure-openai-semantic-cache-lookup
    score-threshold="similarity score threshold"
    embeddings-backend-id ="backend entity ID for embeddings API"
    embeddings-backend-auth ="system-assigned"             
    ignore-system-messages="true | false"      
    max-message-count="count" >
    <vary-by>"expression to partition caching"</vary-by>
</azure-openai-semantic-cache-lookup>

Attribútumok

Attribútum	Leírás	Kötelező	Alapértelmezett
pontszám-küszöbérték	A hasonlósági pontszám küszöbértéke annak meghatározására szolgál, hogy gyorsítótárazott választ ad-e vissza egy parancssornak. Az érték 0,0 és 1,0 közötti decimális érték. További információ.	Igen	n/a
embeddings-backend-id	Az OpenAI-beágyazási API-hívás háttérazonosítója.	Igen	n/a
embeddings-backend-auth	Az Azure OpenAI-beágyazások API-háttérrendszeréhez használt hitelesítés.	Igen. A beállításnak a `system-assigned`következőnek kell lennie: .	n/a
rendszerüzenetek figyelmen kívül hagyása	Logikai. Ha be van `true`állítva, eltávolítja a rendszerüzeneteket egy GPT-csevegés befejezési kéréséből, mielőtt kiértékelné a gyorsítótár hasonlóságát.	Nem	false
maximális üzenetszám	Ha meg van adva, azoknak a párbeszédpanel-üzeneteknek a száma, amelyek után a gyorsítótárazás kimarad.	Nem	N.A.

Elemek

Név	Leírás	Kötelező
változó szerint	Olyan egyéni kifejezés, amely futásidőben van meghatározva, amelynek az értékpartíciói gyorsítótáraznak. Ha több `vary-by` elemet ad hozzá, az értékek összefűzve egyedi kombinációt hoznak létre.	Nem

Használat

Szabályzatszakaszok: bejövő
Szabályzathatókörök: globális, munkaterület, termék, API, művelet
Átjárók: v2

Használati megjegyzések

Ez a szabályzat csak egyszer használható egy szabályzatszakaszban.

Példák

Példa az azure-openai-szemantic-cache-store szabályzatra

<policies>
    <inbound>
        <base />
        <azure-openai-semantic-cache-lookup
            score-threshold="0.05"
            embeddings-backend-id ="azure-openai-backend"
            embeddings-backend-auth ="system-assigned" >
            <vary-by>@(context.Subscription.Id)</vary-by>
        </azure-openai-semantic-cache-lookup>
    </inbound>
    <outbound>
        <azure-openai-semantic-cache-store duration="60" />
        <base />
    </outbound>
</policies>

A szabályzatok használatával kapcsolatos további információkért lásd:

Oktatóanyag: AZ API átalakítása és védelme
Szabályzathivatkozás a szabályzatutasságok és azok beállításainak teljes listájához
Házirend-kifejezések
Házirendek beállítása vagy szerkesztése
Szabályzatkonfigurációk újrafelhasználása
Szabályzatrészletek adattára
Szabályzatok létrehozása a Microsoft Copilot használatával az Azure-ban

Megosztás a következőn keresztül:

Azure OpenAI API-kérések gyorsítótárazott válaszainak lekérése

Szabályzatutasítás

Attribútumok

Elemek

Használat

Használati megjegyzések

Példák

Példa az azure-openai-szemantic-cache-store szabályzatra

Visszajelzés

Visszajelzés

További források

Megosztás a következőn keresztül:

Azure OpenAI API-kérések gyorsítótárazott válaszainak lekérése

Szabályzatutasítás

Attribútumok

Elemek

Használat

Használati megjegyzések

Példák

Példa az azure-openai-szemantic-cache-store szabályzatra

Kapcsolódó szabályzatok

Kapcsolódó tartalom

Visszajelzés

Visszajelzés

További források