Ukládání odpovědí do mezipaměti na požadavky rozhraní API Azure OpenAI

PLATÍ PRO: Všechny úrovně služby API Management

Zásady azure-openai-semantic-cache-store ukládají odpovědi na požadavky rozhraní API pro dokončování chatu Azure OpenAI do nakonfigurované externí mezipaměti. Ukládání odpovědí do mezipaměti snižuje požadavky na šířku pásma a zpracování uložené na back-endovém rozhraní Api OpenAI a snižuje latenci vnímanou příjemci rozhraní API.

Poznámka:

Tato zásada musí mít odpovídající odpovědi Get Cached na zásady požadavků rozhraní API Azure OpenAI.
Požadavky a kroky pro povolení sémantické mezipaměti najdete v tématu Povolení sémantické mezipaměti pro rozhraní API Azure OpenAI ve službě Azure API Management.

Poznámka:

Nastavte prvky zásad a podřízené prvky v pořadí uvedeném v prohlášení o zásadách. Přečtěte si další informace o tom, jak nastavit nebo upravit zásady služby API Management.

Podporované modely Azure OpenAI v modelech Azure AI Foundry

Zásady se používají s rozhraními API přidanými do služby API Management z Azure OpenAI v modelech AI Foundry následujících typů:

Typ rozhraní API	Podporované modely
Dokončení chatu	`gpt-3.5` `gpt-4` `gpt-4o` `gpt-4o-mini` `o1` `o3`
Vkládání	`text-embedding-3-large` `text-embedding-3-small` `text-embedding-ada-002`
Odpovědi (Preview)	`gpt-4o` (Verze: `2024-11-20`, `2024-08-06`, `2024-05-13`) `gpt-4o-mini` (Verze: `2024-07-18`) `gpt-4.1` (Verze: `2025-04-14`) `gpt-4.1-nano` (Verze: `2025-04-14`) `gpt-4.1-mini` (Verze: `2025-04-14`) `gpt-image-1` (Verze: `2025-04-15`) `o3` (Verze: `2025-04-16`) `o4-mini` (Verze: '2025-04-16)

Poznámka:

Tradiční rozhraní API pro dokončování jsou k dispozici pouze se staršími verzemi modelu a podpora je omezená.

Aktuální informace o modelech a jejich možnostech najdete v tématu Azure OpenAI in Foundry Models.

Prohlášení o zásadách

<azure-openai-semantic-cache-store duration="seconds"/>

Atributy

Atribut	Popis	Požaduje se	Výchozí
doba trvání	Doba trvání položek uložených v mezipaměti zadaná v sekundách. Výrazy zásad jsou povolené.	Ano	–

Využití

Oddíly zásad: odchozí
Obory zásad: globální, produkt, rozhraní API, operace
Brány: Classic, v2, consumption, self-hosted

Poznámky k využití

Tuto zásadu je možné v oddílu zásad použít jenom jednou.
Pokud vyhledávání mezipaměti selže, volání rozhraní API, které používá operaci související s mezipamětí, nevyvolá chybu a operace mezipaměti se úspěšně dokončí.
Doporučujeme nakonfigurovat zásady omezení rychlosti (nebo zásady omezení rychlosti podle klíče ) okamžitě po každém vyhledávání v mezipaměti. To pomáhá zabránit přetížení back-endové služby, pokud mezipaměť není dostupná.

Příklady

Příklad s odpovídajícími zásadami vyhledávání azure-openai-sémantic-cache-lookup

Následující příklad ukazuje, jak použít zásadu azure-openai-semantic-cache-lookup spolu se zásadou azure-openai-semantic-cache-store k načtení sémanticky podobných odpovědí uložených v mezipaměti s prahovou hodnotou skóre podobnosti 0,05. Hodnoty v mezipaměti jsou rozdělené podle ID předplatného volajícího.

Poznámka:

Po vyhledávání cache přidejte politiku omezení rychlosti (nebo politiku omezení podle klíčů ), která pomůže omezit počet hovorů a zabrání přetížení backendové služby v případě, že cache není dostupná.

<policies>
    <inbound>
        <base />
        <azure-openai-semantic-cache-lookup
            score-threshold="0.05"
            embeddings-backend-id ="azure-openai-backend"
            embeddings-backend-auth ="system-assigned" >
            <vary-by>@(context.Subscription.Id)</vary-by>
        </azure-openai-semantic-cache-lookup>
        <rate-limit calls="10" renewal-period="60" />
    </inbound>
    <outbound>
        <azure-openai-semantic-cache-store duration="60" />
        <base />
    </outbound>
</policies>

Další informace o práci se zásadami najdete v tématech:

Kurz: Transformace a ochrana rozhraní API
Referenční informace o zásadách pro úplný seznam prohlášení o zásadách a jejich nastavení
Výrazy zásad
Nastavení nebo úprava zásad
Opakované použití konfigurací zásad
Úložiště fragmentů zásad
Úložiště dětského hřiště zásad
Sada nástrojů zásad služby Azure API Management
Získejte asistenci Copilotu při vytváření, vysvětlování a řešení problémů se zásadami.

Váš názor

Byla tato stránka užitečná?

Last updated on 2025-11-27

Sdílet prostřednictvím

Ukládání odpovědí do mezipaměti na požadavky rozhraní API Azure OpenAI

Podporované modely Azure OpenAI v modelech Azure AI Foundry

Prohlášení o zásadách

Atributy

Využití

Poznámky k využití

Příklady

Příklad s odpovídajícími zásadami vyhledávání azure-openai-sémantic-cache-lookup

Související zásady

Související obsah

Váš názor

Další materiály