Generera mått för förbrukning av Azure OpenAI-token
GÄLLER FÖR: Alla API Management-nivåer
Principen azure-openai-emit-token-metric
skickar mått till Application Insights om förbrukning av stora språkmodelltoken via Azure OpenAI Service-API:er. Mått för antal token är: Totalt antal token, prompttoken och slutförandetoken.
Kommentar
Ange principens element och underordnade element i den ordning som anges i principbeskrivningen. Läs mer om hur du anger eller redigerar API Management-principer.
Azure OpenAI-tjänstmodeller som stöds
Principen används med API:er som lagts till i API Management från Azure OpenAI-tjänsten av följande typer:
API-typ | Modeller som stöds |
---|---|
Chatten har slutförts | gpt-3.5 gpt-4 |
Fullbordande | gpt-3.5-turbo-instruct |
Inbäddningar | text-embedding-3-large text-embedding-3-small text-embedding-ada-002 |
Mer information finns i Azure OpenAI Service-modeller.
Förutsättningar
- En eller flera API:er för Azure OpenAI-tjänsten måste läggas till i DIN API Management-instans. Mer information finns i Lägga till ett Azure OpenAI-tjänst-API i Azure API Management.
- Din API Management-instans måste vara integrerad med Application Insights. Mer information finns i Integrera Azure API Management med Azure Application Insights.
- Aktivera Application Insights-loggning för dina Azure OpenAI-API:er.
- Aktivera anpassade mått med dimensioner i Application Insights. Mer information finns i Generera anpassade mått.
Principuttryck
<azure-openai-emit-token-metric
namespace="metric namespace" >
<dimension name="dimension name" value="dimension value" />
...additional dimensions...
</azure-openai-emit-token-metric>
Attribut
Attribut | beskrivning | Obligatoriskt | Standardvärde |
---|---|---|---|
namnområde | En sträng. Måttets namnområde. Principuttryck tillåts inte. | Nej | API Management |
värde | Värdet för mått uttryckt som en dubbel. Principuttryck tillåts. | Nej | 1 |
Element
Element | Description | Obligatoriskt |
---|---|---|
dimension | Lägg till ett eller flera av dessa element för varje dimension som ingår i måttet. | Ja |
dimensionsattribut
Attribut | beskrivning | Obligatoriskt | Standardvärde |
---|---|---|---|
name | Ett sträng- eller principuttryck. Dimensionens namn. | Ja | Ej tillämpligt |
värde | Ett sträng- eller principuttryck. Dimensionens värde. Kan bara utelämnas om name matchar en av standarddimensionerna. I så fall anges värdet enligt dimensionsnamnet. |
Nej | Ej tillämpligt |
Standarddimensionsnamn som kan användas utan värde
- API-ID
- Åtgärds-ID
- Produkt-ID
- Användar-ID
- Prenumerations-ID:t
- Plats
- Gateway-ID
Användning
- Principavsnitt: inkommande
- Principomfattningar: global, arbetsyta, produkt, API, åtgärd
- Gatewayer: klassisk, v2, förbrukning, lokalt installerad
Användningsanteckningar
- Den här principen kan användas flera gånger per principdefinition.
- Du kan konfigurera högst 10 anpassade dimensioner för den här principen.
- Du kan också konfigurera den här principen när du lägger till ett API från Azure OpenAI-tjänsten med hjälp av portalen.
- När det är tillgängligt används värden i användningsavsnittet i svaret från Azure OpenAI Service-API:et för att fastställa tokenmått.
- Vissa Azure OpenAI-slutpunkter stöder strömning av svar. När
stream
anges tilltrue
i API-begäran för att aktivera strömning beräknas tokenmått.
Exempel
I följande exempel skickas mått för antal Azure OpenAI-token till Application Insights tillsammans med användar-ID, klient-IP och API-ID som dimensioner.
<policies>
<inbound>
<azure-openai-emit-token-metric
namespace="AzureOpenAI">
<dimension name="User ID" />
<dimension name="Client IP" value="@(context.Request.IpAddress)" />
<dimension name="API ID" />
</azure-openai-emit-token-metric>
</inbound>
<outbound>
</outbound>
</policies>
Relaterade principer
Relaterat innehåll
Mer information om hur du arbetar med principer finns i:
- Självstudie: Transformera och skydda ditt API
- Principreferens för en fullständig lista över principinstruktioner och deras inställningar
- Principuttryck
- Ange eller redigera principer
- Återanvända principkonfigurationer
- Lagringsplats för principfragment
- Skapa principer med Microsoft Copilot i Azure
Feedback
https://aka.ms/ContentUserFeedback.
Kommer snart: Under hela 2024 kommer vi att fasa ut GitHub-problem som feedbackmekanism för innehåll och ersätta det med ett nytt feedbacksystem. Mer information finns i:Skicka och visa feedback för