Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Lär dig hur Azure SRE-agentens fakturering fungerar och vad du kan förvänta dig på din Azure-faktura.
Två faktureringskomponenter är alltid på-flöde (fast) och aktivt flöde (variabel, tokenbaserad). Aktivt flöde mäter de LLM-token (large language model) som agenten använder. Varje tokentyp mäts med en fast AAU-hastighet (Azure Agent Unit) baserat på agentens konfigurerade modell.
Du kan övervaka förbrukningen i portalen på Inställningar>Agentförbrukning.
Så här fungerar fakturering
Avgifter för Azure SRE Agent baseras på AAUs, ett standardiserat mått på agentisk bearbetning som används för alla fördefinierade Azure-agenter. Din månadsfaktura kombinerar två typer av avgifter: alltid på flöde och aktivt flöde.
Alltid aktivt flöde (fast kostnad)
När du skapar en agent debiteras den till en fast ränta så länge den finns.
| Komponent | Hastighet |
|---|---|
| Alltid-aktivt flöde | Fyra AAUs per agenttimme |
Ständigt aktivt flöde innebär inte att agenten aktivt behandlar arbetet. Den representerar baslinjekostnaden för att hålla din agent etablerad och tillgänglig. Kontinuerlig fakturering fortsätter från skapandet av agenten till dess att agenten tas bort.
Aktivt flöde (variabel kostnad)
När din agent utför arbete förbrukar agenten aktiva flödes-AAUs. Arbetsexempel kan vara om en användare ställer en fråga interaktivt, en automatisering utlöser en uppgift eller om en asynkron åtgärd körs i bakgrunden. Varje gång agenten aktivt bearbetar räknas som aktivt flöde, oavsett hur arbetet initierades.
Hur tokens blir AAU:er
Varje gång agenten utför arbete använder den LLM-tokens. Varje tokentyp mäts separat med den hastighet som visas i följande tabell.
| Tokentyp | Vad den mäter |
|---|---|
| Indata | Token som skickas till modellen (prompter, verktygsresultat och kontext). |
| Resultat | Token som genereras av modellen (svar och resonemang). |
| Cacheläsning | Token hanteras från prompt-cachen (upprepad kontext). |
| Cacheskrivning | Tokens skrivs till cache för att förbereda framtida återanvändning. |
Dina totala aktiva flödes-AAUs för en uppgift är lika med summan av AAUs för alla fyra tokentyperna.
AAU-priser efter modell
I följande tabell visas antalet AAUs som förbrukas per 1 miljon token.
| Modell | Indata | Resultat | Cacheläsning | Cacheskrivning |
|---|---|---|---|---|
| Claude Opus 4.6 | 100 AAUs | 500 AAUs | 10 AAUs | 125 AAUs |
| GPT 5.3 Codex | 35 AAUs | 280 AAUs | 3.5 AAUs | — |
| GPT 5.2 | 35 AAUs | 280 AAUs | 3.5 AAUs | — |
Priserna är per 1 miljon token. Från och med 15 april 2026. Fler modeller och leverantörer kan läggas till i framtiden. AAU-priser anges av Azure och kan uppdateras när nya modeller släpps.
Nyckelinformation
- Endast bearbetningstid räknas: Den tid som agenten ägnar åt att vänta på ditt svar faktureras inte som aktivt flöde.
- Det aktiva flödet återställs varje månad: Förbrukningsräknaren för dina AAU:er återställs i början av varje kalendermånad.
- Providern anges på agentnivå: Modellprovidern (Anthropic, OpenAI och andra) har konfigurerats i agentens inställningar. Motsvarande modell avgör dina AAU-priser.
Aktivt flöde efter aktivitetstyp
Antalet token som förbrukas, vilket resulterar i de AAUs som faktureras, beror på aktivitetens komplexitet. Mer komplexa uppgifter kräver fler LLM-resonemangssteg, verktygsanrop och databearbetning, vilket innebär fler token.
I följande tabell visas hur tokenförbrukning översätts till AAUs i vanliga scenarier.
| Scenario | Token för indata | Token för utdata | Cacheläsning | Cacheskrivning | Claude Opus 4.6 AAUs | GPT 5.3 Codex AAUs | Exempel |
|---|---|---|---|---|---|---|---|
| Snabbfråga | ~20 000 | ~2 000 | ~15 000 | cirka 5 000 | ~3,8 | ~1,6 | "Visa de senaste aviseringarna." |
| Incidentutredning | ~200 000 | ~15 000 | ~150 000 | ~50K | ~35,5 | ~13,7 | Automatiserad incident från Azure Monitor. |
| Fullständig reparation | ~500 000 | ~40 000 | ~400 000 | ~100 000 | ~86,5 | ~33,9 | "Diagnostisera och åtgärda den misslyckade distributionen." |
Så här fungerar matematiken
Följande tabell visar matematiken för föregående Claude Opus 4.6-exempel med hjälp av talen från snabbfrågasraden.
| Tokentyp | Token | Andel per miljon | AAUs |
|---|---|---|---|
| Indata | 20 000 | 100 | 2.0 |
| Resultat | 2K | 500 | 1.0 |
| Cacheläsning | 15 000 | 10 | 0.15 |
| Cacheskrivning | 5K | 125 | 0.625 |
| Total | 3.775 AAUs |
Tips/Råd
Om du vill hålla aktiva flödeskostnader förutsägbara anger du en månatlig AAU-allokeringsgräns i Inställningar>Agentförbrukning.
Övervaka dina kostnader
I SRE-agentportalen
Gå till Inställningar>Agentförbrukning för att visa din användning:
- Månatlig AAU-gräns: Visar din kombinerade alltid på- och aktiva flödestilldelning.
- Total aktiv flödesförbrukning: Visar ett förloppsfält som jämför din aktuella användning med din gräns.
- Daglig aktiv flödesförbrukning: Visar ett stapeldiagram som visar din AAU-användning per dag för den aktuella månaden.
- Uppdelning av tokenanvändning: Visar dina totala token som förbrukas efter kategori (indata, utdata, cacheläsning och cacheskrivning) så att du kan se exakt vart dina AAUs är på väg.
Ange en utgiftsgräns för aktivt flöde
Välj Ändra AAU-allokering för att ange en månatlig AAU-gräns för aktivt flöde (minst 500, högst 1 000 000 AAUs). Den här gränsen gäller endast för aktivt flöde. Alltid-på-fakturering fortsätter så länge agenten finns.
- När agenten når gränsen för aktivt flöde blir den inte tillgänglig för chatt och åtgärder fram till nästa månad. Kontinuerliga avgifter fortsätter under resten av månaden.
- Du kan öka eller minska allokeringen när som helst.
- Ökningar träder i kraft omedelbart. Om du höjer gränsen över den aktuella förbrukningen återupptas chatten och åtgärderna direkt.
- Minskningar under aktuell förbrukning träder i kraft nästa månad. Tills dess körs agenten endast i ett konstant driftläge.
Faktureringspåverkan per åtgärd
| Action | Aktivt flöde | Ständigt aktiv | Kommer att återupptas nästa månad |
|---|---|---|---|
| Ange budgetgräns (maxgräns) | Stopp | Faktureras fortfarande | Återställs automatiskt i början av månaden. |
| Stoppa agenten | Stopp | Faktureras fortfarande | Välj Start manuellt i Inställningar>Grunderna. |
| Ta bort agent | Stopp | Stopp | Skapa en ny agent. |
I Microsoft Cost Management
Detaljerade faktureringsuppdelningar för flera agenter och resurser finns i Microsoft Cost Management i Azure-portalen.
Kostnadsoptimeringstips
| Strategi | Påverkan | Hur du gör det. |
|---|---|---|
| Lägg till kontext i din agent. | Slösar färre token. | Lägg till färdigheter, kunskaper och dokument så att agenten förblir jordnära och koncis. Beständigt minne från tidigare interaktioner förbättrar effektiviteten över tid. |
| Filtrera incidenter med svarsplaner. | Minskar onödigt arbete. | Använd svarsplaner för att filtrera Azure Monitor-aviseringar efter allvarlighetsgrad, tjänst eller nyckelord. Agenten undersöker endast incidenter som matchar kriterierna. |
| Batch-arbete med schemalagda aktiviteter. | Gör färre körningar. | Schemalägg uppgifter så att de körs dagligen eller varje vecka istället för att utföra kontinuerlig pollning. |
| Testa i chatten innan du automatiserar. | Undviker bortkastade körningar. | Prova din fråga i chatten eller på lekplatsen först. En felkonfigurerad automatisering körs upprepade gånger och slösar bort AAUs. |
| Stoppa inaktiva agenter. | Eliminerar aktivt flöde. | Gå tillGrunderna för> och välj Stoppa. Agenten behåller sin konfiguration men stoppar allt aktivt flöde. Always-on-kostnaden fortsätter tills den tas bort. |
| Ta bort oanvända agenter. | Eliminerar alla kostnader. | På webbsidan för Azure SRE Agent öppnar du agenten och går tillinställningar>grundinställningar>borttagningsagenten. All fakturering stoppas omedelbart. |
Vanliga frågor och svar
Hur beräknar agenten AAUs från tokenerna?
Varje gång agenten utför arbete spårar den LLM-token som förbrukas över alla fyra tokentyperna och mäter dem enligt AAU-priserna för den konfigurerade modellen. Du kan se din AAU-förbrukning i Inställningar>Agentförbrukning.
Påverkar den leverantör jag väljer mina kostnader?
Modellprovidern (Anthropic, OpenAI och andra) anges på agentnivå och avgör vilka AAU-priser som gäller. Olika modeller har olika priser. För aktuella priser, se AAU-pristabellen.
Vilken modell ska jag välja?
Claude Opus 4.6 har högre AAU-kvoter men producerar vanligtvis mer noggranna undersökningar med färre steg i resonemanget. För komplexa incidentundersökningar och rotorsaksanalyser når Opus ofta en slutsats med färre verktygsanvändningar, vilket kan kompensera för den högre kostnaden per token.
GPT-modeller är ett bra val för enklare uppgifter med stora volymer, till exempel schemalagda efterlevnadskontroller där kostnadseffektivitet är viktigare än djup. Du kan ändra modellprovidern när som helst iGrunderna för > och jämföra resultat.
Debiteras jag när agenten väntar på att jag ska svara?
Nej. Endast den tid som agenten ägnar åt att aktivt bearbeta en aktivitet räknas som aktivt flöde. Om agenten ber om ditt godkännande och väntar debiteras inte väntetiden.
Vad räknas som aktivt flöde?
Varje gång agenten aktivt utför arbete räknas som aktivt flöde, till exempel följande exempel:
- Interaktiva frågor: En användare som frågar agenten en fråga i chatten.
- Automation: Schemalagda uppgifter, incidenthanteringsplaner eller andra automatiserade utlösare.
- Asynkrona åtgärder: Bakgrundsundersökningar, rapportgenerering eller reparationsuppgifter.
I alla fall mäter agenten de förbrukade token som AAUs.
Vad händer om jag stoppar min agent?
En avstängd agent kan inte övervaka dina resurser eller svara på anmodningar, men det medför fortfarande den fasta kostnaden för konstant drift. AAUs för aktivt flöde förbrukas inte när de stoppas. Om du vill stoppa din agent går du tillGrunderna för > och väljer Stoppa. Om du vill återuppta väljer du Starta från samma sida. Om du vill stoppa all fakturering helt tar du bort agenten.
Kan en agent hantera flera arbetsbelastningar?
Ja. En enskild agent kan övervaka flera resurser inom sitt konfigurerade omfång. Att konsolidera arbetsbelastningar under en agent minskar alltid-på-kostnaderna jämfört med att ha separata agenter.
Finns det en kostnadsfri nivå?
Nej. Azure SRE-agentavgifter börjar när agenten skapas. Aktuella priser finns i Priskalkylatorn för Azure.
Är prissättningen densamma i alla regioner?
Information om aktuella priser i din region finns i priskalkylatorn för Azure.