Prezzi e fatturazione per l'agente SRE di Azure

Informazioni sul funzionamento della fatturazione dell'agente SRE di Azure e su cosa aspettarsi sulla fattura di Azure.

Funzionamento della fatturazione

Azure addebiti dell'agente SRE si basano su Azure unità agente (AAU), una misura standardizzata dell'elaborazione agente usata in tutti gli agenti predefiniti Azure agenti. La fattura mensile combina due tipi di addebiti.

Flusso sempre attivo (costo fisso)

Quando si crea un agente, si paga una tariffa fissa purché l'agente esista:

Componente Rate
Flusso Always On 4 unità AAU all'ora per agente

Il flusso sempre attivo (always-on) non significa che l'agente stia elaborando il lavoro attivamente. Rappresenta il costo di base per mantenere l'agente fornito e disponibile. La fatturazione always-on continua dalla creazione dell'agente fino all'eliminazione dell'agente.

Flusso attivo (costo variabile)

Ogni volta che l'agente funziona, indipendentemente dal fatto che un utente pone una domanda in modo interattivo, un'automazione attiva un'attività o un'operazione asincrona venga eseguita in background, l'agente utilizza le AAU attive del flusso. Ogni volta che l'agente elabora attivamente, viene considerato come flusso attivo, indipendentemente dal modo in cui è stato avviato il lavoro.

Come i token diventano AAU

Ogni volta che l'agente funziona, usa i token LLM. Ogni tipo di token è misurato separatamente secondo la tariffa illustrata nella tabella seguente.

Tipo di token Cosa misura
Inserimento Token inviati al modello (prompt, risultati dello strumento, contesto)
Output Token generati dal modello (risposte, ragionamento)
Lettura cache Token serviti dalla cache dei prompt (contesto ripetuto)
Scrittura cache Token scritti nella cache di prompt per un futuro riutilizzo

Il totale delle unità AAU attive per un'attività = la somma delle AAU per tutti e quattro i tipi di token.

Tariffe AAU per modello

Numero di unità AAU utilizzate per 1 milione di token:

Modello Inserimento Risultato Lettura cache Scrittura cache
Claude Opus 4.6 100 AAU 500 AAU 10 AAU 125 AAU
Codice GPT 5.3 35 AAU 280 AAU 3.5 AAU 0 AAU
GPT 5.2 35 AAU 280 AAU 3.5 AAU 0 AAU

Le tariffe sono per 1 milione di token.

Annotazioni

Azure potrebbero aggiungere altri modelli e provider in futuro. Azure imposta le tariffe AAU e potrebbe aggiornarle man mano che vengono rilasciati nuovi modelli.

Dettagli chiave:

  • Solo il tempo di elaborazione conta. Il tempo trascorso dall'agente in attesa della risposta non viene fatturato come flusso attivo.
  • Il flusso attivo si resetta mensilmente. Il contatore del consumo AAU viene reimpostato all'inizio di ogni mese di calendario.
  • Impostare il provider a livello di agente. Configurare il provider di modelli (Anthropic, OpenAI e altri) nelle impostazioni dell'agente. Il modello corrispondente determina le tariffe AAU.

Flusso attivo per tipo di attività

Il numero di token usati e le AAU pagate dipendono dalla complessità dell'attività. Le attività più complesse richiedono più passaggi di ragionamento LLM, chiamate agli strumenti ed elaborazione dei dati, quindi usano più token.

Ecco come l'uso del token viene convertito in AAU per scenari comuni:

Scenario Token di input Token di output Lettura cache Scrittura cache Claude Opus 4.6 AAU GPT 5.3 Codex AAU Esempio
Domanda rapida ~20.000 ~2.000 ~15.000 ~5.000 ~3.8 ~1.3 "Mostra avvisi recenti"
Indagine sugli eventi imprevisti ~200.000 ~15.000 ~150.000 ~50K ~35.3 ~11.7 Incidente automatizzato da Monitoraggio di Azure
Correzione completa ~500.000 ~40.000 ~400K ~100.000 ~86.5 ~30.1 "Diagnosticare e correggere la distribuzione non riuscita"

Come funziona la matematica (esempio di Claude Opus 4.6 - domanda rapida):

Tipo di token Tokens Tasso per 1M AAUs
Inserimento 20 mila 100 2.0
Risultato 2.000 500 1.0
Lettura cache 15.000 10 0.15
Scrittura cache 5K 125 0.625
Totale 3.775 AAU

Suggerimento

Per mantenere prevedibili i costi dei flussi attivi, impostare un limite mensile di allocazione di AAU in Impostazioni>Consumo agente.

Monitorare i costi

Nel portale dell'agente SRE

Andare a Impostazioni>Consumo agente per visualizzare l'utilizzo:

  • Limite AAU mensile: allocazione del flusso sempre attiva e sempre attiva combinata con un pulsante per modificarlo
  • Utilizzo totale del flusso attivo: grafico ad anello che suddivide l'utilizzo in base al tipo di thread (chat, eventi imprevisti, attività pianificate, trigger)
  • Utilizzo giornaliero del flusso attivo: grafico a barre in pila che mostra l'utilizzo AAU al giorno, codificato a colori per tipo
  • Utilizzo per thread: tabella che elenca ogni thread con il relativo costo, tipo e stato AAU

Per una procedura dettagliata completa, vedere Monitorare l'utilizzo dell'agente.

Impostare un limite di spesa del flusso attivo

Selezionare Modifica allocazione AAU per impostare un limite AAU del flusso attivo mensile (minimo 500, massimo 1.000.000 unità AAU). Questo limite si applica solo al flusso attivo. La fatturazione sempre attiva continua fino a quando l'agente esiste.

  • Quando l'agente raggiunge il limite di flusso attivo, diventa non disponibile per le chat e le azioni fino al mese successivo. Gli addebiti sempre attivi proseguono per il resto del mese.
  • È possibile aumentare o ridurre l'allocazione in qualsiasi momento.
  • Gli aumenti diventano effettivi immediatamente: se si aumenta il limite superiore al consumo corrente, le chat e le azioni riprendono subito.
  • Le riduzioni diventano effettive il mese successivo. Fino ad allora, l'agente viene eseguito solo nel flusso "always-on".

Impatto della fatturazione per azione

Action Flusso attivo Always-on Per riprendere il mese successivo
Impostare il limite di budget (limite raggiunto) Arresti Ancora fatturato Reimposta automaticamente all'inizio del mese
Arrestare l'agente Arresti Ancora fatturato Selezionare manualmente Start in Impostazioni>di base
Eliminare l'agente Arresti Arresti Creare un nuovo agente

In Gestione costi di Azure

Per dettagli sulla fatturazione in più agenti e risorse, usare Gestione costi di Azure nel portale di Azure.

Consigli sull'ottimizzazione dei costi

Strategia Impatto Procedura
Aggiungere contesto all'agente Meno token sprecate Aggiungere competenze, conoscenze e documenti per far sì che l'agente rimanga con i piedi per terra e conciso. La memoria persistente delle interazioni passate migliora l'efficienza nel tempo.
Filtrare gli eventi imprevisti con piani di risposta Meno lavoro non necessario Usare i piani di risposta per filtrare Monitoraggio di Azure avvisi in base alla gravità, al servizio o alla parola chiave. L'agente esamina solo gli eventi imprevisti corrispondenti.
Lavoro batch con attività pianificate Meno esecuzioni Pianificare le attività per l'esecuzione giornaliera o settimanale anziché il polling continuo. Vedere Attività pianificate.
Testare in chat prima di automatizzare Evita le esecuzioni inutili Prova il tuo prompt nella chat o nel Playground prima. Un'automazione configurata in modo errato viene eseguita ripetutamente e comporta lo spreco di AAU.
Arrestare gli agenti inattivi Elimina il flusso attivo Passare a Impostazioni>di base e selezionare Arresta. L'agente mantiene la configurazione ma arresta tutto il flusso attivo. Il costo sempre attivo continua finché non viene eliminato.
Eliminare agenti inutilizzati Elimina tutti i costi In sre.azure.com aprire l'agente e passare a Impostazioni>Di base>Elimina agente. Tutte le operazioni di fatturazione si arrestano immediatamente.

Domande frequenti

In che modo l'agente calcola le unità AAU dai token?

Ogni volta che l'agente esegue il lavoro, tiene traccia dei token LLM utilizzati in tutti e quattro i tipi di token e li conteggia alle tariffe AAU relative al modello configurato. È possibile visualizzare il consumo di AAU in Impostazioni>utilizzo dell'agente.

Il provider scelto influisce sui costi?

Impostare il provider di modelli (Anthropic, OpenAI e altri) a livello di agente. Determina quali tariffe AAU si applicano. I diversi modelli hanno frequenze diverse. Vedere la tabella delle tariffe AAU per le tariffe correnti.

Quale modello occorre scegliere?

Claude Opus 4.6 ha tassi di AAU più elevati, ma in genere produce indagini più approfondite con meno passaggi di ragionamento. Per indagini complesse sugli eventi imprevisti e l'analisi della causa radice, Opus spesso raggiunge una conclusione con un minor numero di chiamate agli strumenti, il che può compensare il costo per token più elevato. I modelli GPT sono una buona scelta per attività più semplici e a volumi elevati, ad esempio controlli di conformità pianificati in cui l'efficienza dei costi è più importante della profondità. È possibile modificare il provider di modelli in qualsiasi momento in Impostazioni>di base e confrontare i risultati.

Si riceve un addebito quando l'agente è in attesa di rispondere?

No. Solo il tempo trascorso dall'agente per l'elaborazione attiva di un'attività viene conteggiato come flusso attivo. Se l'agente richiede l'approvazione e attende, il tempo di attesa non viene fatturato.

Cosa conta come flusso attivo?

Ogni volta che l'agente svolge attivamente un lavoro, viene considerato come flusso attivo. Questo lavoro include:

  • Prompt interattivi: un utente che pone all'agente una domanda nella chat
  • Automazione: attività pianificate, piani di risposta agli eventi imprevisti o altri trigger automatizzati
  • Operazioni asincrone: indagini in background, generazione di report o attività di correzione

In tutti i casi, l'agente misura i token consumati come AAU.

Cosa succede se si arresta l'agente?

Un agente arrestato non può monitorare le risorse o rispondere ai prompt, ma comporta comunque il costo fisso sempre attivo. Le AAU di flusso attive non vengono consumate quando il flusso è interrotto. Per arrestare l'agente, passare a Impostazioni>di base e selezionare Arresta. Per riprendere, selezionare Avvia dalla stessa pagina. Per interrompere completamente tutta la fatturazione, eliminare l'agente.

Un agente può gestire più carichi di lavoro?

Sì. Un singolo agente può monitorare più risorse all'interno dell'ambito configurato. Il consolidamento dei carichi di lavoro in un unico agente riduce i costi sempre attivi rispetto alla distribuzione di agenti separati.

Esiste un livello gratuito?

No. Gli addebiti relativi all'Agente SRE di Azure iniziano alla creazione dell'agente. Vedere il calcolatore prezzi di Azure per le tariffe correnti.

I prezzi sono uguali in tutte le aree?

Controllare il calcolatore prezzi di Azure per i prezzi correnti nell'area.