Riferimento ai dati di monitoraggio di Azure OpenAI
Questo articolo contiene tutte le informazioni di riferimento sul monitoraggio per questo servizio.
Vedere Monitorare Azure OpenAI per informazioni dettagliate sui dati che è possibile raccogliere per il servizio Azure OpenAI e su come usarli.
Metrica
Questa sezione elenca tutte le metriche della piattaforma raccolte automaticamente per questo servizio. Queste metriche fanno anche parte dell'elenco globale di tutte le metriche della piattaforma supportate nel Monitoraggio di Azure.
Per informazioni sulla conservazione delle metriche, vedere Informazioni generali sulle metriche del Monitoraggio di Azure.
Metriche supportate per Microsoft.CognitiveServices/accounts
Di seguito sono riportate le metriche più importanti che è consigliabile monitorare per Azure OpenAI. Più avanti in questo articolo è riportato un elenco più lungo di tutte le metriche dei servizi di intelligenza artificiale di Azure disponibili che contiene altri dettagli sulle metriche in questo elenco più breve.
Richieste OpenAI di Azure
Token attivi
Token di completamento generati
Ore di training ottimizzato elaborate
Token di inferenza elaborati
Token di richiesta elaborati
Utilizzo gestito con provisioning V2
Frequenza di corrispondenza della cache dei token di richiesta
Tempo di risposta
Tempo tra i token
Time to Last Byte
Tempo normalizzato al primo byte
È anche possibile monitorare le metriche di Sicurezza del contenuto usate da altri servizi di intelligenza artificiale di Azure.
- Volume bloccato
- Rilevato volume dannoso
- Potenziale conteggio utenti offensivi
- Evento del sistema di sicurezza
- Totale volume inviato per il controllo di sicurezza
Nota
La metrica Utilizzo gestito con provisioning è ora deprecata e non è più consigliata. Questa metrica è stata sostituita dalla metrica Utilizzo gestito con provisioning V2.
Le metriche di Servizi cognitivi hanno la categoria Servizi cognitivi - Richieste HTTP nella tabella seguente. Queste metriche sono metriche legacy comuni a tutte le risorse di Servizi di intelligenza artificiale di Azure. Microsoft non consiglia più di usare queste metriche con Azure OpenAI.
La tabella seguente elenca le metriche disponibili per il tipo di risorsa Microsoft.CognitiveServices/accounts.
- Potrebbero non essere presenti tutte le colonne in ogni tabella.
- Alcune colonne potrebbero superare l'area di visualizzazione della pagina. Selezionare Espandi tabella per visualizzare tutte le colonne disponibili.
Intestazioni di tabella
- Categoria: gruppo o classificazione delle metriche.
- Metrica: nome visualizzato della metrica come visualizzato nella portale di Azure.
- Nome nell'API REST: nome della metrica indicato nell'API REST.
- Unità: Unità di misura.
- Aggregazione: tipo di aggregazione predefinito. Valori validi: Medio (Avg), Minimo (Min), Massimo (Max), Totale (Sum), Conteggio.
- Dimensioni - Dimensioni disponibili per la metrica.
- Intervalli di tempo - Intervalli in cui viene campionata la metrica. Ad esempio,
PT1M
indica che la metrica viene campionata ogni minuto,PT30M
ogni 30 minuti,PT1H
ogni ora e così via. - Esportazione DS: indica se la metrica è esportabile nei log di Monitoraggio di Azure tramite le impostazioni di diagnostica. Per informazioni sull'esportazione delle metriche, vedere Creare impostazioni di diagnostica nel Monitoraggio di Azure.
Categoria | Metric | Nome nell'API REST | Unità | Aggregazione | Dimensioni | Intervalli di tempo | Esportazione DS |
---|---|---|---|---|---|---|---|
Occorrenze delle funzionalità | Occorrenze delle funzionalità di azione Numero di volte in cui viene visualizzata ogni funzionalità di azione. |
ActionFeatureIdOccurrences |
Count | Totale (somma) | FeatureId , Mode , RunId |
PT1M | Sì |
Funzionalità per evento | Funzionalità di azione per evento Numero medio di funzionalità di azione per evento. |
ActionFeaturesPerEvent |
Conteggio | Media | Mode , RunId |
PT1M | Sì |
Azioni | Occorrenze di azioni Numero di volte in cui viene visualizzata ogni azione. |
ActionIdOccurrences |
Count | Totale (somma) | ActionId , Mode , RunId |
PT1M | Sì |
Spazi dei nomi per evento | Spazi dei nomi azione per evento Numero medio di spazi dei nomi delle azioni per evento. |
ActionNamespacesPerEvent |
Conteggio | Media | Mode , RunId |
PT1M | Sì |
Azioni | Azioni per evento Numero di azioni per evento. |
ActionsPerEvent |
Conteggio | Media | Mode , RunId |
PT1M | Sì |
Azure OpenAI - Utilizzo | Token attivi Token totali meno token memorizzati nella cache in un intervallo di tempo. Si applica alle distribuzioni PTU e gestite da PTU. Usare questa metrica per comprendere l'utilizzo basato su TPS o TPM per le PTU e confrontare i benchmark per i TPM o TPS di destinazione degli scenari in uso. Per suddividere le richieste API, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName e ModelVersion. |
ActiveTokens |
Count | Minimum, Maximum, Average, Total (Sum) | Region , ModelDeploymentName , ModelName ModelVersion |
PT1M | Sì |
SpeechServices - Utilizzo | Secondi audio trascritti Numero di secondi trascritti |
AudioSecondsTranscribed |
Count | Totale (somma) | ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
SpeechServices - Utilizzo | Secondi audio tradotti Numero di secondi tradotti |
AudioSecondsTranslated |
Count | Totale (somma) | ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
SpeechServices - Utilizzo | Modello avatar che ospita secondi Numero di secondi. |
AvatarModelHostingSeconds |
Count | Totale (somma) | ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
OpenAI di Azure - Richieste HTTP | Frequenza di corrispondenza della cache dei token di richiesta Percentuale dei token di richiesta ha raggiunto la cache, disponibile per la gestione PTU. |
AzureOpenAIContextTokensCacheMatchRate |
Percentuale | Minimo, Massimo, Medio | Region , ModelDeploymentName , ModelName ModelVersion |
PT1M | No |
Azure OpenAI - Utilizzo | Utilizzo gestito con provisioning % di utilizzo per una distribuzione gestita con provison, calcolata come (PTU utilizzate/PTU distribuite) x 100. Quando l'utilizzo è maggiore o uguale al 100%, le chiamate vengono limitate e viene restituito il codice di errore 429. Per suddividere questa metrica, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName, ModelVersion e StreamType (streaming e richieste non di streaming) |
AzureOpenAIProvisionedManagedUtilization |
Percentuale | Minimo, Massimo, Medio | Region , StreamType , ModelDeploymentName , ModelName ModelVersion |
PT1M | No |
Azure OpenAI - Utilizzo | Utilizzo gestito con provisioning V2 % di utilizzo per una distribuzione gestita con provison, calcolata come (PTU utilizzate/PTU distribuite) x 100. Quando l'utilizzo è maggiore o uguale al 100%, le chiamate vengono limitate e viene restituito il codice di errore 429. Per suddividere questa metrica, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName, ModelVersion e StreamType (streaming e richieste non di streaming) |
AzureOpenAIProvisionedManagedUtilizationV2 |
Percentuale | Minimo, Massimo, Medio | Region , StreamType , ModelDeploymentName , ModelName ModelVersion |
PT1M | No |
OpenAI di Azure - Richieste HTTP | Richieste OpenAI di Azure Numero di chiamate effettuate all'API OpenAI di Azure in un periodo di tempo. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. Per suddividere le richieste API, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName, ModelVersion, StatusCode (esito positivo, clienterrors, errori del server), StreamType (Streaming e richieste non di streaming) e operazione. |
AzureOpenAIRequests |
Count | Totale (somma) | ApiName , OperationName , Region , StreamType ModelDeploymentName , ModelName , , ModelVersion StatusCode |
PT1M | Sì |
OpenAI di Azure - Richieste HTTP | Tempo di risposta Misura di latenza consigliata (velocità di risposta) per le richieste di streaming. Si applica alle distribuzioni PTU e gestite da PTU. Calcolato come tempo impiegato per la comparsa della prima risposta dopo l’invio da parte dell’utente di una richiesta, come misurato dal gateway API. Questo numero aumenta man mano che le dimensioni delle richieste aumentano e/o le dimensioni dei riscontri nella cache si riducono. Per suddividere il tempo per la metrica di risposta, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName e ModelVersion. Nota: questa metrica è un'approssimazione in quanto latenza misurata dipende in larga misura da più fattori, tra cui chiamate simultanee e modello di carico di lavoro complessivo. Inoltre, non tiene conto di alcuna latenza lato client che può esistere tra il client e l'endpoint API. Per un rilevamento ottimale della latenza, fare riferimento alla registrazione personalizzata. |
AzureOpenAITimeToResponse |
Millisecondi | Minimo, Massimo, Medio | ApiName , OperationName , Region , StreamType ModelDeploymentName , ModelName , , ModelVersion StatusCode |
PT1M | Sì |
Slot | Ricompensa complessiva dello strumento di stima previsto Ricompensa complessiva dello strumento di stima previsto. |
BaselineEstimatorOverallReward |
Conteggio | Media | Mode , RunId |
PT1M | Sì |
Slot | Ricompensa dello slot di stima di base Ricompensa stimata prevista per slot. |
BaselineEstimatorSlotReward |
Conteggio | Media | SlotId , SlotIndex , Mode RunId |
PT1M | Sì |
Slot | Stima casuale prevista Ricompensa complessiva Ricompensa complessiva dello strumento di stima casuale previsto. |
BaselineRandomEstimatorOverallReward |
Conteggio | Media | Mode , RunId |
PT1M | Sì |
Slot | Ricompensa dello slot di stima casuale prevista Ricompensa stima casuale prevista per slot. |
BaselineRandomEstimatorSlotReward |
Conteggio | Media | SlotId , SlotIndex , Mode RunId |
PT1M | Sì |
Stime | Conteggio eventi casuali di base Stima per il numero di eventi casuali di base. |
BaselineRandomEventCount |
Count | Totale (somma) | Mode , RunId |
PT1M | Sì |
Stime | Ricompensa casuale prevista Stima della ricompensa casuale prevista. |
BaselineRandomReward |
Count | Totale (somma) | Mode , RunId |
PT1M | Sì |
Servizi cognitivi - Richieste HTTP | Chiamate bloccate Numero di chiamate che hanno superato il limite di frequenza o di quota. Non usare per il servizio Azure OpenAI. |
BlockedCalls |
Count | Totale (somma) | ApiName , OperationName , Region RatelimitKey |
PT1M | Sì |
Utilizzo | Conteggio inferenza Conteggio inferenza del servizio Frontdoor Carnegie |
CarnegieInferenceCount |
Count | Totale (somma) | Region , Modality , Category , Language , SeverityLevel UseCustomList |
PT1M | Sì |
Utilizzo | Caratteri sottoposti a training (deprecato) Numero totale di caratteri sottoposti a training. |
CharactersTrained |
Count | Totale (somma) | ApiName , OperationName , Region |
PT1M | Sì |
Utilizzo | Caratteri tradotti (deprecato) Numero totale di caratteri nella richiesta di testo in ingresso. |
CharactersTranslated |
Count | Totale (somma) | ApiName , OperationName , Region |
PT1M | Sì |
Servizi cognitivi - Richieste HTTP | Errori del client Numero di chiamate con errore sul lato client (codice di risposta HTTP 4xx). Non usare per il servizio Azure OpenAI. |
ClientErrors |
Count | Totale (somma) | ApiName , OperationName , Region RatelimitKey |
PT1M | Sì |
Utilizzo | transazioni Visione artificiale Numero di transazioni Visione artificiale |
ComputerVisionTransactions |
Count | Totale (somma) | ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
ContentSafety - Utilizzo | Conteggio chiamate per la moderazione delle immagini Numero di chiamate per la moderazione delle immagini. |
ContentSafetyImageAnalyzeRequestCount |
Count | Totale (somma) | ApiVersion |
PT1M | Sì |
ContentSafety - Utilizzo | Conteggio chiamate per la moderazione del testo Numero di chiamate per la moderazione del testo. |
ContentSafetyTextAnalyzeRequestCount |
Count | Totale (somma) | ApiVersion |
PT1M | Sì |
Occorrenze delle funzionalità | Occorrenze delle funzionalità di contesto Numero di volte in cui viene visualizzata ogni funzionalità di contesto. |
ContextFeatureIdOccurrences |
Count | Totale (somma) | FeatureId , Mode , RunId |
PT1M | Sì |
Funzionalità per evento | Caratteristiche del contesto per evento Numero di funzionalità di contesto per evento. |
ContextFeaturesPerEvent |
Conteggio | Media | Mode , RunId |
PT1M | Sì |
Spazi dei nomi per evento | Spazi dei nomi context per evento Numero di spazi dei nomi di contesto per evento. |
ContextNamespacesPerEvent |
Conteggio | Media | Mode , RunId |
PT1M | Sì |
Utilizzo | Visione personalizzata tempo di training Visione personalizzata tempo di training |
CustomVisionTrainingTime |
Secondi | Totale (somma) | ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Utilizzo | transazioni Visione personalizzata Numero di transazioni di stima Visione personalizzata |
CustomVisionTransactions |
Count | Totale (somma) | ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Servizi cognitivi - Richieste HTTP | Dati in entrata Dimensione in byte dei dati in entrata. Non usare per il servizio Azure OpenAI. |
DataIn |
Byte | Totale (somma) | ApiName , OperationName , Region |
PT1M | Sì |
Servizi cognitivi - Richieste HTTP | Dati in uscita Dimensione in byte dei dati in uscita. Non usare per il servizio Azure OpenAI. |
DataOut |
Byte | Totale (somma) | ApiName , OperationName , Region |
PT1M | Sì |
Utilizzo | Caratteri documento tradotti Numero di caratteri nella richiesta di traduzione dei documenti. |
DocumentCharactersTranslated |
Count | Totale (somma) | ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Utilizzo | Caratteri personalizzati del documento tradotti Numero di caratteri nella richiesta di traduzione documenti personalizzata. |
DocumentCustomCharactersTranslated |
Count | Totale (somma) | ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Utilizzo | Immagini del viso con training Numero di immagini di cui è stato eseguito il training. 1.000 immagini con training per transazione. |
FaceImagesTrained |
Count | Totale (somma) | ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Utilizzo | Visi archiviati Numero di visi archiviati, ripartiti ogni giorno. Il numero di visi archiviati viene segnalato ogni giorno. |
FacesStored |
Count | Totale (somma) | ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Utilizzo | Transazioni viso Numero di chiamate API effettuate al servizio Viso |
FaceTransactions |
Count | Totale (somma) | ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
FeatureCardinality | Cardinalità delle funzionalità in base all'azione Cardinalità delle funzionalità in base all'azione. |
FeatureCardinality_Action |
Conteggio | Media | FeatureId , Mode , RunId |
PT1M | Sì |
FeatureCardinality | Cardinalità delle funzionalità per contesto Cardinalità delle funzionalità in base al contesto. |
FeatureCardinality_Context |
Conteggio | Media | FeatureId , Mode , RunId |
PT1M | Sì |
FeatureCardinality | Cardinalità delle funzionalità per slot Cardinalità delle funzionalità basata su slot. |
FeatureCardinality_Slot |
Conteggio | Media | FeatureId , Mode , RunId |
PT1M | Sì |
Azure OpenAI - Utilizzo | Processed FineTuned Training Hours Numero di ore di training elaborate in un modello ottimizzato di OpenAI |
FineTunedTrainingHours |
Count | Totale (somma) | ApiName , ModelDeploymentName , FeatureName , UsageChannel Region |
PT1M | Sì |
Azure OpenAI - Utilizzo | Token di completamento generati Numero di token generati (output) da un modello OpenAI. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. Per suddividere questa metrica, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName e ModelName. |
GeneratedTokens |
Count | Totale (somma) | ApiName , ModelDeploymentName , FeatureName , UsageChannel , Region ModelVersion |
PT1M | Sì |
Utilizzo | Immagini archiviate Numero di immagini Visione personalizzata archiviate. |
ImagesStored |
Count | Totale (somma) | ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Servizi cognitivi - Richieste HTTP | Latenza Latenza in millisecondi. Non usare per il servizio Azure OpenAI. |
Latency |
Millisecondi | Media | ApiName , OperationName , Region RatelimitKey |
PT1M | Sì |
Utilizzo | Eventi appresi Numero di eventi appresi. |
LearnedEvents |
Count | Totale (somma) | IsMatchBaseline , Mode , RunId |
PT1M | Sì |
Utilizzo | Richieste di riconoscimento vocale LUIS Numero di richieste di riconoscimento vocale LUIS per la comprensione delle finalità |
LUISSpeechRequests |
Count | Totale (somma) | ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Utilizzo | Richieste di testo LUIS Numero di richieste di testo LUIS |
LUISTextRequests |
Count | Totale (somma) | ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Utilizzo | Premi corrispondenti Numero di ricompense abbinate. |
MatchedRewards |
Count | Totale (somma) | Mode , RunId |
PT1M | Sì |
Utilizzo | Eventi non attivati Numero di eventi ignorati. |
NonActivatedEvents |
Count | Totale (somma) | Mode , RunId |
PT1M | Sì |
Slot | Slot Numero di slot per evento. |
NumberOfSlots |
Conteggio | Media | Mode , RunId |
PT1M | Sì |
SpeechServices - Utilizzo | Numero di profili voce Numero di profili voce registrati. Ripartito orariamente. |
NumberofSpeakerProfiles |
Count | Totale (somma) | ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Utilizzo | Ricompense osservate Numero di ricompense osservate. |
ObservedRewards |
Count | Totale (somma) | Mode , RunId |
PT1M | Sì |
Utilizzo | Caratteri di sincronizzazione documenti tradotti Numero di caratteri nella richiesta di traduzione dei documenti (sincrona). |
OneDocumentCharactersTranslated |
Count | Totale (somma) | ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Slot | Premio complessivo dello strumento di stima online Premio complessivo dello strumento di stima online. |
OnlineEstimatorOverallReward |
Conteggio | Media | Mode , RunId |
PT1M | Sì |
Slot | Premio slot di stima online Online Estimator Reward by slot. |
OnlineEstimatorSlotReward |
Conteggio | Media | SlotId , SlotIndex , Mode RunId |
PT1M | Sì |
Stime | Conteggio eventi online Stima per il conteggio degli eventi online. |
OnlineEventCount |
Count | Totale (somma) | Mode , RunId |
PT1M | Sì |
Stime | Premio online Stima della ricompensa online. |
OnlineReward |
Count | Totale (somma) | Mode , RunId |
PT1M | Sì |
Utilizzo | Caratteri elaborati Numero di caratteri elaborati da Strumento di lettura immersiva. |
ProcessedCharacters |
Count | Totale (somma) | ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Utilizzo | Record di testo sull'integrità elaborati Numero di record di testo di integrità elaborati |
ProcessedHealthTextRecords |
Count | Totale (somma) | ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Utilizzo | Immagini elaborate Numero di immagini elaborate |
ProcessedImages |
Count | Totale (somma) | ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Utilizzo | Pagine elaborate Numero di pagine elaborate |
ProcessedPages |
Count | Totale (somma) | ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Azure OpenAI - Utilizzo | Token di richiesta elaborati Numero di token di richiesta elaborati (input) in un modello OpenAI. Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. Per suddividere questa metrica, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName e ModelName. |
ProcessedPromptTokens |
Count | Totale (somma) | ApiName , ModelDeploymentName , FeatureName , UsageChannel , Region ModelVersion |
PT1M | Sì |
Utilizzo | Record di testo elaborati Conteggio dei record di testo. |
ProcessedTextRecords |
Count | Totale (somma) | ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Utilizzo | Record di testo qa Numero di record di testo elaborati |
QuestionAnsweringTextRecords |
Count | Totale (somma) | ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
ContentSafety - Rischi&sicurezza | Conteggio utenti potenzialmente offensivi Numero di utenti potenzialmente offensivi che hanno rilevato nel corso di un periodo di tempo. È possibile aggiungere un filtro o applicare la suddivisione in base alla dimensione seguente: ModelDeploymentName. |
RAIAbusiveUsersCount |
Count | Totale (somma) | Region , ModelDeploymentName |
PT1M | Sì |
ContentSafety - Rischi&sicurezza | Rilevato volume dannoso Numero di chiamate effettuate all'API OpenAI di Azure e rilevate come dannose (sia il modello di blocco che la modalità di annotazione) da parte del filtro contenuto applicato per un periodo di tempo. È possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName e TextType. |
RAIHarmfulRequests |
Count | Totale (somma) | Region , ModelDeploymentName , ModelName , ModelVersion ApiName , TextType , , Category Severity |
PT1M | Sì |
ContentSafety - Rischi&sicurezza | Volume bloccato Numero di chiamate effettuate all'API OpenAI di Azure e rifiutate dal filtro contenuto applicato per un periodo di tempo. È possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName e TextType. |
RAIRejectedRequests |
Count | Totale (somma) | Region , ModelDeploymentName , ModelName , ModelVersion ApiName , , TextType Category |
PT1M | Sì |
ContentSafety - Rischi&sicurezza | Evento del sistema di sicurezza Evento di sistema per i rischi e il monitoraggio della sicurezza. È possibile aggiungere un filtro o applicare la suddivisione in base alla dimensione seguente: EventType. |
RAISystemEvent |
Conteggio | Media | Region , EventType |
PT1M | Sì |
ContentSafety - Rischi&sicurezza | Totale volume inviato per il controllo di sicurezza Numero di chiamate effettuate all'API OpenAI di Azure e rilevate dal filtro del contenuto applicato per un periodo di tempo. È possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName, ModelName. |
RAITotalRequests |
Count | Totale (somma) | Region , ModelDeploymentName , ModelName , ModelVersion ApiName |
PT1M | Sì |
Servizi cognitivi - Richieste HTTP | Ratelimit Ratelimit corrente della chiave ratelimit. Non usare per il servizio Azure OpenAI. |
Ratelimit |
Count | Totale (somma) | Region , RatelimitKey |
PT1M | Sì |
Premi | Ricompensa media per evento Ricompensa media per evento. |
Reward |
Conteggio | Media | BaselineAction , ChosenActionId , MatchesBaseline , NonDefaultReward , Mode RunId |
PT1M | Sì |
Servizi cognitivi - Richieste HTTP | Errori del server Numero di chiamate con errore interno del servizio (codice di risposta HTTP 5xx). Non usare per il servizio Azure OpenAI. |
ServerErrors |
Count | Totale (somma) | ApiName , OperationName , Region RatelimitKey |
PT1M | Sì |
Occorrenze delle funzionalità | Occorrenze delle funzionalità slot Numero di volte in cui viene visualizzata ogni funzionalità dello slot. |
SlotFeatureIdOccurrences |
Count | Totale (somma) | FeatureId , Mode , RunId |
PT1M | Sì |
Funzionalità per evento | Funzionalità slot per evento Numero medio di funzionalità dello slot per evento. |
SlotFeaturesPerEvent |
Conteggio | Media | Mode , RunId |
PT1M | Sì |
Slot | Occorrenze slot Numero di volte in cui viene visualizzato ogni slot. |
SlotIdOccurrences |
Count | Totale (somma) | SlotId , SlotIndex , Mode RunId |
PT1M | Sì |
Spazi dei nomi per evento | Spazi dei nomi slot per evento Numero medio di spazi dei nomi degli slot per evento. |
SlotNamespacesPerEvent |
Conteggio | Media | Mode , RunId |
PT1M | Sì |
Premi | Premio slot Ricompensa per slot. |
SlotReward |
Conteggio | Media | BaselineActionId , ChosenActionId , MatchesBaseline , NonDefaultReward SlotId , SlotIndex , , Mode RunId |
PT1M | Sì |
SpeechServices - Utilizzo | Transazioni di riconoscimento del parlante Numero di transazioni di riconoscimento voce |
SpeakerRecognitionTransactions |
Count | Totale (somma) | ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
SpeechServices - Utilizzo | Ore di hosting del modello di riconoscimento vocale Numero di ore di hosting del modello di riconoscimento vocale |
SpeechModelHostingHours |
Count | Totale (somma) | ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Utilizzo | Durata sessione di riconoscimento vocale (deprecata) Durata totale della sessione vocale in secondi. |
SpeechSessionDuration |
Secondi | Totale (somma) | ApiName , OperationName , Region |
PT1M | Sì |
Servizi cognitivi - Richieste HTTP | Chiamate riuscite Numero di chiamate riuscite. Non usare per il servizio Azure OpenAI. |
SuccessfulCalls |
Count | Totale (somma) | ApiName , OperationName , Region RatelimitKey |
PT1M | Sì |
Servizi cognitivi - SLI | AvailabilityRate Percentuale di disponibilità con il calcolo seguente: (Totale chiamate - Errori del server)/Chiamate totali. Gli errori del server includono tutte le risposte >HTTP =500. Non usare per il servizio Azure OpenAI. |
SuccessRate |
Percentuale | Minimo, Massimo, Medio | ApiName , OperationName , Region RatelimitKey |
PT1M | No |
SpeechServices - Utilizzo | Caratteri sintetizzati Numero di caratteri. |
SynthesizedCharacters |
Count | Totale (somma) | ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Utilizzo | Caratteri di testo tradotti Numero di caratteri nella richiesta di traduzione testuale in ingresso. |
TextCharactersTranslated |
Count | Totale (somma) | ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Utilizzo | Caratteri personalizzati di testo tradotti Numero di caratteri nella richiesta di traduzione di testo personalizzata in ingresso. |
TextCustomCharactersTranslated |
Count | Totale (somma) | ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Utilizzo | Caratteri sottoposti a training del testo Numero di caratteri sottoposti a training usando la traduzione testuale. |
TextTrainedCharacters |
Count | Totale (somma) | ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Azure OpenAI - Utilizzo | Token di inferenza elaborati Numero di token di inferenza elaborati in un modello OpenAI. Calcolato come token di richiesta (input) più token generati (output). Si applica alle distribuzioni PTU, gestite da PTU e con pagamento in base al consumo. Per suddividere questa metrica, è possibile aggiungere un filtro o applicare la suddivisione in base alle dimensioni seguenti: ModelDeploymentName e ModelName. |
TokenTransaction |
Count | Totale (somma) | ApiName , ModelDeploymentName , FeatureName , UsageChannel , Region ModelVersion |
PT1M | Sì |
Servizi cognitivi - Richieste HTTP | Totale chiamate Numero totale di chiamate. Non usare per il servizio Azure OpenAI. |
TotalCalls |
Count | Totale (somma) | ApiName , OperationName , Region RatelimitKey |
PT1M | Sì |
Servizi cognitivi - Richieste HTTP | Totale errori Numero totale di chiamate con risposta di errore (codice di risposta HTTP 4xx o 5xx). Non usare per il servizio Azure OpenAI. |
TotalErrors |
Count | Totale (somma) | ApiName , OperationName , Region RatelimitKey |
PT1M | Sì |
Utilizzo | Totale eventi Numero di eventi. |
TotalEvents |
Count | Totale (somma) | Mode , RunId |
PT1M | Sì |
Servizi cognitivi - Richieste HTTP | Total Token Calls Numero totale di chiamate token. |
TotalTokenCalls |
Count | Totale (somma) | ApiName , OperationName , Region |
PT1M | Sì |
Utilizzo | Totale transazioni (deprecato) Numero totale di transazioni. |
TotalTransactions |
Count | Totale (somma) | <none> | PT1M | Sì |
Stime | Conteggio eventi baseline utente Stima per il conteggio degli eventi di base definiti dall'utente. |
UserBaselineEventCount |
Count | Totale (somma) | Mode , RunId |
PT1M | Sì |
Stime | Ricompensa di base utente Stima per la ricompensa di base definita dall'utente. |
UserBaselineReward |
Count | Totale (somma) | Mode , RunId |
PT1M | Sì |
SpeechServices - Utilizzo | Video secondi sintetizzati Numero di secondi sintetizzati |
VideoSecondsSynthesized |
Count | Totale (somma) | ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
SpeechServices - Utilizzo | Ore di hosting del modello vocale Numero di ore. |
VoiceModelHostingHours |
Count | Totale (somma) | ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
SpeechServices - Utilizzo | Minuti di training del modello vocale Numero di minuti. |
VoiceModelTrainingMinutes |
Count | Totale (somma) | ApiName , FeatureName , UsageChannel Region |
PT1M | Sì |
Dimensioni delle metriche
Per informazioni sulle dimensioni delle metriche, vedere Metriche multidimensionali.
Questo servizio ha le dimensioni seguenti associate alle relative metriche.
- ApiName
- FeatureName
- ModelDeploymentName
- ModelName
- ModelVersion
- OperationName
- Paese
- StatusCode
- StreamType
- UsageChannel
Log risorse
Questa sezione elenca i tipi di log delle risorse che si possono raccogliere per questo servizio. La sezione esegue il pull dall'elenco di tutti i tipi di categoria dei log delle risorse supportati nel Monitoraggio di Azure.
Log delle risorse supportati per Microsoft.CognitiveServices/accounts
Categoria | Nome visualizzato della categoria | Tabella di log | Supporta il piano di log di base | Supporta la trasformazione in fase di inserimento | Query di esempio | Costi da esportare |
---|---|---|---|---|---|---|
Audit |
Log di controllo | AzureDiagnostics Log da più risorse di Azure. |
No | No | No | |
RequestResponse |
Log richieste e risposte | AzureDiagnostics Log da più risorse di Azure. |
No | No | No | |
Trace |
Log di traccia | AzureDiagnostics Log da più risorse di Azure. |
No | No | No |
Tabelle di log di Monitoraggio di Azure
Questa sezione elenca tutte le tabelle dei log del Monitoraggio di Azure pertinenti a questo servizio che sono disponibili per la query da parte di Log Analytics mediante le query di Kusto. Le tabelle contengono i dati dei log delle risorse ed eventualmente altro, a seconda di ciò che viene raccolto e indirizzato verso di esse.
Azure OpenAI microsoft.cognitiveservices/accounts
Log attività
Nella tabella collegata sono elencate le operazioni che possono essere registrate nel log attività per questo servizio. Queste operazioni sono un sottoinsieme di tutte le possibili operazioni del provider di risorse nel log attività.
Per altre informazioni sullo schema delle voci del log attività, vedere Schema del log attività.
Contenuto correlato
- Per una descrizione del monitoraggio di Azure OpenAI, vedere Monitorare Azure OpenAI .
- Per informazioni dettagliate sul monitoraggio delle risorse di Azure, vedere Monitora le risorse di Azure con il Monitoraggio di Azure.