données de référence pour la surveillance d'Azure OpenAI

Cet article contient toutes les informations de référence de surveillance pour ce service.

Pour plus d’informations sur les données que vous pouvez collecter pour Azure OpenAI dans Microsoft Modèles Foundry et comment l’utiliser, consultez Monitor Azure OpenAI.

Metrics

Cette section liste tous les indicateurs de plateforme collectés automatiquement pour ce service. Ces indicateurs font également partie de la liste mondiale des métriques toutes les plateformes prises en charge dans Azure Monitor.

Pour des informations sur la rétention des métriques, voir Azure Monitor Aperçu des métriques.

Métriques prises en charge pour Microsoft. Services/comptes cognitifs

Surveillez les métriques les plus importantes pour Azure OpenAI. Plus loin dans cet article, vous trouverez une liste plus longue de toutes les métriques disponibles pour cet espace de noms, qui contient plus de détails sur les métriques de cette liste plus courte. Consultez la liste suivante pour obtenir les informations les plus up-to-date. L’équipe Azure travaille à actualiser les tables dans les sections suivantes.

Important

Ne confondez pas les métriques de cette section avec l’ancienne Latency métrique listée sous Services cognitifs - Requêtes HTTP plus loin dans cet article. L'ancienne métrique Latency n'est pas conçue pour Azure charges de travail OpenAI et produit des résultats trompeurs lorsqu'elle est utilisée pour diagnostiquer Azure latence OpenAI. Pour Azure surveillance de latence OpenAI, utilisez Temps à la Réponse (AzureOpenAITimeToResponse), Temps jusqu’au dernier octet (AzureOpenAITTLTInMS), Temps entre jetons (AzureOpenAINormalizedTBTInMS), ou Temps normalisé jusqu’au premier octet (AzureOpenAINormalizedTTFTInMS). Pour des conseils sur l’interprétation de ces métriques, voir Performance et latence.

Azure demandes OpenAI
Jetons actifs
Jetons de complétion générés
Heures de formation FineTuned traitées
Jetons d’inférence traités
Jetons d’invite traités
Utilisation gérée par provisionnement V2
Taux de correspondance du cache de jetons sur prompt
Temps d’intervenir
Temps entre les jetons
Temps pour le dernier octet
Temps normalisé jusqu’au premier octet
Jetons par seconde

Vous pouvez également surveiller les métriques content Safety utilisées par d’autres services associés.

Volume bloqué
Volume nuisible détecté
Nombre potentiel d’utilisateurs abusifs
Événement du système de sécurité
Volume total envoyé pour contrôle de sécurité

Note

L’indicateur d’utilisation gérée par provisionnement est désormais obsolète et n’est plus recommandée. Cette métrique est remplacée par la métrique d’utilisation managée provisionnée V2 . Les jetons par seconde, le temps de réponse et le temps entre les jetons ne sont actuellement pas disponibles pour les déploiements Standard.

Référence rapide : indicateurs clés par cas d’usage

Utilisez ce tableau pour trouver la bonne métrique pour un objectif de surveillance spécifique. Pour des conseils de bout en bout sur l’interprétation de ces métriques, voir Performance et latence.

Je veux surveiller...	Utilisez cette métrique	Nom de l’API REST
Temps de réponse global	Temps pour le dernier octet	`AzureOpenAITTLTInMS`
Réactivité du premier jeton (streaming)	Temps d’intervenir	`AzureOpenAITimeToResponse`
Vitesse de génération de jetons	Temps entre les jetons	`AzureOpenAINormalizedTBTInMS`
Efficacité du premier jeton normalisée par la taille du prompt	Temps normalisé jusqu’au premier octet	`AzureOpenAINormalizedTTFTInMS`
Volume de jetons de sortie par requête	Jetons de complétion générés	`GeneratedTokens`
Volume de jeton d’entrée par requête	Jetons d’invite traités	`ProcessedPromptTokens`
Utilisation de la capacité PTU	Utilisation gérée par provisionnement V2	`AzureOpenAIProvisionedManagedUtilizationV2`
Volume de requêtes et erreurs	Azure demandes OpenAI	`AzureOpenAIRequests`

Tip

Associez toujours une métrique de latence à une métrique de comptage de jetons. Une augmentation de latence sans augmentation correspondante du jeton pourrait indiquer un vrai problème. Une augmentation de latence avec une augmentation proportionnelle des jetons est un comportement attendu.

Avertissement

Les métriques sous Cognitive Services - HTTP Requests plus loin dans cet article sont des métriques héritées de Cognitive Services et ne sont pas conçues pour Azure charges de travail OpenAI. En particulier, la métrique Latency dans cette catégorie n'est pas la même que celle des métriques de latence Azure OpenAI (temps avant la réponse, temps jusqu'au dernier octet, temps entre les jetons, temps normalisé jusqu'au premier octet). L’utilisation de la métrique ancienne Latency pour Azure dépannage OpenAI produit des résultats trompeurs. Utilisez plutôt les métriques Azure OpenAI listées dans cette section.

Le tableau suivant présente les indicateurs disponibles pour Microsoft. Cognitive Services/type de ressource comptes.

Toutes les colonnes ne sont peut-être pas présentes dans chaque tableau.
Certaines colonnes peuvent être au-delà de la zone de vue de la page. Sélectionnez Tableau agrandi pour voir toutes les colonnes disponibles.

En-têtes de tableau

Catégorie - Le groupe métrique ou la classification.
Metric - Le nom d’affichage métrique tel qu’il apparaît dans le portail Azure.
Nom dans l’API REST - Le nom de la métrique tel qu’il est mentionné dans l’API REST.
Unité - Unité de mesure.
Agrégation - Le type d’agrégation par défaut. Valeurs valides : Moyenne (moyenne), Minimum (Min), Maximum (Max), Total (Somme), Compte.
Dimensions - Dimensions disponibles pour la métrique.
Graaux temporels - Intervalles auxquels la métrique est échantillonnée. Par exemple, PT1M indique que la métrique est échantillonnée toutes les minutes, PT30M toutes les 30 minutes, PT1H toutes les heures, etc.
DS Export - Si la métrique est exportable vers Azure Monitor Logs via les paramètres de diagnostic. Pour des informations sur l’exportation des métriques, voir Créer des paramètres de diagnostic dans Azure Monitor.

Catégorie : Actions

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Dimensions	Grains de temps	Exportation DS
Occurences de l’action Le nombre de fois où chaque action apparaît.	`ActionIdOccurrences`	Nombre	Total (Somme)	`ActionId`, , `ModeRunId`	PT1M	Oui
Actions par événement Nombre d’actions par événement.	`ActionsPerEvent`	Nombre	Average	`Mode`, `RunId`	PT1M	Oui

Catégorie : Azure OpenAI - Requêtes HTTP

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Dimensions	Grains de temps	Exportation DS
Disponibilité d’Azure OpenAI Pourcentage de disponibilité avec le calcul suivant : (Total d’appels - Erreurs de serveur)/Total d’appels. Les erreurs serveur incluent toutes les réponses >HTTP =500.	`AzureOpenAIAvailabilityRate`	Pourcentage	Minimum, maximum, moyenne	`ApiName`, `OperationName`, , `StreamTypeRegion`, `ModelDeploymentName`, , `ModelName`,`ModelVersion`	PT1M	Non
Azure Requêtes OpenAI Nombre d’appels effectués vers l’API OpenAI d’Azure sur une période donnée. Cela s’applique aux déploiements PTU, PTU-Managed et Pay-as-you-go. Pour décomposer les requêtes API, vous pouvez ajouter un filtre ou appliquer une division selon les dimensions suivantes : ModelDeploymentName, ModelName, ModelVersion, StatusCode (réussi, clienterrors, erreurs serveur), IsSpillover pour les informations de débordement, ServiceTier, StreamType (requêtes en streaming vs non-streaming) et opération.	`AzureOpenAIRequests`	Nombre	Total (Somme)	`ApiName`, , `OperationName`, , `RegionStreamTypeModelDeploymentNameModelNameModelVersionStatusCodeIsSpilloverServiceTierRequestServiceTierResponse`	PT1M	Oui

Catégorie : Azure OpenAI - Latence

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Dimensions	Grains de temps	Exportation DS
Temps entre jetons Pour les demandes de streaming ; Taux de génération de jetons modèle, mesuré en millisecondes. Cela s’applique aux déploiements PTU, gérés par PTU et Pay-as-you-go.	`AzureOpenAINormalizedTBTInMS`	Millisecondes	Maximum, minimum, moyenne	`Region`, , `ModelDeploymentNameModelName`, ,`ModelVersion`	PT1M	Oui
Temps normalisé jusqu’au premier octet Pour les demandes en streaming et non en streaming ; Le temps nécessaire pour que le premier octet de données de réponse soit reçu après que la requête a été effectuée par le modèle, normalisée par le jeton. Cela s’applique aux déploiements PTU, gérés par PTU et Pay-as-you-go.	`AzureOpenAINormalizedTTFTInMS`	Millisecondes	Maximum, minimum, moyenne	`Region`, , `ModelDeploymentNameModelName`, ,`ModelVersion`	PT1M	Oui
Temps d’intervenir Mesure recommandée de latence (réactivité) pour les requêtes en streaming. Cela s’applique aux déploiements PTU, gérés par PTU et Pay-as-you-go. Calculé comme le temps nécessaire pour que la première réponse apparaisse après qu’un utilisateur ait envoyé une invite, mesuré par la passerelle API. Ce chiffre augmente à mesure que la taille de la demande augmente et/ou que la taille des coups de cache diminue. Pour décomposer la métrique de temps de réponse, vous pouvez ajouter un filtre ou appliquer une séparation selon les dimensions suivantes : NomDeDéplayement, NomDeModèle, et VersionModèle. Note : cette métrique est une approximation, car la latence mesurée dépend fortement de plusieurs facteurs, y compris les appels simultanés et le schéma global de charge de travail. De plus, il ne prend pas en compte toute latence côté client qui pourrait exister entre votre client et le point de terminaison de l’API. Veuillez consulter votre propre journal pour un suivi optimal de la latence.	`AzureOpenAITimeToResponse`	Millisecondes	Minimum, maximum, moyenne	`ApiName`, `OperationName`, `RegionStreamType`, , `ModelDeploymentName`, `ModelName`, `ModelVersion`, ,`StatusCode`	PT1M	Oui
Jetons par seconde Énumère la vitesse de génération pour la réponse donnée d’un modèle Azure OpenAI. Le total des jetons générés est divisé par le temps nécessaire à la génération des jetons, en secondes. Cela s’applique aux déploiements PTU, gérés par PTU et Pay-as-you-go.	`AzureOpenAITokenPerSecond`	Nombre	Maximum, minimum, moyenne	`Region`, , `ModelDeploymentNameModelName`, ,`ModelVersion`	PT1M	Oui
Temps pour le dernier octet Pour les demandes en streaming et non en streaming ; Le temps nécessaire pour que le dernier octet de données de réponse soit reçu après la requête effectuée par le modèle. Cela s’applique aux déploiements PTU, gérés par PTU et Pay-as-you-go.	`AzureOpenAITTLTInMS`	Millisecondes	Maximum, minimum, moyenne	`Region`, , `ModelDeploymentNameModelName`, ,`ModelVersion`	PT1M	Oui

Catégorie : Azure OpenAI - Utilisation

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Dimensions	Grains de temps	Exportation DS
Jetons actifs Total des jetons moins les jetons mis en cache sur une période donnée. Cela s’applique aux déploiements gérés par PTU et PTU. Utilisez cette métrique pour comprendre votre utilisation basée sur le TPS ou TPM pour les PTU et comparez avec vos benchmarks pour le TPS cible ou le TPM pour vos scénarios. Pour décomposer les requêtes API, vous pouvez ajouter un filtre ou appliquer une division selon les dimensions suivantes : ModelDeploymentName, ModelName, et ModelVersion.	`ActiveTokens`	Nombre	Minimum, maximum, moyenne, total (somme)	`Region`, , `ModelDeploymentNameModelName`, ,`ModelVersion`	PT1M	Oui
Jetons de complétion audio Nombre de jetons d’invite audio générés (sortie) sur un modèle OpenAI. Cela s’applique aux déploiements gérés par PTU et au modèle Pay-as-you-go.	`AudioCompletionTokens`	Nombre	Total (Somme)	`ModelDeploymentName`, , `ModelNameModelVersion`, ,`Region`	PT1M	Oui
Jetons d’invite audio Nombre de jetons d’invite audio traités (entrées) sur un modèle OpenAI. Cela s’applique aux déploiements gérés par PTU et au modèle Pay-as-you-go.	`AudioPromptTokens`	Nombre	Total (Somme)	`ModelDeploymentName`, , `ModelNameModelVersion`, ,`Region`	PT1M	Oui
Taux de correspondance du cache de jetons sur prompt Pourcentage de jetons d’invite qui ont été envoyés dans la cache. Cela s’applique aux déploiements gérés par PTU et PTU.	`AzureOpenAIContextTokensCacheMatchRate`	Pourcentage	Minimum, maximum, moyenne	`Region`, , `ModelDeploymentNameModelName`, ,`ModelVersion`	PT1M	Non
Utilisation gérée par provisionnement (dépréciée) L’utilisation % pour un déploiement géré sous provision, calculé comme (PTU consommées / PTU déployées) x 100. Lorsque l’utilisation est supérieure ou égale à 100%, les appels sont limités et le code d’erreur 429 est renvoyé. Pour décomposer cette métrique, vous pouvez ajouter un filtre ou appliquer une répartition selon les dimensions suivantes : ModelDeploymentName, ModelName, ModelVersion et StreamType (requêtes en streaming vs non-streaming)	`AzureOpenAIProvisionedManagedUtilization`	Pourcentage	Minimum, maximum, moyenne	`Region`, , `StreamTypeModelDeploymentName`, , `ModelNameModelVersion`	PT1M	Non
Utilisation gérée par provisionnement V2 L’utilisation % pour un déploiement géré sous provision, calculé comme (PTU consommées / PTU déployées) x 100. Lorsque l’utilisation est supérieure ou égale à 100%, les appels sont limités et le code d’erreur 429 est renvoyé. Pour décomposer cette métrique, vous pouvez ajouter un filtre ou appliquer une répartition selon les dimensions suivantes : ModelDeploymentName, ModelName, ModelVersion et StreamType (requêtes en streaming vs non-streaming)	`AzureOpenAIProvisionedManagedUtilizationV2`	Pourcentage	Minimum, maximum, moyenne	`Region`, , `StreamTypeModelDeploymentName`, , `ModelNameModelVersion`	PT1M	Non
Heures de formation FineTuned traitées Nombre d’heures d’entraînement traitées sur un modèle OpenAI FineTuned	`FineTunedTrainingHours`	Nombre	Total (Somme)	`ApiName`, , `ModelDeploymentNameFeatureName`, , `UsageChannelRegion`	PT1M	Oui
Jetons de complétion générés Nombre de jetons générés (sortie) à partir d’un modèle OpenAI. Cela s’applique aux déploiements PTU, gérés par PTU et Pay-as-you-go. Pour décomposer cette métrique, vous pouvez ajouter un filtre ou appliquer une division selon les dimensions suivantes : ModelDeploymentName et ModelName.	`GeneratedTokens`	Nombre	Total (Somme)	`ApiName`, , `ModelDeploymentName`, `UsageChannelFeatureName`, , `RegionModelVersion`	PT1M	Oui
Jetons d’invite traités Nombre de jetons d’invite traités (entrées) sur un modèle OpenAI. Cela s’applique aux déploiements PTU, gérés par PTU et Pay-as-you-go. Pour décomposer cette métrique, vous pouvez ajouter un filtre ou appliquer une division selon les dimensions suivantes : ModelDeploymentName et ModelName.	`ProcessedPromptTokens`	Nombre	Total (Somme)	`ApiName`, , `ModelDeploymentName`, `UsageChannelFeatureName`, , `RegionModelVersion`	PT1M	Oui
Secondes API en temps réel utilisées Nombre de secondes utilisées dans RealtimeAPI	`RealtimeUsageTime`	Nombre	Total (Somme)	`Region`, `ModelDeploymentName`	PT1M	Oui
Jetons d’inférence traités Nombre de tokens d’inférence traités sur un modèle OpenAI. Calculé comme des jetons d’invite (entrée) plus des jetons générés (sortie). Cela s’applique aux déploiements PTU, gérés par PTU et Pay-as-you-go. Pour décomposer cette métrique, vous pouvez ajouter un filtre ou appliquer une division selon les dimensions suivantes : ModelDeploymentName et ModelName.	`TokenTransaction`	Nombre	Total (Somme)	`ApiName`, , `ModelDeploymentName`, `UsageChannelFeatureName`, , `RegionModelVersion`	PT1M	Oui

Catégorie : Services cognitifs - Requêtes HTTP

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Dimensions	Grains de temps	Exportation DS
Appels bloqués Nombre d’appels dépassant la limite de taux ou de quota. Ne pas utiliser pour Azure OpenAI service.	`BlockedCalls`	Nombre	Total (Somme)	`ApiName`, , `OperationNameRegion`, ,`RatelimitKey`	PT1M	Oui
Erreurs du client Nombre d’appels avec erreur côté client (code de réponse HTTP 4xx). Ne pas utiliser pour Azure OpenAI service.	`ClientErrors`	Nombre	Total (Somme)	`ApiName`, , `OperationNameRegion`, ,`RatelimitKey`	PT1M	Oui
Données entrantes Taille des données entrantes en octets. Ne pas utiliser pour Azure OpenAI service.	`DataIn`	Octets	Total (Somme)	`ApiName`, , `OperationNameRegion`	PT1M	Oui
Données sortantes Taille des données sortantes en octets. Ne pas utiliser pour Azure OpenAI service.	`DataOut`	Octets	Total (Somme)	`ApiName`, , `OperationNameRegion`	PT1M	Oui
Latency Latence en millisecondes. Ne pas utiliser pour Azure OpenAI service.	`Latency`	Millisecondes	Average	`ApiName`, , `OperationNameRegion`, ,`RatelimitKey`	PT1M	Oui
Limitation de débit La limite de vitesse actuelle de la clé de limite de vitesse. Ne pas utiliser pour Azure OpenAI service.	`Ratelimit`	Nombre	Total (Somme)	`Region`, `RatelimitKey`	PT1M	Oui
Erreurs de serveur Nombre d’appels avec erreur interne du service (code de réponse HTTP 5xx). Ne pas utiliser pour Azure OpenAI service.	`ServerErrors`	Nombre	Total (Somme)	`ApiName`, , `OperationNameRegion`, ,`RatelimitKey`	PT1M	Oui
Appels réussis Nombre d’appels réussis. Ne pas utiliser pour Azure OpenAI service.	`SuccessfulCalls`	Nombre	Total (Somme)	`ApiName`, , `OperationNameRegion`, ,`RatelimitKey`	PT1M	Oui
Nombre total d’appels Nombre total d’appels. Ne pas utiliser pour Azure OpenAI service.	`TotalCalls`	Nombre	Total (Somme)	`ApiName`, , `OperationNameRegion`, ,`RatelimitKey`	PT1M	Oui
Nombre total d’erreurs Nombre total d’appels avec réponse d’erreur (code de réponse HTTP 4xx ou 5xx). Ne pas utiliser pour Azure OpenAI service.	`TotalErrors`	Nombre	Total (Somme)	`ApiName`, , `OperationNameRegion`, ,`RatelimitKey`	PT1M	Oui
Total des appels de jetons Nombre total d’appels de tokens.	`TotalTokenCalls`	Nombre	Total (Somme)	`ApiName`, , `OperationNameRegion`	PT1M	Oui

Catégorie : Services cognitifs - SLI

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Dimensions	Grains de temps	Exportation DS
AvailabilityRate Pourcentage de disponibilité avec le calcul suivant : (Total d’appels - Erreurs de serveur)/Total d’appels. Les erreurs serveur incluent toutes les réponses >HTTP =500. Ne pas utiliser pour Azure OpenAI service.	`SuccessRate`	Pourcentage	Minimum, maximum, moyenne	`ApiName`, , `OperationNameRegion`, ,`RatelimitKey`	PT1M	Non

Catégorie : Compréhension du contenu - Utilisation

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Dimensions	Grains de temps	Exportation DS
Transactions par reconnaissance faciale Nombre d’appels API effectués vers Face Service	`FaceApiTransactions`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Minutes audio traitées Minutes d’audio traitées	`ProcessedAudioMinutes`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Pages traitées Nombre de pages de documents traitées	`ProcessedDocumentPages`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Images traitées Nombre d’images traitées	`ProcessedImageCount`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Minutes vidéo traitées Minutes de vidéo traitées	`ProcessedVideoMinutes`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Jetons Nombre de jetons consommés	`Tokens`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui

Catégorie : ContenuSécurité - Risques et Sécurité

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Dimensions	Grains de temps	Exportation DS
Nombre d’utilisateurs potentiellement abusifs Nombre d’utilisateurs potentiellement abusifs détectés sur une période donnée. Vous pouvez ajouter un filtre ou appliquer une division selon la dimension suivante : ModelDeploymentName.	`RAIAbusiveUsersCount`	Nombre	Total (Somme)	`Region`, `ModelDeploymentName`	PT1M	Oui
Volume nuisible détecté Nombre d’appels effectués vers l’API OpenAI d’Azure et détectés comme nuisibles (modèle par blocs et mode annotage) par un filtre de contenu appliqué sur une période donnée. Vous pouvez ajouter un filtre ou appliquer une séparation selon les dimensions suivantes : NomModelDéploiement, NomModèleNom et Type de Texte.	`RAIHarmfulRequests`	Nombre	Total (Somme)	`Region`, `ModelDeploymentName`, `ModelNameModelVersion`, , `ApiName`, `TextType`, `Category`, ,`Severity`	PT1M	Oui
Volume bloqué Nombre d’appels effectués vers l’API OpenAI Azure et rejetés par un filtre de contenu appliqué sur une période donnée. Vous pouvez ajouter un filtre ou appliquer une séparation selon les dimensions suivantes : NomModelDéploiement, NomModèleNom et Type de Texte.	`RAIRejectedRequests`	Nombre	Total (Somme)	`Region`, `ModelDeploymentName`, , `ModelVersionModelName`, `ApiName`, , `TextType`,`Category`	PT1M	Oui
Événement du système de sécurité Événement système pour la surveillance des risques et de la sécurité. Vous pouvez ajouter un filtre ou appliquer une division selon la dimension suivante : EventType.	`RAISystemEvent`	Nombre	Average	`Region`, `EventType`	PT1M	Oui
Volume total envoyé pour contrôle de sécurité Nombre d’appels effectués vers l’API OpenAI d’Azure et détectés par un filtre de contenu appliqué sur une période donnée. Vous pouvez ajouter un filtre ou appliquer une division selon les dimensions suivantes : NomDeDéploiementModèle, NomDeModèle.	`RAITotalRequests`	Nombre	Total (Somme)	`Region`, , `ModelDeploymentNameModelName`, , `ModelVersionApiName`	PT1M	Oui

Catégorie : Sécurité du contenu - Utilisation

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Dimensions	Grains de temps	Exportation DS
Nombre d’appels pour la modération d’images Nombre d’appels à la modération d’images.	`ContentSafetyImageAnalyzeRequestCount`	Nombre	Total (Somme)	`ApiVersion`	PT1M	Oui
Nombre d’appels pour la modération par SMS Nombre d’appels à la modération par texto.	`ContentSafetyTextAnalyzeRequestCount`	Nombre	Total (Somme)	`ApiVersion`	PT1M	Oui

Catégorie : Estimations

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Dimensions	Grains de temps	Exportation DS
Nombre de base des événements aléatoires Estimation du nombre d’événements aléatoires de base.	`BaselineRandomEventCount`	Nombre	Total (Somme)	`Mode`, `RunId`	PT1M	Oui
Récompense aléatoire de base Estimation de la récompense aléatoire de base.	`BaselineRandomReward`	Nombre	Total (Somme)	`Mode`, `RunId`	PT1M	Oui
Comptage des événements en ligne Estimation du nombre d’événements en ligne.	`OnlineEventCount`	Nombre	Total (Somme)	`Mode`, `RunId`	PT1M	Oui
Récompense en ligne Estimation pour la récompense en ligne.	`OnlineReward`	Nombre	Total (Somme)	`Mode`, `RunId`	PT1M	Oui
Nombre d’événements de référence utilisateur Estimation du nombre d’événements de référence défini par l’utilisateur.	`UserBaselineEventCount`	Nombre	Total (Somme)	`Mode`, `RunId`	PT1M	Oui
Récompense de base utilisateur Estimation de la récompense de référence définie par l’utilisateur.	`UserBaselineReward`	Nombre	Total (Somme)	`Mode`, `RunId`	PT1M	Oui

Catégorie : Occurrences de caractéristiques

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Dimensions	Grains de temps	Exportation DS
Occurrences des longs métrages d’action Nombre de fois où chaque action apparaît.	`ActionFeatureIdOccurrences`	Nombre	Total (Somme)	`FeatureId`, , `ModeRunId`	PT1M	Oui
Occurrences de caractéristiques contextuelles Le nombre de fois où chaque élément de contexte apparaît.	`ContextFeatureIdOccurrences`	Nombre	Total (Somme)	`FeatureId`, , `ModeRunId`	PT1M	Oui
Occurrences des caractéristiques des machines à sous Nombre de fois où chaque fonction de machine à sous apparaît.	`SlotFeatureIdOccurrences`	Nombre	Total (Somme)	`FeatureId`, , `ModeRunId`	PT1M	Oui

Catégorie : FeatureCardinality

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Dimensions	Grains de temps	Exportation DS
Cardinalité des caractéristiques par action Cardinalité des caractéristiques basée sur l’action.	`FeatureCardinality_Action`	Nombre	Average	`FeatureId`, , `ModeRunId`	PT1M	Oui
Cardinalité des caractéristiques selon le contexte Cardinalité des caractéristiques basée sur le contexte.	`FeatureCardinality_Context`	Nombre	Average	`FeatureId`, , `ModeRunId`	PT1M	Oui
Cardinalité des caractéristiques par emplacement Cardinalité des caractéristiques basée sur l’emplacement.	`FeatureCardinality_Slot`	Nombre	Average	`FeatureId`, , `ModeRunId`	PT1M	Oui

Catégorie : Fonctionnalités par événement

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Dimensions	Grains de temps	Exportation DS
Fonctionnalités d’action par événement Nombre moyen de longs métrages d’action par événement.	`ActionFeaturesPerEvent`	Nombre	Average	`Mode`, `RunId`	PT1M	Oui
Caractéristiques contextuelles par événement Nombre de caractéristiques contextuelles par événement.	`ContextFeaturesPerEvent`	Nombre	Average	`Mode`, `RunId`	PT1M	Oui
Caractéristiques des machines à sous par événement Nombre moyen de fonctionnalités de machines à sous par événement.	`SlotFeaturesPerEvent`	Nombre	Average	`Mode`, `RunId`	PT1M	Oui

Catégorie : Langue - Emplois

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Dimensions	Grains de temps	Exportation DS
Durée du poste (Aperçu) Note : cette valeur dépend fortement de la taille de l’entrée, du nombre de documents et de la complexité de la tâche. C’est une valeur agrégée pour toutes les tâches du poste.	`JobDuration`	Millisecondes	Minimum, maximum, moyenne	`JobStatus`, `JobType`	PT1M	Oui

Catégorie : Modèles - Requêtes HTTP

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Dimensions	Grains de temps	Exportation DS
Taux de disponibilité des modèles Pourcentage de disponibilité avec le calcul suivant : (Total d’appels - Erreurs de serveur)/Total d’appels. Les erreurs serveur incluent toutes les réponses >HTTP =500.	`ModelAvailabilityRate`	Pourcentage	Minimum, maximum, moyenne	`Region`, , `ModelDeploymentNameModelName`, ,`ModelVersion`	PT1M	Non
Demandes de modèle Nombre d’appels effectués vers l’API du modèle sur une période donnée. Cela s’applique aux déploiements PTU, PTU-Managed et Pay-as-you-go.	`ModelRequests`	Nombre	Total (Somme)	`ApiName`, , `OperationName`, , `RegionStreamTypeModelDeploymentNameModelNameModelVersionStatusCodeIsSpilloverServiceTierRequestServiceTierResponse`	PT1M	Oui

Catégorie : Modèles - Latence

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Dimensions	Grains de temps	Exportation DS
Temps entre les jetons Taux de génération de jetons modèles, mesuré en millisecondes. Cela s’applique aux déploiements gérés par PTU et PTU. Pour les requêtes non streamantes, cette valeur est une estimation.	`NormalizedTimeBetweenTokens`	Millisecondes	Maximum, minimum, moyenne	`ApiName`, `OperationName`, , `StreamTypeRegion`, `ModelDeploymentName`, , `ModelName`,`ModelVersion`	PT1M	Oui
Temps normalisé jusqu’au premier octet Le temps nécessaire pour que le premier octet de données de réponse soit reçu après que la requête a été effectuée par le modèle, normalisée par le jeton. Cela s’applique aux déploiements PTU, gérés par PTU et Pay-as-you-go. Pour les requêtes non streamantes, cette valeur est une estimation.	`NormalizedTimeToFirstToken`	Millisecondes	Maximum, minimum, moyenne	`ApiName`, `OperationName`, , `StreamTypeRegion`, `ModelDeploymentName`, , `ModelName`,`ModelVersion`	PT1M	Oui
Temps pour le dernier octet Le temps nécessaire pour que le dernier octet des données de réponse soit reçu après que la requête a été effectuée par le modèle. Cela s’applique aux déploiements PTU, gérés par PTU et Pay-as-you-go. Pour les requêtes non streamantes, cette valeur est une estimation.	`TimeToLastByte`	Millisecondes	Maximum, minimum, moyenne	`ApiName`, `OperationName`, , `StreamTypeRegion`, `ModelDeploymentName`, , `ModelName`,`ModelVersion`	PT1M	Oui
Temps d’intervenir Mesure recommandée de latence (réactivité). Cela s’applique aux déploiements gérés par PTU et PTU. Calculé comme le temps nécessaire pour que la première réponse apparaisse après qu’un utilisateur ait envoyé une invite, mesuré par la passerelle API. Ce chiffre augmente à mesure que la taille de la demande augmente et/ou que la taille des coups de cache diminue. Pour décomposer la métrique de temps de réponse, vous pouvez ajouter un filtre ou appliquer une séparation selon les dimensions suivantes : NomDeDéplayement, NomDeModèle, et VersionModèle. Note : cette métrique est une approximation, car la latence mesurée dépend fortement de plusieurs facteurs, y compris les appels simultanés et le schéma global de charge de travail. De plus, il ne prend pas en compte toute latence côté client qui pourrait exister entre votre client et le point de terminaison de l’API. Pour les requêtes non streamantes, cette valeur est une estimation. Veuillez consulter votre propre journal pour un suivi optimal de la latence.	`TimeToResponse`	Millisecondes	Minimum, maximum, moyenne	`ApiName`, `OperationName`, `RegionStreamType`, , `ModelDeploymentName`, `ModelName`, `ModelVersion`, ,`StatusCode`	PT1M	Oui
Jetons par seconde Énumère la vitesse de génération pour une réponse donnée du modèle. Le total des jetons générés est divisé par le temps nécessaire à la génération des jetons, en secondes. Cela s’applique aux déploiements gérés par PTU et PTU. Pour les requêtes non streamantes, cette valeur est une estimation.	`TokensPerSecond`	Nombre	Maximum, minimum, moyenne	`ApiName`, `OperationName`, , `StreamTypeRegion`, `ModelDeploymentName`, , `ModelName`,`ModelVersion`	PT1M	Oui

Catégorie : Modèles - Utilisation

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Dimensions	Grains de temps	Exportation DS
Pages annotées Nombre total de pages traitées avec annotations. Cela s’applique aux déploiements PTU, PTU-Managed et Pay-as-you-go.	`AnnotatedPages`	Nombre	Total (Somme)	`ApiName`, , `RegionModelDeploymentName`, , `ModelNameModelVersion`	PT1M	Oui
Jetons d’entrée audio Nombre de jetons d’invite audio traités (entrées) sur un modèle OpenAI. S’applique aux déploiements de modèles gérés par PTU.	`AudioInputTokens`	Nombre	Total (Somme)	`ModelDeploymentName`, , `ModelNameModelVersion`, ,`Region`	PT1M	Oui
Jetons de sortie audio Nombre de jetons d’invite audio générés (sortie) sur un modèle OpenAI. S’applique aux déploiements de modèles gérés par PTU.	`AudioOutputTokens`	Nombre	Total (Somme)	`ModelDeploymentName`, , `ModelNameModelVersion`, ,`Region`	PT1M	Oui
Jetons d’invite lus depuis le cache Nombre total de jetons lus depuis le cache. Cela s’applique aux déploiements de modèles Anthropic. Apparu dans la section d’utilisation des réponses comme `cache_read_input_tokens`	`cacheReadInputTokens`	Nombre	Total (Somme)	`ApiName`, , `Region`, `ModelNameModelDeploymentName`, , `ModelVersionContextLength`	PT1M	Oui
Jetons d’invite écrits en cache (TTL de 1 heure) Le nombre de jetons de prompt utilisés pour créer l’entrée d’une heure. Cela s’applique aux déploiements de modèles Anthropic. Apparu dans la section d’utilisation des réponses comme `cache_creation.ephemeral_1h_input_tokens`	`ephemeral1hInputTokens`	Nombre	Total (Somme)	`ApiName`, , `Region`, `ModelNameModelDeploymentName`, , `ModelVersionContextLength`	PT1M	Oui
Jetons d’invite écrits en cache (TTL de 5 minutes) Le nombre de jetons d’invite utilisés pour créer l’entrée de cache en 5 minutes. Cela s’applique aux déploiements de modèles Anthropic. Apparu dans la section d’utilisation des réponses comme `cache_creation.ephemeral_5m_input_tokens`	`ephemeral5mInputTokens`	Nombre	Total (Somme)	`ApiName`, , `Region`, `ModelNameModelDeploymentName`, , `ModelVersionContextLength`	PT1M	Oui
Images générées Nombre total d’images générées. Cela s’applique aux déploiements PTU, PTU-Managed et Pay-as-you-go.	`GeneratedImages`	Nombre	Total (Somme)	`ApiName`, , `RegionModelDeploymentName`, , `ModelNameModelVersion`	PT1M	Oui
Jetons d’entrée Nombre de jetons d’invite traités (entrées) sur un modèle. Cela s’applique aux déploiements PTU, PTU-Managed et Pay-as-you-go.	`InputTokens`	Nombre	Total (Somme)	`ApiName`, , `RegionModelDeploymentName`, , `ModelNameModelVersion`	PT1M	Oui
Jetons de sortie Nombre de jetons générés (sortie) à partir d’un modèle OpenAI. Cela s’applique aux déploiements PTU, PTU-Managed et Pay-as-you-go.	`OutputTokens`	Nombre	Total (Somme)	`ApiName`, , `RegionModelDeploymentName`, , `ModelNameModelVersion`	PT1M	Oui
Utilisation provisionnée L’utilisation % pour un déploiement géré sous provision, calculé comme (PTU consommées / PTU déployées) x 100. Lorsque l’utilisation est supérieure ou égale à 100%, les appels sont limités et le code d’erreur 429 est renvoyé.	`ProvisionedUtilization`	Pourcentage	Minimum, maximum, moyenne	`Region`, , `ModelDeploymentNameModelName`, ,`ModelVersion`	PT1M	Non
Total Pages Nombre total de pages traitées. Cela s’applique aux déploiements PTU, PTU-Managed et Pay-as-you-go.	`TotalPages`	Nombre	Total (Somme)	`ApiName`, , `RegionModelDeploymentName`, , `ModelNameModelVersion`	PT1M	Oui
Nombre total de jetons Nombre de jetons d’inférence traités sur un modèle. Calculé comme des jetons d’invite (entrée) plus des jetons générés (sortie). Cela s’applique aux déploiements PTU, PTU-Managed et Pay-as-you-go.	`TotalTokens`	Nombre	Total (Somme)	`ApiName`, , `RegionModelDeploymentName`, , `ModelNameModelVersion`	PT1M	Oui

Catégorie : Espaces de noms par événement

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Dimensions	Grains de temps	Exportation DS
Espaces de noms d’actions par événement Nombre moyen d’espaces de noms d’actions par événement.	`ActionNamespacesPerEvent`	Nombre	Average	`Mode`, `RunId`	PT1M	Oui
Espaces de noms contextuels par événement Nombre d’espaces de noms contextuels par événement.	`ContextNamespacesPerEvent`	Nombre	Average	`Mode`, `RunId`	PT1M	Oui
Espaces de noms de machines à sous par événement Nombre moyen d’espaces de noms de machines à sous par événement.	`SlotNamespacesPerEvent`	Nombre	Average	`Mode`, `RunId`	PT1M	Oui

Catégorie : Récompenses

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Dimensions	Grains de temps	Exportation DS
Récompense moyenne par événement Récompense moyenne par événement.	`Reward`	Nombre	Average	`BaselineAction`, , `ChosenActionId`, `NonDefaultRewardMatchesBaseline`, , `ModeRunId`	PT1M	Oui
Récompense de la machine à sous Récompense par emplacement.	`SlotReward`	Nombre	Average	`BaselineActionId`, `ChosenActionId`, `MatchesBaselineNonDefaultReward`, , `SlotId`, `SlotIndex`, `Mode`, ,`RunId`	PT1M	Oui

Catégorie : Machines à sous

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Dimensions	Grains de temps	Exportation DS
Récompense globale par estimateur de référence Estimateur de référence : récompense globale.	`BaselineEstimatorOverallReward`	Nombre	Average	`Mode`, `RunId`	PT1M	Oui
Récompense de slot estimatrice de référence Estimateur de base : récompense par emplacement.	`BaselineEstimatorSlotReward`	Nombre	Average	`SlotId`, , `SlotIndexMode`, ,`RunId`	PT1M	Oui
Estimateur aléatoire de référence : Récompense globale Récompense globale par estimateur aléatoire de base.	`BaselineRandomEstimatorOverallReward`	Nombre	Average	`Mode`, `RunId`	PT1M	Oui
Récompense de base pour l’emplacement d’estimateur aléatoire Estimateur aléatoire de base : récompense par emplacement.	`BaselineRandomEstimatorSlotReward`	Nombre	Average	`SlotId`, , `SlotIndexMode`, ,`RunId`	PT1M	Oui
Slots Nombre de places par événement.	`NumberOfSlots`	Nombre	Average	`Mode`, `RunId`	PT1M	Oui
Estimateur en ligne Récompense globale Estimateur en ligne Récompense globale.	`OnlineEstimatorOverallReward`	Nombre	Average	`Mode`, `RunId`	PT1M	Oui
Récompense de machine à sous estimatrice en ligne Estimateur en ligne Récompense par fente.	`OnlineEstimatorSlotReward`	Nombre	Average	`SlotId`, , `SlotIndexMode`, ,`RunId`	PT1M	Oui
Occurrences d’emplacement Le nombre de fois où chaque emplacement apparaît.	`SlotIdOccurrences`	Nombre	Total (Somme)	`SlotId`, , `SlotIndexMode`, ,`RunId`	PT1M	Oui

Catégorie : Services de parole - Utilisation

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Dimensions	Grains de temps	Exportation DS
Secondes audio transcrites en lot Nombre de secondes transcrites par lot	`AudioSecondsBatchTranscribed`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Secondes audio Chuchotement en lot transcrit Nombre de secondes du chuchotement du lot transcrit	`AudioSecondsBatchWhisperTranscribed`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Secondes audio transcrites rapidement Nombre rapide de secondes transcrites	`AudioSecondsFastTranscribed`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Secondes audio Rapide Chuchotement transcrit Nombre de secondes rapidement en chuchotement transcrit	`AudioSecondsFastWhisperTranscribed`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Secondes audio transcrites Nombre de secondes transcrites	`AudioSecondsTranscribed`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Secondes audio traduites Nombre de secondes traduites	`AudioSecondsTranslated`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Durée d'hébergement en secondes du modèle d'avatar Nombre de secondes.	`AvatarModelHostingSeconds`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Secondes d’entraînement du modèle d’avatar Nombre de secondes.	`AvatarModelTrainingSeconds`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Nombre de profils d’intervenants Nombre de profils d’intervenants inscrits. Au prorata horaire.	`NumberofSpeakerProfiles`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Transactions de reconnaissance des haut-parleurs Nombre de transactions de reconnaissance des haut-parleurs	`SpeakerRecognitionTransactions`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Heures d’animation du modèle de discours Nombre d’heures d’animation du modèle de discours	`SpeechModelHostingHours`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Caractères synthétisés Nombre de personnages.	`SynthesizedCharacters`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Secondes vidéo synthétisées Nombre de secondes synthétisées	`VideoSecondsSynthesized`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Jetons d’entrée audio en direct pour voix Nombre de jetons d’entrée audio, hors jetons mis en cache.	`VoiceLiveAudioInputTokens`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Jetons de sortie audio en direct pour voix Nombre de jetons de sortie audio.	`VoiceLiveAudioOutputTokens`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Jetons d’entrée audio en cache en direct pour voix Nombre de jetons d’entrée audio mis en cache.	`VoiceLiveCachedAudioInputTokens`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Jetons d’entrée de texte en cache Voice Live Nombre de jetons d’entrée texte mis en cache.	`VoiceLiveCachedTextInputTokens`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Jetons d’entrée de texte en direct pour voix Nombre de jetons d’entrée texte, hors jetons mis en cache.	`VoiceLiveTextInputTokens`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Jetons de sortie texte en direct pour voix Nombre de jetons de sortie texte.	`VoiceLiveTextOutputTokens`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Heures d’animation des modèles vocaux Nombre d’heures.	`VoiceModelHostingHours`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Minutes d’entraînement des modèles vocaux Nombre de minutes.	`VoiceModelTrainingMinutes`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui

Catégorie : Services de retraduction - Utilisation

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Dimensions	Grains de temps	Exportation DS
Personnages entraînés (dépréciés) Nombre total de personnages entraînés.	`CharactersTrained`	Nombre	Total (Somme)	`ApiName`, , `OperationNameRegion`	PT1M	Oui
Personnages traduits (dépréciés) Nombre total de caractères dans les demandes de texte entrantes.	`CharactersTranslated`	Nombre	Total (Somme)	`ApiName`, , `OperationNameRegion`	PT1M	Oui
Caractères du document traduits Nombre de caractères dans la demande de traduction du document.	`DocumentCharactersTranslated`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Caractères personnalisés du document traduits Nombre de caractères dans la demande de traduction personnalisée d’un document.	`DocumentCustomCharactersTranslated`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Caractères de synchronisation de documents traduits Nombre de caractères dans la requête de traduction de document (synchrone).	`OneDocumentCharactersTranslated`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Synchronisation de documents Caractères personnalisés traduits Nombre de caractères dans la demande de traduction de document personnalisé (synchrone).	`OneDocumentCustomCharactersTranslated`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Caractères de texte traduits Nombre de caractères dans la demande de traduction de texte entrante.	`TextCharactersTranslated`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Caractères personnalisés du texte traduits Nombre de caractères dans la demande de traduction de texte personnalisée entrante.	`TextCustomCharactersTranslated`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Caractères entraînés au texte Nombre de caractères entraînés par traduction de texte.	`TextTrainedCharacters`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Traducteur Pro Application Seconds Nombre de secondes d’utilisation de l’application Translator Pro.	`TranslatorProAppSeconds`	Secondes	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui

Catégorie : Utilisation

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Dimensions	Grains de temps	Exportation DS
Nombre d’inférences Comte d’inférence du service Carnegie Frontdoor	`CarnegieInferenceCount`	Nombre	Total (Somme)	`Region`, , `Modality`, `LanguageCategory`, , `SeverityLevelUseCustomList`	PT1M	Oui
Transactions de vision informatique Nombre de transactions Vision par ordinateur	`ComputerVisionTransactions`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Temps d’entraînement visuel personnalisé Temps d’entraînement Custom Vision	`CustomVisionTrainingTime`	Secondes	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Transactions Vision personnalisées Nombre de transactions de prédiction Custom Vision	`CustomVisionTransactions`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Images faciales entraînées Nombre d’images entraînées. 1 000 images entraînées par transaction.	`FaceImagesTrained`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Visages enregistrés Nombre de visages enregistrés, prorata quotidiennement. Le nombre de visages stockés est rapporté quotidiennement.	`FacesStored`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Transactions par reconnaissance faciale Nombre d’appels API effectués vers Face Service	`FaceTransactions`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Images stockées Nombre d’images Custom Vision stockées.	`ImagesStored`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Événements détectés Nombre d’événements appris.	`LearnedEvents`	Nombre	Total (Somme)	`IsMatchBaseline`, , `ModeRunId`	PT1M	Oui
Demandes de discours LUIS Nombre de demandes de compréhension LUIS de la parole à intention	`LUISSpeechRequests`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Requêtes textuelles LUIS Nombre de requêtes textuelles LUIS	`LUISTextRequests`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Récompenses mises en correspondance Nombre de récompenses correspondantes.	`MatchedRewards`	Nombre	Total (Somme)	`Mode`, `RunId`	PT1M	Oui
Événements non activés Nombre d’épreuves sautées.	`NonActivatedEvents`	Nombre	Total (Somme)	`Mode`, `RunId`	PT1M	Oui
Récompenses observées Nombre de récompenses observées.	`ObservedRewards`	Nombre	Total (Somme)	`Mode`, `RunId`	PT1M	Oui
Caractères traités Nombre de caractères traités par Immersive Reader.	`ProcessedCharacters`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Dossiers textuels de santé traités Nombre de dossiers textes médicaux traités	`ProcessedHealthTextRecords`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Images traitées Nombre d’images traitées	`ProcessedImages`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Pages traitées Nombre de pages traitées	`ProcessedPages`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Enregistrements textuels traités Compte des enregistrements textuels.	`ProcessedTextRecords`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Enregistrements textuels QA Nombre d’enregistrements textuels traités	`QuestionAnsweringTextRecords`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Durée de la séance de discours (dépréciée) Durée totale de la séance de parole en quelques secondes.	`SpeechSessionDuration`	Secondes	Total (Somme)	`ApiName`, , `OperationNameRegion`	PT1M	Oui
Nombre total d'événements Nombre d’événements.	`TotalEvents`	Nombre	Total (Somme)	`Mode`, `RunId`	PT1M	Oui
Total des transactions (dépréciées) Nombre total de transactions.	`TotalTransactions`	Nombre	Total (Somme)	<aucun>	PT1M	Oui

Dimensions métriques

Pour des informations sur ce que sont les dimensions métriques, voir Métriques multidimensionnelles.

Ce service comporte les dimensions suivantes associées à ses métriques.

ApiName
Nom de fonctionnalité
ModelDeploymentName
ModelName
ModelVersion
Nom de l'Opération
Région
StatusCode
StreamType
UsageChannel

Journaux des ressources

Cette section liste les types de journaux de ressources que vous pouvez collecter pour ce service. Cette section puise dans la liste des types de catégories de journaux de ressources tous supportés dans Azure Monitor.

Journaux de ressources pris en charge pour Microsoft. Services/comptes cognitifs

Catégorie	Catégorie nom d’affichage	Table de logs	Prend en charge, le plan de journalisation de base	Prend en charge la transformation du temps d’ingestion	Coûts d’exportation
`Audit`	Journaux d’audit	AzureDiagnostics Journaux provenant de plusieurs ressources Azure.	Non	Non	Non
`AzureOpenAIRequestUsage`	Utilisation des requêtes Azure OpenAI	AzureDiagnostics Journaux provenant de plusieurs ressources Azure.	Non	Non	Oui
`RequestResponse`	Journaux de requêtes et de réponses	AzureDiagnostics Journaux provenant de plusieurs ressources Azure.	Non	Non	Non
`Trace`	Journaux de suivi	AzureDiagnostics Journaux provenant de plusieurs ressources Azure.	Non	Non	Non

Tables Azure Monitor Logs

Cette section liste les tables Azure Monitor Logs pertinentes pour ce service, qui sont disponibles pour requête par Log Analytics via les requêtes Kusto. Les tables contiennent des données de journal de ressources et peut-être plus encore selon ce qui y est collecté et acheminé.

Azure OpenAI microsoft.cognitiveservices/accounts

Journal d’activité

Le tableau lié liste les opérations pouvant être enregistrées dans le journal d’activité de ce service. Ces opérations constituent un sous-ensemble de toutes les opérations possibles du fournisseur de ressources dans le journal d’activité.

Pour plus d’informations sur le schéma des entrées du journal d’activité, voir Schéma du journal d’activité.

Opérations de fournisseurs de ressources IA + apprentissage automatique

Pour obtenir une description de la surveillance Azure OpenAI, consultez Monitor Azure OpenAI.
Pour plus d’informations sur la surveillance des ressources Azure, consultez Surveiller les ressources Azure avec Azure Monitor.

Commentaires

Cette page a-t-elle été utile ?

Last updated on 2026-05-20