Azure référence des données de supervision OpenAI (classique)

Affichage actuel :Version du portail - Passer à la version du nouveau portail Foundry

Cet article contient toutes les informations de référence de surveillance pour ce service.

Consultez Monitor Azure OpenAI pour plus d’informations sur les données que vous pouvez collecter pour Azure OpenAI dans Microsoft Modèles Foundry et comment l’utiliser.

Metrics

Cette section répertorie toutes les métriques de plateforme collectées automatiquement pour App Service. Ces métriques font également partie de la liste globale des métriques de plateforme alles prises en charge dans Azure Monitor.

Pour plus d’informations sur la rétention des métriques, consultez Azure Monitor Vue d’ensemble des métriques.

Métriques prises en charge pour Microsoft. CognitiveServices/comptes

Voici les métriques les plus importantes que nous pensons que vous devez surveiller pour Azure OpenAI. Plus loin dans cet article est une liste plus longue de toutes les métriques disponibles pour cet espace de noms, qui contient plus de détails sur les métriques de cette liste plus courte. Consultez la liste ci-dessous pour obtenir la plupart des informations à jour. Nous travaillons à actualiser les tableaux dans les sections suivantes.

Azure demandes OpenAI
Jetons actifs
Jetons d’achèvement générés
Heures de formation FineTuned traitées
Jetons d’inférence traités
Jetons d’invite traités
Utilisation managée provisionnée V2
Taux de correspondance du cache du jeton d’invite
Temps de réponse
Durée entre les jetons
Durée de la dernière octet
Temps normalisé pour le premier octet
Jetons par seconde

Vous pouvez également surveiller les métriques content Safety utilisées par d’autres services associés.

Volume bloqué
Volume dangereux détecté
Nombre potentiel d’utilisateurs abusifs
Événement du système de sécurité
Volume total envoyé pour vérification de sécurité

Note

La métrique d’utilisation gérée par l’approvisionnement est désormais déconseillée et n’est plus recommandée. Cette métrique a été remplacée par la métrique d’utilisation managée provisionnée V2. Les jetons par seconde, temps de réponse, temps entre jetons ne sont actuellement pas disponibles pour les déploiements Standard.

Les métriques Cognitive Services ont la catégorie Cognitive Services - Requêtes HTTP dans le tableau suivant. Ces métriques sont des métriques héritées communes à toutes les ressources de ce type. Microsoft ne vous recommande plus d’utiliser ces métriques avec Azure OpenAI.

Le tableau suivant répertorie les métriques disponibles pour la Microsoft. Type de ressource CognitiveServices/accounts.

Toutes les colonnes peuvent ne pas être présentes dans chaque table.
Certaines colonnes peuvent dépasser la zone d’affichage de la page. Sélectionnez Développer la table pour afficher toutes les colonnes disponibles.

En-têtes de tableau

Catégorie : le groupe de métriques ou classification.
Metric : nom complet de la métrique tel qu’il apparaît dans le portail Azure.
Name dans l’API REST : nom de métrique appelé dans l’API REST.
Unité : unité de mesure.
Aggregation : type aggregation par défaut. Valeurs valides : Moyen (moy), Minimum (min), Maximum (max), Total (somme), Nombre.
Dimensions - Dimensions disponible pour la métrique.
Time Grains - Intervals auquel la métrique est échantillonnée. Par exemple, PT1M indique que la métrique est échantillonnée toutes les minutes, PT30M toutes les 30 minutes, PT1H toutes les heures, et ainsi de suite.
DS Export : indique si la métrique est exportable vers Azure Monitor Journaux via les paramètres de diagnostic. Pour plus d’informations sur l’exportation de métriques, consultez Créer les paramètres de diagnostic dans Azure Monitor.

Catégorie : Actions

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Taille	Fragments de temps	Exportation DS
Occurences de l’action Nombre de fois où chaque action apparaît.	`ActionIdOccurrences`	Nombre	Total (Somme)	`ActionId`, , `ModeRunId`	PT1M	Oui
Actions par événement Nombre d’actions par événement.	`ActionsPerEvent`	Nombre	Moyen	`Mode`, `RunId`	PT1M	Oui

Catégorie : Azure OpenAI - Requêtes HTTP

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Taille	Fragments de temps	Exportation DS
Azure OpenAI AvailabilityRate Pourcentage de disponibilité avec le calcul suivant : (Nombre total d’appels - Erreurs de serveur)/Nombre total d’appels. Les erreurs de serveur incluent les réponses HTTP >=500.	`AzureOpenAIAvailabilityRate`	Pourcentage	Minimum, Maximum, Moyenne	`ApiName`, `OperationName`, , `RegionStreamType`, `ModelDeploymentName`, , `ModelName`,`ModelVersion`	PT1M	Non
Azure demandes OpenAI Nombre d’appels effectués à l’API OpenAI Azure sur une période donnée. S’applique aux déploiements PTU, managés par PTU, et avec paiement à l’utilisation. Pour décomposer les demandes d’API, vous pouvez ajouter un filtre ou appliquer un fractionnement en fonction des dimensions suivantes : ModelDeploymentName, ModelVersion, StatusCode (réussite, clienterrors, erreurs de serveur), IsSpillover pour les informations de basculement, ServiceTier, StreamType (streaming et demandes de non diffusion en continu) et opération.	`AzureOpenAIRequests`	Nombre	Total (Somme)	`ApiName`, , `OperationName`, , `RegionStreamTypeModelDeploymentNameModelNameModelVersionStatusCodeIsSpilloverServiceTierRequestServiceTierResponse`	PT1M	Oui

Catégorie : Azure OpenAI - Latence

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Taille	Fragments de temps	Exportation DS
Intervalle entre les tokens Pour les demandes de streaming, il s’agit du taux de génération de jetons du modèle, mesuré en millisecondes. S’applique aux déploiements PTU, managés par PTU, et avec paiement à l’utilisation.	`AzureOpenAINormalizedTBTInMS`	Millisecondes	Maximum, Minimum, Moyenne	`Region`, , `ModelDeploymentNameModelName`, ,`ModelVersion`	PT1M	Oui
Temps normalisé pour le premier octet Pour les demandes de streaming et non-streaming, il s’agit du temps nécessaire pour que le premier octet des données de réponse soit reçu après la réception de la demande par modèle, normalisé par jeton. S’applique aux déploiements PTU, managés par PTU, et avec paiement à l’utilisation.	`AzureOpenAINormalizedTTFTInMS`	Millisecondes	Maximum, Minimum, Moyenne	`Region`, , `ModelDeploymentNameModelName`, ,`ModelVersion`	PT1M	Oui
Temps de réponse Mesure de latence recommandée (réactivité) pour les requêtes de diffusion en continu. S’applique aux déploiements PTU, managés par PTU, et avec paiement à l’utilisation. Calculé comme temps nécessaire pour que la première réponse apparaisse après qu’un utilisateur envoie une invite, comme mesuré par la passerelle API. Ce nombre augmente à mesure que la taille de la requête augmente et/ou que le nombre de consultations du cache diminue. Pour répartir le temps de réponse, vous pouvez ajouter un filtre ou appliquer un fractionnement en fonction des dimensions suivantes : ModelDeploymentName, ModelName et ModelVersion. Remarque : cette métrique est une approximation, car la latence mesurée dépend fortement de plusieurs facteurs, notamment les appels simultanés et le modèle de charge de travail global. En outre, elle ne tient pas compte d’une latence côté client qui peut exister entre votre client et le point de terminaison de l’API. Reportez-vous à votre propre journalisation pour un suivi de latence optimal.	`AzureOpenAITimeToResponse`	Millisecondes	Minimum, Maximum, Moyenne	`ApiName`, `OperationName`, , `RegionStreamType`, `ModelDeploymentName`, `ModelName`, , `ModelVersion`,`StatusCode`	PT1M	Oui
Jetons par seconde Énumère la vitesse de génération d’une réponse de modèle OpenAI donnée Azure. Le nombre total de jetons générés est divisé par le temps nécessaire pour générer les jetons, en secondes. S’applique aux déploiements PTU, managés par PTU, et avec paiement à l’utilisation.	`AzureOpenAITokenPerSecond`	Nombre	Maximum, Minimum, Moyenne	`Region`, , `ModelDeploymentNameModelName`, ,`ModelVersion`	PT1M	Oui
Durée de la dernière octet Pour les demandes de diffusion en continu et de non-diffusion en continu ; temps nécessaire pour que le dernier octet des données de réponse soit reçu une fois la demande effectuée par modèle. S’applique aux déploiements PTU, managés par PTU, et avec paiement à l’utilisation.	`AzureOpenAITTLTInMS`	Millisecondes	Maximum, Minimum, Moyenne	`Region`, , `ModelDeploymentNameModelName`, ,`ModelVersion`	PT1M	Oui

Catégorie : Azure OpenAI - Utilisation

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Taille	Fragments de temps	Exportation DS
Jetons actifs Nombre total de jetons moins les jetons mis en cache sur une période donnée. S’applique aux PTU et aux déploiements gérés par le PTU. Utilisez cette métrique pour comprendre votre utilisation basée sur TPS ou TPM pour les PTU et la comparer à vos benchmarks pour le TPM ou TPS cible pour vos scénarios. Pour décomposer les demandes d’API, vous pouvez ajouter un filtre ou appliquer un fractionnement en fonction des dimensions suivantes : ModelDeploymentName, ModelName et ModelVersion.	`ActiveTokens`	Nombre	Minimum, Maximum, Moyenne, Total (Somme)	`Region`, , `ModelDeploymentNameModelName`, ,`ModelVersion`	PT1M	Oui
Jetons d’achèvement audio Nombre de jetons d’invite audio générés (sortie) sur un modèle OpenAI. S’applique aux modèles déploiements gérés par PTU et de paiement à l’utilisation.	`AudioCompletionTokens`	Nombre	Total (Somme)	`ModelDeploymentName`, , `ModelNameModelVersion`, ,`Region`	PT1M	Oui
Jetons de message vocal audio Nombre de jetons d’invite audio traités (entrée) sur un modèle OpenAI. S’applique aux modèles déploiements gérés par PTU et de paiement à l’utilisation.	`AudioPromptTokens`	Nombre	Total (Somme)	`ModelDeploymentName`, , `ModelNameModelVersion`, ,`Region`	PT1M	Oui
Taux de correspondance du cache du jeton d’invite Pourcentage de jetons d’invite qui atteignent le cache. S’applique aux PTU et aux déploiements gérés par le PTU.	`AzureOpenAIContextTokensCacheMatchRate`	Pourcentage	Minimum, Maximum, Moyenne	`Region`, , `ModelDeploymentNameModelName`, ,`ModelVersion`	PT1M	Non
Utilisation managée provisionnée (déconseillée) % d’utilisation pour un déploiement géré de manière provisionnée, calculé comme (PTUs consommés / PTUs déployés) x 100. Lorsque l’utilisation est supérieure ou égale à 100 %, les appels sont limités et le code d’erreur 429 est retourné. Pour décomposer cette métrique, vous pouvez ajouter un filtre ou appliquer un fractionnement en fonction des dimensions suivantes : ModelDeploymentName, ModelName, ModelVersion et StreamType (requêtes en streaming et non streaming)	`AzureOpenAIProvisionedManagedUtilization`	Pourcentage	Minimum, Maximum, Moyenne	`Region`, `StreamType`, , `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	Non
Utilisation managée provisionnée V2 % d’utilisation pour un déploiement géré de manière provisionnée, calculé comme (PTUs consommés / PTUs déployés) x 100. Lorsque l’utilisation est supérieure ou égale à 100 %, les appels sont limités et le code d’erreur 429 est retourné. Pour décomposer cette métrique, vous pouvez ajouter un filtre ou appliquer un fractionnement en fonction des dimensions suivantes : ModelDeploymentName, ModelName, ModelVersion et StreamType (requêtes en streaming et non streaming)	`AzureOpenAIProvisionedManagedUtilizationV2`	Pourcentage	Minimum, Maximum, Moyenne	`Region`, `StreamType`, , `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	Non
Heures de formation traitées et affinées Nombre d’heures de formation traitées sur un modèle FineTuned OpenAI	`FineTunedTrainingHours`	Nombre	Total (Somme)	`ApiName`, `ModelDeploymentName`, , `FeatureName`, `UsageChannel`, `Region`	PT1M	Oui
Jetons d’achèvement générés Nombre de jetons générés (sortie) à partir d’un modèle OpenAI. S’applique aux déploiements PTU, managés par PTU, et avec paiement à l’utilisation. Pour décomposer cette métrique, vous pouvez ajouter un filtre ou appliquer un fractionnement en fonction des dimensions suivantes : ModelDeploymentName et ModelName.	`GeneratedTokens`	Nombre	Total (Somme)	`ApiName`, , `ModelDeploymentName`, `FeatureNameUsageChannel`, , `RegionModelVersion`	PT1M	Oui
Jetons d’invite traités Nombre de jetons de requêtes traités (entrée) sur un modèle OpenAI. S’applique aux déploiements PTU, managés par PTU, et avec paiement à l’utilisation. Pour décomposer cette métrique, vous pouvez ajouter un filtre ou appliquer un fractionnement en fonction des dimensions suivantes : ModelDeploymentName et ModelName.	`ProcessedPromptTokens`	Nombre	Total (Somme)	`ApiName`, , `ModelDeploymentName`, `FeatureNameUsageChannel`, , `RegionModelVersion`	PT1M	Oui
Secondes de l’API en temps réel utilisées Nombre d’API en temps réel utilisé	`RealtimeUsageTime`	Nombre	Total (Somme)	`Region`, `ModelDeploymentName`	PT1M	Oui
Jetons d’inférence traités Nombre de jetons d’inférence traités sur un modèle OpenAI. Calculé en tant que jetons d’invite (entrée) plus jetons générés (sortie). S’applique aux déploiements PTU, managés par PTU, et avec paiement à l’utilisation. Pour décomposer cette métrique, vous pouvez ajouter un filtre ou appliquer un fractionnement en fonction des dimensions suivantes : ModelDeploymentName et ModelName.	`TokenTransaction`	Nombre	Total (Somme)	`ApiName`, , `ModelDeploymentName`, `FeatureNameUsageChannel`, , `RegionModelVersion`	PT1M	Oui

Catégorie : Cognitive Services - Requêtes HTTP

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Taille	Fragments de temps	Exportation DS
Appels bloqués Nombre d’appels ayant dépassé la limite de débit ou de quota. N’utilisez pas Azure service OpenAI.	`BlockedCalls`	Nombre	Total (Somme)	`ApiName`, , `OperationNameRegion`, ,`RatelimitKey`	PT1M	Oui
Erreurs du client Nombre d’appels avec erreur côté client (code de réponse HTTP : 4xx). N’utilisez pas Azure service OpenAI.	`ClientErrors`	Nombre	Total (Somme)	`ApiName`, , `OperationNameRegion`, ,`RatelimitKey`	PT1M	Oui
Données entrantes Taille des données entrantes en octets. N’utilisez pas Azure service OpenAI.	`DataIn`	Octets	Total (Somme)	`ApiName`, , `OperationNameRegion`	PT1M	Oui
Données sortantes Taille des données sortantes en octets. N’utilisez pas Azure service OpenAI.	`DataOut`	Octets	Total (Somme)	`ApiName`, , `OperationNameRegion`	PT1M	Oui
Latency Latence en millisecondes. N’utilisez pas Azure service OpenAI.	`Latency`	Millisecondes	Moyen	`ApiName`, , `OperationNameRegion`, ,`RatelimitKey`	PT1M	Oui
Limitation de débit La limite de débit actuelle de la clé ratelimit. N’utilisez pas Azure service OpenAI.	`Ratelimit`	Nombre	Total (Somme)	`Region`, `RatelimitKey`	PT1M	Oui
Erreurs de serveur Nombre d’appels avec erreur interne du service (code de réponse HTTP : 5xx). N’utilisez pas Azure service OpenAI.	`ServerErrors`	Nombre	Total (Somme)	`ApiName`, , `OperationNameRegion`, ,`RatelimitKey`	PT1M	Oui
Appels réussis Nombre d’appels réussis. N’utilisez pas Azure service OpenAI.	`SuccessfulCalls`	Nombre	Total (Somme)	`ApiName`, , `OperationNameRegion`, ,`RatelimitKey`	PT1M	Oui
Nombre total d’appels Nombre total d’appels. N’utilisez pas Azure service OpenAI.	`TotalCalls`	Nombre	Total (Somme)	`ApiName`, , `OperationNameRegion`, ,`RatelimitKey`	PT1M	Oui
Nombre total d’erreurs Nombre total d’appels avec réponse d’erreur (code de réponse HTTP : 4xx ou 5xx). N’utilisez pas Azure service OpenAI.	`TotalErrors`	Nombre	Total (Somme)	`ApiName`, , `OperationNameRegion`, ,`RatelimitKey`	PT1M	Oui
Nombre total d’appels de token Nombre total d’appels de tokens.	`TotalTokenCalls`	Nombre	Total (Somme)	`ApiName`, , `OperationNameRegion`	PT1M	Oui

Catégorie : Cognitive Services - SLI

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Taille	Fragments de temps	Exportation DS
AvailabilityRate Pourcentage de disponibilité avec le calcul suivant : (Nombre total d’appels - Erreurs de serveur)/Nombre total d’appels. Les erreurs de serveur incluent les réponses HTTP >=500. N’utilisez pas Azure service OpenAI.	`SuccessRate`	Pourcentage	Minimum, Maximum, Moyenne	`ApiName`, , `OperationNameRegion`, ,`RatelimitKey`	PT1M	Non

Catégorie : Compréhension du contenu - Utilisation

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Taille	Fragments de temps	Exportation DS
Transactions par reconnaissance faciale Nombre d’appels d’API effectués au service Face	`FaceApiTransactions`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Minutes audio traitées Minutes de traitement audio	`ProcessedAudioMinutes`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Pages traitées Nombre de pages de document traitées	`ProcessedDocumentPages`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Images traitées Nombre d’images traitées	`ProcessedImageCount`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Minutes de vidéo traitées Minutes de traitement vidéo	`ProcessedVideoMinutes`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Jetons Nombre de jetons consommés	`Tokens`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui

Catégorie : SécuritéDuContenu - Risques et Sécurité

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Taille	Fragments de temps	Exportation DS
Nombre d’utilisateurs potentiellement abusifs Nombre d’utilisateurs potentiellement abusifs détectés sur une période donnée. Vous pouvez ajouter un filtre ou appliquer un fractionnement par la dimension suivante : ModelDeploymentName.	`RAIAbusiveUsersCount`	Nombre	Total (Somme)	`Region`, `ModelDeploymentName`	PT1M	Oui
Volume dangereux détecté Nombre d’appels effectués à Azure’API OpenAI et détectés comme nuisibles (à la fois en mode bloc et annoté) par le filtre de contenu appliqué sur une période donnée. Vous pouvez ajouter un filtre ou appliquer un fractionnement en fonction des dimensions suivantes : ModelDeploymentName, ModelName et TextType.	`RAIHarmfulRequests`	Nombre	Total (Somme)	`Region`, `ModelDeploymentName`, , `ModelNameModelVersion`, `ApiName`, `TextType`, , `Category`,`Severity`	PT1M	Oui
Volume bloqué Nombre d’appels effectués à Azure’API OpenAI et rejetés par le filtre de contenu appliqué sur une période donnée. Vous pouvez ajouter un filtre ou appliquer un fractionnement en fonction des dimensions suivantes : ModelDeploymentName, ModelName et TextType.	`RAIRejectedRequests`	Nombre	Total (Somme)	`Region`, `ModelDeploymentName`, , `ModelNameModelVersion`, `ApiName`, , `TextType`,`Category`	PT1M	Oui
Événement du système de sécurité Événement système pour la surveillance des risques et de la sécurité. Vous pouvez ajouter un filtre ou appliquer un fractionnement par la dimension suivante : EventType.	`RAISystemEvent`	Nombre	Moyen	`Region`, `EventType`	PT1M	Oui
Volume total envoyé pour vérification de sécurité Nombre d’appels effectués à Azure’API OpenAI et détectés par le filtre de contenu appliqué sur une période donnée. Vous pouvez ajouter un filtre ou appliquer un fractionnement en fonction des dimensions suivantes : ModelDeploymentName, ModelName.	`RAITotalRequests`	Nombre	Total (Somme)	`Region`, `ModelDeploymentName`, , `ModelName`, `ModelVersion`, `ApiName`	PT1M	Oui

Catégorie : ContentSafety - Utilisation

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Taille	Fragments de temps	Exportation DS
Nombre de demandes de modération d'images Nombre d'appels pour la modération des images.	`ContentSafetyImageAnalyzeRequestCount`	Nombre	Total (Somme)	`ApiVersion`	PT1M	Oui
Nombre d’appels pour la modération du texte Nombre d'appels liés à la modération de textes.	`ContentSafetyTextAnalyzeRequestCount`	Nombre	Total (Somme)	`ApiVersion`	PT1M	Oui

Catégorie : Estimations

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Taille	Fragments de temps	Exportation DS
Nombre de base d’événements aléatoires Estimation du nombre d’événements aléatoires de référence.	`BaselineRandomEventCount`	Nombre	Total (Somme)	`Mode`, `RunId`	PT1M	Oui
Récompense aléatoire de référence Estimation de la récompense aléatoire de référence.	`BaselineRandomReward`	Nombre	Total (Somme)	`Mode`, `RunId`	PT1M	Oui
Nombre d’événements en ligne Estimation du nombre d’événements en ligne.	`OnlineEventCount`	Nombre	Total (Somme)	`Mode`, `RunId`	PT1M	Oui
Récompense en ligne Estimation de la récompense en ligne.	`OnlineReward`	Nombre	Total (Somme)	`Mode`, `RunId`	PT1M	Oui
Nombre d’événements de référence utilisateur Estimation du nombre d’événements de référence définis par l’utilisateur.	`UserBaselineEventCount`	Nombre	Total (Somme)	`Mode`, `RunId`	PT1M	Oui
Récompense de référence de l’utilisateur Estimation de la récompense de référence définie par l’utilisateur.	`UserBaselineReward`	Nombre	Total (Somme)	`Mode`, `RunId`	PT1M	Oui

Catégorie : Occurrences de fonctionnalité

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Taille	Fragments de temps	Exportation DS
Occurrences des fonctionnalités d’action Nombre de fois où chaque fonctionnalité d’action apparaît.	`ActionFeatureIdOccurrences`	Nombre	Total (Somme)	`FeatureId`, , `ModeRunId`	PT1M	Oui
Occurrences d'éléments contextuels Nombre de fois où chaque fonctionnalité de contexte apparaît.	`ContextFeatureIdOccurrences`	Nombre	Total (Somme)	`FeatureId`, , `ModeRunId`	PT1M	Oui
Occurrences des fonctionnalités d’emplacement Nombre de fois où chaque fonctionnalité d’emplacement apparaît.	`SlotFeatureIdOccurrences`	Nombre	Total (Somme)	`FeatureId`, , `ModeRunId`	PT1M	Oui

Catégorie : FeatureCardinality

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Taille	Fragments de temps	Exportation DS
Cardinalité des caractéristiques par action Cardinalité des fonctionnalités basée sur l’action.	`FeatureCardinality_Action`	Nombre	Moyen	`FeatureId`, , `ModeRunId`	PT1M	Oui
Cardinalité des variables par contexte Cardinalité des caractéristiques basée sur le contexte.	`FeatureCardinality_Context`	Nombre	Moyen	`FeatureId`, , `ModeRunId`	PT1M	Oui
Cardinalité des fonctionnalités par emplacement Cardinalité des fonctionnalités basée sur l’emplacement.	`FeatureCardinality_Slot`	Nombre	Moyen	`FeatureId`, , `ModeRunId`	PT1M	Oui

Catégorie : Fonctionnalités par événement

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Taille	Fragments de temps	Exportation DS
Fonctionnalités d’action par événement Nombre moyen de fonctionnalités d’action par événement.	`ActionFeaturesPerEvent`	Nombre	Moyen	`Mode`, `RunId`	PT1M	Oui
Fonctionnalités de contexte par événement Nombre de fonctionnalités de contexte par événement.	`ContextFeaturesPerEvent`	Nombre	Moyen	`Mode`, `RunId`	PT1M	Oui
Fonctionnalités d’emplacement par événement Nombre moyen de fonctionnalités d’emplacement par événement.	`SlotFeaturesPerEvent`	Nombre	Moyen	`Mode`, `RunId`	PT1M	Oui

Catégorie : Langue - Travaux

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Taille	Fragments de temps	Exportation DS
Durée de l'emploi (aperçu) Remarque : cette valeur dépend fortement de la taille d’entrée, du nombre de documents et de la complexité de la tâche. Il s’agit d’une valeur d’agrégation sur toutes les tâches de travail.	`JobDuration`	Millisecondes	Minimum, Maximum, Moyenne	`JobStatus`, `JobType`	PT1M	Oui

Catégorie : Modèles - Requêtes HTTP

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Taille	Fragments de temps	Exportation DS
Taux de disponibilité du modèle Pourcentage de disponibilité avec le calcul suivant : (Nombre total d’appels - Erreurs de serveur)/Nombre total d’appels. Les erreurs de serveur incluent les réponses HTTP >=500.	`ModelAvailabilityRate`	Pourcentage	Minimum, Maximum, Moyenne	`Region`, , `ModelDeploymentNameModelName`, ,`ModelVersion`	PT1M	Non
Demandes de modèle Nombre d’appels effectués à l’API de modèle sur une période donnée. S’applique aux déploiements PTU, managés par PTU, et avec paiement à l’utilisation.	`ModelRequests`	Nombre	Total (Somme)	`ApiName`, , `OperationName`, , `RegionStreamTypeModelDeploymentNameModelNameModelVersionStatusCodeIsSpilloverServiceTierRequestServiceTierResponse`	PT1M	Oui

Catégorie : Modèles - Latence

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Taille	Fragments de temps	Exportation DS
Durée entre les jetons Taux de génération de jetons de modèle, mesuré en millisecondes. S’applique aux PTU et aux déploiements gérés par le PTU. Pour les demandes sans diffusion en continu, cette valeur est une estimation.	`NormalizedTimeBetweenTokens`	Millisecondes	Maximum, Minimum, Moyenne	`ApiName`, `OperationName`, , `RegionStreamType`, `ModelDeploymentName`, , `ModelName`,`ModelVersion`	PT1M	Oui
Temps normalisé pour le premier octet Le temps nécessaire pour que le premier octet des données de réponse soit reçu après la réception de la demande par modèle, normalisé par jeton. S’applique aux déploiements PTU, managés par PTU, et avec paiement à l’utilisation. Pour les demandes sans diffusion en continu, cette valeur est une estimation.	`NormalizedTimeToFirstToken`	Millisecondes	Maximum, Minimum, Moyenne	`ApiName`, `OperationName`, , `RegionStreamType`, `ModelDeploymentName`, , `ModelName`,`ModelVersion`	PT1M	Oui
Durée de la dernière octet Temps nécessaire pour que le dernier octet des données de réponse soit reçu une fois la demande effectuée par modèle. S’applique aux déploiements PTU, managés par PTU, et avec paiement à l’utilisation. Pour les demandes sans diffusion en continu, cette valeur est une estimation.	`TimeToLastByte`	Millisecondes	Maximum, Minimum, Moyenne	`ApiName`, `OperationName`, , `RegionStreamType`, `ModelDeploymentName`, , `ModelName`,`ModelVersion`	PT1M	Oui
Temps de réponse Mesure de latence recommandée (réactivité). S’applique aux PTU et aux déploiements gérés par le PTU. Calculé comme temps nécessaire pour que la première réponse apparaisse après qu’un utilisateur envoie une invite, comme mesuré par la passerelle API. Ce nombre augmente à mesure que la taille de la requête augmente et/ou que le nombre de consultations du cache diminue. Pour répartir le temps de réponse, vous pouvez ajouter un filtre ou appliquer un fractionnement en fonction des dimensions suivantes : ModelDeploymentName, ModelName et ModelVersion. Remarque : cette métrique est une approximation, car la latence mesurée dépend fortement de plusieurs facteurs, notamment les appels simultanés et le modèle de charge de travail global. En outre, elle ne tient pas compte d’une latence côté client qui peut exister entre votre client et le point de terminaison de l’API. Pour les demandes sans diffusion en continu, cette valeur est une estimation. Reportez-vous à votre propre journalisation pour un suivi de latence optimal.	`TimeToResponse`	Millisecondes	Minimum, Maximum, Moyenne	`ApiName`, `OperationName`, , `RegionStreamType`, `ModelDeploymentName`, `ModelName`, , `ModelVersion`,`StatusCode`	PT1M	Oui
Jetons par seconde Énumère la vitesse de génération d’une réponse de modèle donnée. Le nombre total de jetons générés est divisé par le temps nécessaire pour générer les jetons, en secondes. S’applique aux PTU et aux déploiements gérés par le PTU. Pour les demandes sans diffusion en continu, cette valeur est une estimation.	`TokensPerSecond`	Nombre	Maximum, Minimum, Moyenne	`ApiName`, `OperationName`, , `RegionStreamType`, `ModelDeploymentName`, , `ModelName`,`ModelVersion`	PT1M	Oui

Catégorie : Modèles - Utilisation

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Taille	Fragments de temps	Exportation DS
Pages annotées Nombre total de pages traitées avec des annotations. S’applique aux déploiements PTU, managés par PTU, et avec paiement à l’utilisation.	`AnnotatedPages`	Nombre	Total (Somme)	`ApiName`, `Region`, , `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	Oui
Jetons d’entrée audio Nombre de jetons d’invite audio traités (entrée) sur un modèle OpenAI. S’applique aux déploiements de modèles gérés par PTU.	`AudioInputTokens`	Nombre	Total (Somme)	`ModelDeploymentName`, , `ModelNameModelVersion`, ,`Region`	PT1M	Oui
Jetons de sortie audio Nombre de jetons d’invite audio générés (sortie) sur un modèle OpenAI. S’applique aux déploiements de modèles gérés par PTU.	`AudioOutputTokens`	Nombre	Total (Somme)	`ModelDeploymentName`, , `ModelNameModelVersion`, ,`Region`	PT1M	Oui
Jetons d’invite lus à partir du cache Nombre total de jetons lus à partir du cache. S’applique aux déploiements de modèles anthropices. Surfaced in response usage section as `cache_read_input_tokens`	`cacheReadInputTokens`	Nombre	Total (Somme)	`ApiName`, , `Region`, `ModelDeploymentNameModelName`, , `ModelVersionContextLength`	PT1M	Oui
Jetons d’invite écrits dans le cache (durée de vie de 1 heure) Nombre de jetons d’invite utilisés pour créer l’entrée de 1 heure. S’applique aux déploiements de modèles anthropices. Surfaced in response usage section as `cache_creation.ephemeral_1h_input_tokens`	`ephemeral1hInputTokens`	Nombre	Total (Somme)	`ApiName`, , `Region`, `ModelDeploymentNameModelName`, , `ModelVersionContextLength`	PT1M	Oui
Jetons d’invite écrits dans le cache (durée de vie de 5 minutes) Nombre de jetons d’invite utilisés pour créer l’entrée de cache de 5 minutes. S’applique aux déploiements de modèles anthropices. Surfaced in response usage section as `cache_creation.ephemeral_5m_input_tokens`	`ephemeral5mInputTokens`	Nombre	Total (Somme)	`ApiName`, , `Region`, `ModelDeploymentNameModelName`, , `ModelVersionContextLength`	PT1M	Oui
Images générées Nombre total d’images générées. S’applique aux déploiements PTU, managés par PTU, et avec paiement à l’utilisation.	`GeneratedImages`	Nombre	Total (Somme)	`ApiName`, `Region`, , `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	Oui
Jetons d’entrée Nombre de jetons d’invite traités (entrée) sur un modèle. S’applique aux déploiements PTU, managés par PTU, et avec paiement à l’utilisation.	`InputTokens`	Nombre	Total (Somme)	`ApiName`, `Region`, , `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	Oui
Jetons de sortie Nombre de jetons générés (sortie) à partir d’un modèle OpenAI. S’applique aux déploiements PTU, managés par PTU, et avec paiement à l’utilisation.	`OutputTokens`	Nombre	Total (Somme)	`ApiName`, `Region`, , `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	Oui
Utilisation provisionnée % d’utilisation pour un déploiement géré de manière provisionnée, calculé comme (PTUs consommés / PTUs déployés) x 100. Lorsque l’utilisation est supérieure ou égale à 100 %, les appels sont limités et le code d’erreur 429 est retourné.	`ProvisionedUtilization`	Pourcentage	Minimum, Maximum, Moyenne	`Region`, , `ModelDeploymentNameModelName`, ,`ModelVersion`	PT1M	Non
Total Pages Nombre total de pages traitées. S’applique aux déploiements PTU, managés par PTU, et avec paiement à l’utilisation.	`TotalPages`	Nombre	Total (Somme)	`ApiName`, `Region`, , `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	Oui
Nombre total de jetons Nombre de jetons d’inférence traités sur un modèle. Calculé en tant que jetons d’invite (entrée) plus jetons générés (sortie). S’applique aux déploiements PTU, managés par PTU, et avec paiement à l’utilisation.	`TotalTokens`	Nombre	Total (Somme)	`ApiName`, `Region`, , `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	Oui

Catégorie : Espaces de noms par événement

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Taille	Fragments de temps	Exportation DS
Espaces de noms d’action par événement Nombre moyen d’espaces de noms d’action par événement.	`ActionNamespacesPerEvent`	Nombre	Moyen	`Mode`, `RunId`	PT1M	Oui
Espaces de noms de contexte par événement Nombre d’espaces de noms de contexte par événement.	`ContextNamespacesPerEvent`	Nombre	Moyen	`Mode`, `RunId`	PT1M	Oui
Espaces de noms d’emplacement par événement Nombre moyen d’espaces de noms d’emplacement par événement.	`SlotNamespacesPerEvent`	Nombre	Moyen	`Mode`, `RunId`	PT1M	Oui

Catégorie : Récompenses

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Taille	Fragments de temps	Exportation DS
Récompense moyenne par événement Récompense moyenne par événement.	`Reward`	Nombre	Moyen	`BaselineAction`, , `ChosenActionId`, `MatchesBaselineNonDefaultReward`, , `ModeRunId`	PT1M	Oui
Récompense de la machine à sous Récompense par emplacement.	`SlotReward`	Nombre	Moyen	`BaselineActionId`, `ChosenActionId`, , `MatchesBaselineNonDefaultReward`, `SlotId`, `SlotIndex`, , `Mode`,`RunId`	PT1M	Oui

Catégorie : Machines à sous

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Taille	Fragments de temps	Exportation DS
Récompense globale de l'estimateur de référence Estimation de la récompense de référence globale.	`BaselineEstimatorOverallReward`	Nombre	Moyen	`Mode`, `RunId`	PT1M	Oui
Récompense de l’emplacement estimateur de référence Estimation de la récompense de référence par emplacement.	`BaselineEstimatorSlotReward`	Nombre	Moyen	`SlotId`, , `SlotIndexMode`, ,`RunId`	PT1M	Oui
Récompense globale de l’estimateur aléatoire de référence Estimation de la récompense de référence aléatoire globale.	`BaselineRandomEstimatorOverallReward`	Nombre	Moyen	`Mode`, `RunId`	PT1M	Oui
Récompense de l’estimateur aléatoire de référence Estimation de la récompense aléatoire de référence par emplacement.	`BaselineRandomEstimatorSlotReward`	Nombre	Moyen	`SlotId`, , `SlotIndexMode`, ,`RunId`	PT1M	Oui
Slots Nombre d’emplacements par événement.	`NumberOfSlots`	Nombre	Moyen	`Mode`, `RunId`	PT1M	Oui
Récompense Totale de l'Estimateur en Ligne Estimation de la récompense en ligne globale.	`OnlineEstimatorOverallReward`	Nombre	Moyen	`Mode`, `RunId`	PT1M	Oui
Récompense de l’emplacement estimateur en ligne Estimation de la récompense en ligne par emplacement.	`OnlineEstimatorSlotReward`	Nombre	Moyen	`SlotId`, , `SlotIndexMode`, ,`RunId`	PT1M	Oui
Occurrences d’emplacement Nombre de fois où chaque emplacement apparaît.	`SlotIdOccurrences`	Nombre	Total (Somme)	`SlotId`, , `SlotIndexMode`, ,`RunId`	PT1M	Oui

Catégorie : SpeechServices - Utilisation

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Taille	Fragments de temps	Exportation DS
Traitement par lots de secondes audio transcrit Nombre de secondes transcrites par lot	`AudioSecondsBatchTranscribed`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Audio Seconds Batch Whisper transcrit Nombre de secondes de chuchotement par lot transcrites	`AudioSecondsBatchWhisperTranscribed`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Transcrite rapide en secondes audio Nombre rapide de secondes transcrites	`AudioSecondsFastTranscribed`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Audio Seconds Fast Whisper transcrit Nombre rapide de secondes transcrites	`AudioSecondsFastWhisperTranscribed`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Secondes audio transcrites Nombre de secondes transcrites	`AudioSecondsTranscribed`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Secondes d'audio traduites Nombre de secondes traduites	`AudioSecondsTranslated`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Durée d'hébergement en secondes du modèle d'avatar Nombre de secondes.	`AvatarModelHostingSeconds`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Secondes d’entraînement du modèle avatar Nombre de secondes.	`AvatarModelTrainingSeconds`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Nombre de profils d’orateur Nombre de profils d’orateur inscrits. Au prorata horaire.	`NumberofSpeakerProfiles`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Transactions de reconnaissance de l’orateur Nombre de transactions de reconnaissance de l’orateur	`SpeakerRecognitionTransactions`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Heures d’hébergement du modèle Speech Nombre d’heures d’hébergement du modèle vocal	`SpeechModelHostingHours`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Caractères synthétisés Nombre de caractères.	`SynthesizedCharacters`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Secondes de vidéo synthétisées Nombre de secondes synthétisées	`VideoSecondsSynthesized`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Jetons d’entrée audio en direct vocal Nombre de jetons d’entrée audio, à l’exclusion des jetons mis en cache.	`VoiceLiveAudioInputTokens`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Jetons de sortie audio en direct vocal Nombre de jetons de sortie audio.	`VoiceLiveAudioOutputTokens`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Jetons d’entrée audio en cache vocal Nombre de jetons d’entrée audio mis en cache.	`VoiceLiveCachedAudioInputTokens`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Jetons d’entrée de texte mis en cache vocal Nombre de jetons d’entrée de texte mis en cache.	`VoiceLiveCachedTextInputTokens`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Jetons d’entrée de texte en direct vocaux Nombre de jetons d’entrée de texte, à l’exclusion des jetons mis en cache.	`VoiceLiveTextInputTokens`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Jetons de sortie de texte en direct vocaux Nombre de jetons de sortie de texte.	`VoiceLiveTextOutputTokens`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Heures d’hébergement du modèle vocal Nombre d’heures.	`VoiceModelHostingHours`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Minutes d’entraînement du modèle vocal Nombre de minutes.	`VoiceModelTrainingMinutes`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui

Catégorie : Translator Services - Utilisation

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Taille	Fragments de temps	Exportation DS
Caractères entraînés (déconseillés) Nombre total de caractères entraînés.	`CharactersTrained`	Nombre	Total (Somme)	`ApiName`, , `OperationNameRegion`	PT1M	Oui
Caractères traduits (déconseillés) Nombre total de caractères dans la requête de texte entrante.	`CharactersTranslated`	Nombre	Total (Somme)	`ApiName`, , `OperationNameRegion`	PT1M	Oui
Caractères de document traduits Nombre de caractères dans la demande de traduction de documentation.	`DocumentCharactersTranslated`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Caractères personnalisés de document traduits Nombre de caractères dans la demande de traduction de document personnalisée.	`DocumentCustomCharactersTranslated`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Caractères de synchronisation de documents traduits Nombre de caractères dans la requête de traduction de documents (synchrone).	`OneDocumentCharactersTranslated`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Caractères personnalisés traduits pour la synchronisation de documents Nombre de caractères dans la requête de traduction de documents personnalisée (synchrone).	`OneDocumentCustomCharactersTranslated`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Caractères de texte traduits Nombre de caractères dans la demande de traduction de texte entrante.	`TextCharactersTranslated`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Caractères personnalisés de texte traduits Nombre de caractères dans la demande de traduction de texte personnalisée entrante.	`TextCustomCharactersTranslated`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Caractères entraînés par le texte Nombre de caractères utilisés lors de l'entraînement à l'aide de la traduction de texte.	`TextTrainedCharacters`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Secondes de l’application Translator Pro Nombre de secondes d’utilisation de Translator Application Pro.	`TranslatorProAppSeconds`	Secondes	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui

Catégorie : Utilisation

Unité de mesure	Nom dans l’API REST	Unité	Aggregation	Taille	Fragments de temps	Exportation DS
Nombre d’inférences Nombre d’inférences de Carnegie Frontdoor Service	`CarnegieInferenceCount`	Nombre	Total (Somme)	`Region`, , `Modality`, `CategoryLanguage`, , `SeverityLevelUseCustomList`	PT1M	Oui
transactions Vision par ordinateur Nombre de transactions Vision par ordinateur	`ComputerVisionTransactions`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Custom Vision Temps de formation temps de formation Custom Vision	`CustomVisionTrainingTime`	Secondes	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
transactions Custom Vision Nombre de transactions de prédiction Custom Vision	`CustomVisionTransactions`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Images visage entraînées Nombre d’images entraînées. 1 000 images traitées par transaction.	`FaceImagesTrained`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Visages enregistrés Nombre de visages stockés, calculé au prorata quotidien. Le nombre de visages stockés est indiqué quotidiennement.	`FacesStored`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Transactions par reconnaissance faciale Nombre d’appels d’API effectués au service Face	`FaceTransactions`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Images stockées Nombre d’images Custom Vision stockées.	`ImagesStored`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Événements détectés Nombre d’événements appris.	`LearnedEvents`	Nombre	Total (Somme)	`IsMatchBaseline`, , `ModeRunId`	PT1M	Oui
Demandes vocales LUIS Nombre de demandes de compréhension de conversion de sortie orale en intention LUIS	`LUISSpeechRequests`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Demandes de texte LUIS Nombre de demandes de texte LUIS	`LUISTextRequests`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Récompenses mises en correspondance Nombre de récompenses correspondantes.	`MatchedRewards`	Nombre	Total (Somme)	`Mode`, `RunId`	PT1M	Oui
Événements non activés Nombre d’événements sautés.	`NonActivatedEvents`	Nombre	Total (Somme)	`Mode`, `RunId`	PT1M	Oui
Récompenses observées Nombre de récompenses observées.	`ObservedRewards`	Nombre	Total (Somme)	`Mode`, `RunId`	PT1M	Oui
Caractères traités Nombre de caractères traités par Immersive Reader.	`ProcessedCharacters`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Enregistrements de texte de santé traités Nombre d’enregistrements texte de santé traités	`ProcessedHealthTextRecords`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Images traitées Nombre d’images traitées	`ProcessedImages`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Pages traitées Nombre de pages traitées	`ProcessedPages`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Enregistrements de texte traités Nombre d’enregistrements texte.	`ProcessedTextRecords`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Enregistrements de texte qaïa Nombre d’enregistrements texte traités	`QuestionAnsweringTextRecords`	Nombre	Total (Somme)	`ApiName`, , `FeatureNameUsageChannel`, ,`Region`	PT1M	Oui
Durée de session de discours (déconseillée) Durée totale de la session vocale en secondes.	`SpeechSessionDuration`	Secondes	Total (Somme)	`ApiName`, , `OperationNameRegion`	PT1M	Oui
Nombre total d'événements Nombre d’événements.	`TotalEvents`	Nombre	Total (Somme)	`Mode`, `RunId`	PT1M	Oui
Total des transactions (obsolète) Nombre total de transactions.	`TotalTransactions`	Nombre	Total (Somme)	<aucune>	PT1M	Oui

Dimensions de métrique

Pour plus d’informations sur les dimensions des métriques, consultez Métriques multidimensionnelles.

Ce service a les dimensions suivantes associées à ses métriques.

ApiName
Nom de fonctionnalité
ModelDeploymentName
ModelName
ModèleVersion
NomOpération
Région
StatusCode
Type de flux
UsageChannel

Journaux d’activité de ressources

Cette section répertorie les types de journaux d’activité de ressources que vous pouvez collecter pour ce service. La section extrait la liste des types de catégories de journaux de ressources alles pris en charge dans Azure Monitor.

Journaux de ressources pris en charge pour Microsoft. CognitiveServices/comptes

Catégorie	Nom de présentation de la catégorie	Table de journal	Supports plan de journal de base	Soutient la transformation au moment de l'ingestion	Coûts d’exportation
`Audit`	Journaux d’audit	AzureDiagnostics Journaux de plusieurs ressources Azure.	Non	Non	Non
`AzureOpenAIRequestUsage`	Azure l’utilisation des demandes OpenAI	AzureDiagnostics Journaux de plusieurs ressources Azure.	Non	Non	Oui
`RequestResponse`	Journaux des requêtes et des réponses	AzureDiagnostics Journaux de plusieurs ressources Azure.	Non	Non	Non
`Trace`	Journaux de suivi	AzureDiagnostics Journaux de plusieurs ressources Azure.	Non	Non	Non

tables journaux d’activité Azure Monitor

Cette section répertorie les tables Azure Monitor Journaux pertinentes pour ce service, qui sont disponibles pour la requête par Log Analytics à l’aide de requêtes Kusto. Les tables contiennent les données du journal des ressources et éventuellement d’autres données en fonction de ce qui est collecté et acheminé vers elles.

Azure OpenAI microsoft.cognitiveservices/accounts

Journal d’activité

La table liée répertorie les opérations qui peuvent être enregistrées dans le journal d’activité de ce service. Ces opérations sont un sous-ensemble de toutes les opérations possibles du fournisseur de ressources dans le journal d’activité.

Pour plus d’informations sur le schéma des entrées du journal d’activité, consultez Schéma du journal d’activité.

AI + opérations de fournisseur de ressources machine learning

Consultez Monitor Azure OpenAI pour obtenir une description de la surveillance Azure OpenAI.
Consultez Monitor Azure ressources avec Azure Monitor pour plus d’informations sur la surveillance des ressources Azure.

Commentaires

Est-ce que cette page vous a été utile?

Last updated on 2026-02-28