données de référence pour la surveillance d'Azure OpenAI

Cet article contient toutes les informations de référence de surveillance pour ce service.

Pour plus d’informations sur les données que vous pouvez collecter pour Azure OpenAI dans Microsoft Modèles Foundry et comment l’utiliser, consultez Monitor Azure OpenAI.

Metrics

Cette section liste tous les indicateurs de plateforme collectés automatiquement pour ce service. Ces indicateurs font également partie de la liste mondiale des métriques toutes les plateformes prises en charge dans Azure Monitor.

Pour des informations sur la rétention des métriques, voir Azure Monitor Aperçu des métriques.

Métriques prises en charge pour Microsoft. Services/comptes cognitifs

Surveillez les métriques les plus importantes pour Azure OpenAI. Plus loin dans cet article, vous trouverez une liste plus longue de toutes les métriques disponibles pour cet espace de noms, qui contient plus de détails sur les métriques de cette liste plus courte. Consultez la liste suivante pour obtenir les informations les plus up-to-date. L’équipe Azure travaille à actualiser les tables dans les sections suivantes.

Important

Ne confondez pas les métriques de cette section avec l’ancienne Latency métrique listée sous Services cognitifs - Requêtes HTTP plus loin dans cet article. L'ancienne métrique Latency n'est pas conçue pour Azure charges de travail OpenAI et produit des résultats trompeurs lorsqu'elle est utilisée pour diagnostiquer Azure latence OpenAI. Pour Azure surveillance de latence OpenAI, utilisez Temps à la Réponse (AzureOpenAITimeToResponse), Temps jusqu’au dernier octet (AzureOpenAITTLTInMS), Temps entre jetons (AzureOpenAINormalizedTBTInMS), ou Temps normalisé jusqu’au premier octet (AzureOpenAINormalizedTTFTInMS). Pour des conseils sur l’interprétation de ces métriques, voir Performance et latence.

  • Azure demandes OpenAI
  • Jetons actifs
  • Jetons de complétion générés
  • Heures de formation FineTuned traitées
  • Jetons d’inférence traités
  • Jetons d’invite traités
  • Utilisation gérée par provisionnement V2
  • Taux de correspondance du cache de jetons sur prompt
  • Temps d’intervenir
  • Temps entre les jetons
  • Temps pour le dernier octet
  • Temps normalisé jusqu’au premier octet
  • Jetons par seconde

Vous pouvez également surveiller les métriques content Safety utilisées par d’autres services associés.

  • Volume bloqué
  • Volume nuisible détecté
  • Nombre potentiel d’utilisateurs abusifs
  • Événement du système de sécurité
  • Volume total envoyé pour contrôle de sécurité

Note

L’indicateur d’utilisation gérée par provisionnement est désormais obsolète et n’est plus recommandée. Cette métrique est remplacée par la métrique d’utilisation managée provisionnée V2 . Les jetons par seconde, le temps de réponse et le temps entre les jetons ne sont actuellement pas disponibles pour les déploiements Standard.

Référence rapide : indicateurs clés par cas d’usage

Utilisez ce tableau pour trouver la bonne métrique pour un objectif de surveillance spécifique. Pour des conseils de bout en bout sur l’interprétation de ces métriques, voir Performance et latence.

Je veux surveiller... Utilisez cette métrique Nom de l’API REST
Temps de réponse global Temps pour le dernier octet AzureOpenAITTLTInMS
Réactivité du premier jeton (streaming) Temps d’intervenir AzureOpenAITimeToResponse
Vitesse de génération de jetons Temps entre les jetons AzureOpenAINormalizedTBTInMS
Efficacité du premier jeton normalisée par la taille du prompt Temps normalisé jusqu’au premier octet AzureOpenAINormalizedTTFTInMS
Volume de jetons de sortie par requête Jetons de complétion générés GeneratedTokens
Volume de jeton d’entrée par requête Jetons d’invite traités ProcessedPromptTokens
Utilisation de la capacité PTU Utilisation gérée par provisionnement V2 AzureOpenAIProvisionedManagedUtilizationV2
Volume de requêtes et erreurs Azure demandes OpenAI AzureOpenAIRequests

Tip

Associez toujours une métrique de latence à une métrique de comptage de jetons. Une augmentation de latence sans augmentation correspondante du jeton pourrait indiquer un vrai problème. Une augmentation de latence avec une augmentation proportionnelle des jetons est un comportement attendu.

Avertissement

Les métriques sous Cognitive Services - HTTP Requests plus loin dans cet article sont des métriques héritées de Cognitive Services et ne sont pas conçues pour Azure charges de travail OpenAI. En particulier, la métrique Latency dans cette catégorie n'est pas la même que celle des métriques de latence Azure OpenAI (temps avant la réponse, temps jusqu'au dernier octet, temps entre les jetons, temps normalisé jusqu'au premier octet). L’utilisation de la métrique ancienne Latency pour Azure dépannage OpenAI produit des résultats trompeurs. Utilisez plutôt les métriques Azure OpenAI listées dans cette section.

Le tableau suivant présente les indicateurs disponibles pour Microsoft. Cognitive Services/type de ressource comptes.

  • Toutes les colonnes ne sont peut-être pas présentes dans chaque tableau.
  • Certaines colonnes peuvent être au-delà de la zone de vue de la page. Sélectionnez Tableau agrandi pour voir toutes les colonnes disponibles.

En-têtes de tableau

  • Catégorie - Le groupe métrique ou la classification.
  • Metric - Le nom d’affichage métrique tel qu’il apparaît dans le portail Azure.
  • Nom dans l’API REST - Le nom de la métrique tel qu’il est mentionné dans l’API REST.
  • Unité - Unité de mesure.
  • Agrégation - Le type d’agrégation par défaut. Valeurs valides : Moyenne (moyenne), Minimum (Min), Maximum (Max), Total (Somme), Compte.
  • Dimensions - Dimensions disponibles pour la métrique.
  • Graaux temporels - Intervalles auxquels la métrique est échantillonnée. Par exemple, PT1M indique que la métrique est échantillonnée toutes les minutes, PT30M toutes les 30 minutes, PT1H toutes les heures, etc.
  • DS Export - Si la métrique est exportable vers Azure Monitor Logs via les paramètres de diagnostic. Pour des informations sur l’exportation des métriques, voir Créer des paramètres de diagnostic dans Azure Monitor.

Catégorie : Actions

Unité de mesure Nom dans l’API REST Unité Aggregation Dimensions Grains de temps Exportation DS
Occurences de l’action

Le nombre de fois où chaque action apparaît.
ActionIdOccurrences Nombre Total (Somme) ActionId, , ModeRunId PT1M Oui
Actions par événement

Nombre d’actions par événement.
ActionsPerEvent Nombre Average Mode, RunId PT1M Oui

Catégorie : Azure OpenAI - Requêtes HTTP

Unité de mesure Nom dans l’API REST Unité Aggregation Dimensions Grains de temps Exportation DS
Disponibilité d’Azure OpenAI

Pourcentage de disponibilité avec le calcul suivant : (Total d’appels - Erreurs de serveur)/Total d’appels. Les erreurs serveur incluent toutes les réponses >HTTP =500.
AzureOpenAIAvailabilityRate Pourcentage Minimum, maximum, moyenne ApiName, OperationName, , StreamTypeRegion, ModelDeploymentName, , ModelName,ModelVersion PT1M Non
Azure Requêtes OpenAI

Nombre d’appels effectués vers l’API OpenAI d’Azure sur une période donnée. Cela s’applique aux déploiements PTU, PTU-Managed et Pay-as-you-go. Pour décomposer les requêtes API, vous pouvez ajouter un filtre ou appliquer une division selon les dimensions suivantes : ModelDeploymentName, ModelName, ModelVersion, StatusCode (réussi, clienterrors, erreurs serveur), IsSpillover pour les informations de débordement, ServiceTier, StreamType (requêtes en streaming vs non-streaming) et opération.
AzureOpenAIRequests Nombre Total (Somme) ApiName, , OperationName, , RegionStreamTypeModelDeploymentNameModelNameModelVersionStatusCodeIsSpilloverServiceTierRequestServiceTierResponse PT1M Oui

Catégorie : Azure OpenAI - Latence

Unité de mesure Nom dans l’API REST Unité Aggregation Dimensions Grains de temps Exportation DS
Temps entre jetons

Pour les demandes de streaming ; Taux de génération de jetons modèle, mesuré en millisecondes. Cela s’applique aux déploiements PTU, gérés par PTU et Pay-as-you-go.
AzureOpenAINormalizedTBTInMS Millisecondes Maximum, minimum, moyenne Region, , ModelDeploymentNameModelName, ,ModelVersion PT1M Oui
Temps normalisé jusqu’au premier octet

Pour les demandes en streaming et non en streaming ; Le temps nécessaire pour que le premier octet de données de réponse soit reçu après que la requête a été effectuée par le modèle, normalisée par le jeton. Cela s’applique aux déploiements PTU, gérés par PTU et Pay-as-you-go.
AzureOpenAINormalizedTTFTInMS Millisecondes Maximum, minimum, moyenne Region, , ModelDeploymentNameModelName, ,ModelVersion PT1M Oui
Temps d’intervenir

Mesure recommandée de latence (réactivité) pour les requêtes en streaming. Cela s’applique aux déploiements PTU, gérés par PTU et Pay-as-you-go. Calculé comme le temps nécessaire pour que la première réponse apparaisse après qu’un utilisateur ait envoyé une invite, mesuré par la passerelle API. Ce chiffre augmente à mesure que la taille de la demande augmente et/ou que la taille des coups de cache diminue. Pour décomposer la métrique de temps de réponse, vous pouvez ajouter un filtre ou appliquer une séparation selon les dimensions suivantes : NomDeDéplayement, NomDeModèle, et VersionModèle.

Note : cette métrique est une approximation, car la latence mesurée dépend fortement de plusieurs facteurs, y compris les appels simultanés et le schéma global de charge de travail. De plus, il ne prend pas en compte toute latence côté client qui pourrait exister entre votre client et le point de terminaison de l’API. Veuillez consulter votre propre journal pour un suivi optimal de la latence.
AzureOpenAITimeToResponse Millisecondes Minimum, maximum, moyenne ApiName, OperationName, RegionStreamType, , ModelDeploymentName, ModelName, ModelVersion, ,StatusCode PT1M Oui
Jetons par seconde

Énumère la vitesse de génération pour la réponse donnée d’un modèle Azure OpenAI. Le total des jetons générés est divisé par le temps nécessaire à la génération des jetons, en secondes. Cela s’applique aux déploiements PTU, gérés par PTU et Pay-as-you-go.
AzureOpenAITokenPerSecond Nombre Maximum, minimum, moyenne Region, , ModelDeploymentNameModelName, ,ModelVersion PT1M Oui
Temps pour le dernier octet

Pour les demandes en streaming et non en streaming ; Le temps nécessaire pour que le dernier octet de données de réponse soit reçu après la requête effectuée par le modèle. Cela s’applique aux déploiements PTU, gérés par PTU et Pay-as-you-go.
AzureOpenAITTLTInMS Millisecondes Maximum, minimum, moyenne Region, , ModelDeploymentNameModelName, ,ModelVersion PT1M Oui

Catégorie : Azure OpenAI - Utilisation

Unité de mesure Nom dans l’API REST Unité Aggregation Dimensions Grains de temps Exportation DS
Jetons actifs

Total des jetons moins les jetons mis en cache sur une période donnée. Cela s’applique aux déploiements gérés par PTU et PTU. Utilisez cette métrique pour comprendre votre utilisation basée sur le TPS ou TPM pour les PTU et comparez avec vos benchmarks pour le TPS cible ou le TPM pour vos scénarios. Pour décomposer les requêtes API, vous pouvez ajouter un filtre ou appliquer une division selon les dimensions suivantes : ModelDeploymentName, ModelName, et ModelVersion.
ActiveTokens Nombre Minimum, maximum, moyenne, total (somme) Region, , ModelDeploymentNameModelName, ,ModelVersion PT1M Oui
Jetons de complétion audio

Nombre de jetons d’invite audio générés (sortie) sur un modèle OpenAI. Cela s’applique aux déploiements gérés par PTU et au modèle Pay-as-you-go.
AudioCompletionTokens Nombre Total (Somme) ModelDeploymentName, , ModelNameModelVersion, ,Region PT1M Oui
Jetons d’invite audio

Nombre de jetons d’invite audio traités (entrées) sur un modèle OpenAI. Cela s’applique aux déploiements gérés par PTU et au modèle Pay-as-you-go.
AudioPromptTokens Nombre Total (Somme) ModelDeploymentName, , ModelNameModelVersion, ,Region PT1M Oui
Taux de correspondance du cache de jetons sur prompt

Pourcentage de jetons d’invite qui ont été envoyés dans la cache. Cela s’applique aux déploiements gérés par PTU et PTU.
AzureOpenAIContextTokensCacheMatchRate Pourcentage Minimum, maximum, moyenne Region, , ModelDeploymentNameModelName, ,ModelVersion PT1M Non
Utilisation gérée par provisionnement (dépréciée)

L’utilisation % pour un déploiement géré sous provision, calculé comme (PTU consommées / PTU déployées) x 100. Lorsque l’utilisation est supérieure ou égale à 100%, les appels sont limités et le code d’erreur 429 est renvoyé. Pour décomposer cette métrique, vous pouvez ajouter un filtre ou appliquer une répartition selon les dimensions suivantes : ModelDeploymentName, ModelName, ModelVersion et StreamType (requêtes en streaming vs non-streaming)
AzureOpenAIProvisionedManagedUtilization Pourcentage Minimum, maximum, moyenne Region, , StreamTypeModelDeploymentName, , ModelNameModelVersion PT1M Non
Utilisation gérée par provisionnement V2

L’utilisation % pour un déploiement géré sous provision, calculé comme (PTU consommées / PTU déployées) x 100. Lorsque l’utilisation est supérieure ou égale à 100%, les appels sont limités et le code d’erreur 429 est renvoyé. Pour décomposer cette métrique, vous pouvez ajouter un filtre ou appliquer une répartition selon les dimensions suivantes : ModelDeploymentName, ModelName, ModelVersion et StreamType (requêtes en streaming vs non-streaming)
AzureOpenAIProvisionedManagedUtilizationV2 Pourcentage Minimum, maximum, moyenne Region, , StreamTypeModelDeploymentName, , ModelNameModelVersion PT1M Non
Heures de formation FineTuned traitées

Nombre d’heures d’entraînement traitées sur un modèle OpenAI FineTuned
FineTunedTrainingHours Nombre Total (Somme) ApiName, , ModelDeploymentNameFeatureName, , UsageChannelRegion PT1M Oui
Jetons de complétion générés

Nombre de jetons générés (sortie) à partir d’un modèle OpenAI. Cela s’applique aux déploiements PTU, gérés par PTU et Pay-as-you-go. Pour décomposer cette métrique, vous pouvez ajouter un filtre ou appliquer une division selon les dimensions suivantes : ModelDeploymentName et ModelName.
GeneratedTokens Nombre Total (Somme) ApiName, , ModelDeploymentName, UsageChannelFeatureName, , RegionModelVersion PT1M Oui
Jetons d’invite traités

Nombre de jetons d’invite traités (entrées) sur un modèle OpenAI. Cela s’applique aux déploiements PTU, gérés par PTU et Pay-as-you-go. Pour décomposer cette métrique, vous pouvez ajouter un filtre ou appliquer une division selon les dimensions suivantes : ModelDeploymentName et ModelName.
ProcessedPromptTokens Nombre Total (Somme) ApiName, , ModelDeploymentName, UsageChannelFeatureName, , RegionModelVersion PT1M Oui
Secondes API en temps réel utilisées

Nombre de secondes utilisées dans RealtimeAPI
RealtimeUsageTime Nombre Total (Somme) Region, ModelDeploymentName PT1M Oui
Jetons d’inférence traités

Nombre de tokens d’inférence traités sur un modèle OpenAI. Calculé comme des jetons d’invite (entrée) plus des jetons générés (sortie). Cela s’applique aux déploiements PTU, gérés par PTU et Pay-as-you-go. Pour décomposer cette métrique, vous pouvez ajouter un filtre ou appliquer une division selon les dimensions suivantes : ModelDeploymentName et ModelName.
TokenTransaction Nombre Total (Somme) ApiName, , ModelDeploymentName, UsageChannelFeatureName, , RegionModelVersion PT1M Oui

Catégorie : Services cognitifs - Requêtes HTTP

Unité de mesure Nom dans l’API REST Unité Aggregation Dimensions Grains de temps Exportation DS
Appels bloqués

Nombre d’appels dépassant la limite de taux ou de quota. Ne pas utiliser pour Azure OpenAI service.
BlockedCalls Nombre Total (Somme) ApiName, , OperationNameRegion, ,RatelimitKey PT1M Oui
Erreurs du client

Nombre d’appels avec erreur côté client (code de réponse HTTP 4xx). Ne pas utiliser pour Azure OpenAI service.
ClientErrors Nombre Total (Somme) ApiName, , OperationNameRegion, ,RatelimitKey PT1M Oui
Données entrantes

Taille des données entrantes en octets. Ne pas utiliser pour Azure OpenAI service.
DataIn Octets Total (Somme) ApiName, , OperationNameRegion PT1M Oui
Données sortantes

Taille des données sortantes en octets. Ne pas utiliser pour Azure OpenAI service.
DataOut Octets Total (Somme) ApiName, , OperationNameRegion PT1M Oui
Latency

Latence en millisecondes. Ne pas utiliser pour Azure OpenAI service.
Latency Millisecondes Average ApiName, , OperationNameRegion, ,RatelimitKey PT1M Oui
Limitation de débit

La limite de vitesse actuelle de la clé de limite de vitesse. Ne pas utiliser pour Azure OpenAI service.
Ratelimit Nombre Total (Somme) Region, RatelimitKey PT1M Oui
Erreurs de serveur

Nombre d’appels avec erreur interne du service (code de réponse HTTP 5xx). Ne pas utiliser pour Azure OpenAI service.
ServerErrors Nombre Total (Somme) ApiName, , OperationNameRegion, ,RatelimitKey PT1M Oui
Appels réussis

Nombre d’appels réussis. Ne pas utiliser pour Azure OpenAI service.
SuccessfulCalls Nombre Total (Somme) ApiName, , OperationNameRegion, ,RatelimitKey PT1M Oui
Nombre total d’appels

Nombre total d’appels. Ne pas utiliser pour Azure OpenAI service.
TotalCalls Nombre Total (Somme) ApiName, , OperationNameRegion, ,RatelimitKey PT1M Oui
Nombre total d’erreurs

Nombre total d’appels avec réponse d’erreur (code de réponse HTTP 4xx ou 5xx). Ne pas utiliser pour Azure OpenAI service.
TotalErrors Nombre Total (Somme) ApiName, , OperationNameRegion, ,RatelimitKey PT1M Oui
Total des appels de jetons

Nombre total d’appels de tokens.
TotalTokenCalls Nombre Total (Somme) ApiName, , OperationNameRegion PT1M Oui

Catégorie : Services cognitifs - SLI

Unité de mesure Nom dans l’API REST Unité Aggregation Dimensions Grains de temps Exportation DS
AvailabilityRate

Pourcentage de disponibilité avec le calcul suivant : (Total d’appels - Erreurs de serveur)/Total d’appels. Les erreurs serveur incluent toutes les réponses >HTTP =500. Ne pas utiliser pour Azure OpenAI service.
SuccessRate Pourcentage Minimum, maximum, moyenne ApiName, , OperationNameRegion, ,RatelimitKey PT1M Non

Catégorie : Compréhension du contenu - Utilisation

Unité de mesure Nom dans l’API REST Unité Aggregation Dimensions Grains de temps Exportation DS
Transactions par reconnaissance faciale

Nombre d’appels API effectués vers Face Service
FaceApiTransactions Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Minutes audio traitées

Minutes d’audio traitées
ProcessedAudioMinutes Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Pages traitées

Nombre de pages de documents traitées
ProcessedDocumentPages Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Images traitées

Nombre d’images traitées
ProcessedImageCount Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Minutes vidéo traitées

Minutes de vidéo traitées
ProcessedVideoMinutes Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Jetons

Nombre de jetons consommés
Tokens Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui

Catégorie : ContenuSécurité - Risques et Sécurité

Unité de mesure Nom dans l’API REST Unité Aggregation Dimensions Grains de temps Exportation DS
Nombre d’utilisateurs potentiellement abusifs

Nombre d’utilisateurs potentiellement abusifs détectés sur une période donnée. Vous pouvez ajouter un filtre ou appliquer une division selon la dimension suivante : ModelDeploymentName.
RAIAbusiveUsersCount Nombre Total (Somme) Region, ModelDeploymentName PT1M Oui
Volume nuisible détecté

Nombre d’appels effectués vers l’API OpenAI d’Azure et détectés comme nuisibles (modèle par blocs et mode annotage) par un filtre de contenu appliqué sur une période donnée. Vous pouvez ajouter un filtre ou appliquer une séparation selon les dimensions suivantes : NomModelDéploiement, NomModèleNom et Type de Texte.
RAIHarmfulRequests Nombre Total (Somme) Region, ModelDeploymentName, ModelNameModelVersion, , ApiName, TextType, Category, ,Severity PT1M Oui
Volume bloqué

Nombre d’appels effectués vers l’API OpenAI Azure et rejetés par un filtre de contenu appliqué sur une période donnée. Vous pouvez ajouter un filtre ou appliquer une séparation selon les dimensions suivantes : NomModelDéploiement, NomModèleNom et Type de Texte.
RAIRejectedRequests Nombre Total (Somme) Region, ModelDeploymentName, , ModelVersionModelName, ApiName, , TextType,Category PT1M Oui
Événement du système de sécurité

Événement système pour la surveillance des risques et de la sécurité. Vous pouvez ajouter un filtre ou appliquer une division selon la dimension suivante : EventType.
RAISystemEvent Nombre Average Region, EventType PT1M Oui
Volume total envoyé pour contrôle de sécurité

Nombre d’appels effectués vers l’API OpenAI d’Azure et détectés par un filtre de contenu appliqué sur une période donnée. Vous pouvez ajouter un filtre ou appliquer une division selon les dimensions suivantes : NomDeDéploiementModèle, NomDeModèle.
RAITotalRequests Nombre Total (Somme) Region, , ModelDeploymentNameModelName, , ModelVersionApiName PT1M Oui

Catégorie : Sécurité du contenu - Utilisation

Unité de mesure Nom dans l’API REST Unité Aggregation Dimensions Grains de temps Exportation DS
Nombre d’appels pour la modération d’images

Nombre d’appels à la modération d’images.
ContentSafetyImageAnalyzeRequestCount Nombre Total (Somme) ApiVersion PT1M Oui
Nombre d’appels pour la modération par SMS

Nombre d’appels à la modération par texto.
ContentSafetyTextAnalyzeRequestCount Nombre Total (Somme) ApiVersion PT1M Oui

Catégorie : Estimations

Unité de mesure Nom dans l’API REST Unité Aggregation Dimensions Grains de temps Exportation DS
Nombre de base des événements aléatoires

Estimation du nombre d’événements aléatoires de base.
BaselineRandomEventCount Nombre Total (Somme) Mode, RunId PT1M Oui
Récompense aléatoire de base

Estimation de la récompense aléatoire de base.
BaselineRandomReward Nombre Total (Somme) Mode, RunId PT1M Oui
Comptage des événements en ligne

Estimation du nombre d’événements en ligne.
OnlineEventCount Nombre Total (Somme) Mode, RunId PT1M Oui
Récompense en ligne

Estimation pour la récompense en ligne.
OnlineReward Nombre Total (Somme) Mode, RunId PT1M Oui
Nombre d’événements de référence utilisateur

Estimation du nombre d’événements de référence défini par l’utilisateur.
UserBaselineEventCount Nombre Total (Somme) Mode, RunId PT1M Oui
Récompense de base utilisateur

Estimation de la récompense de référence définie par l’utilisateur.
UserBaselineReward Nombre Total (Somme) Mode, RunId PT1M Oui

Catégorie : Occurrences de caractéristiques

Unité de mesure Nom dans l’API REST Unité Aggregation Dimensions Grains de temps Exportation DS
Occurrences des longs métrages d’action

Nombre de fois où chaque action apparaît.
ActionFeatureIdOccurrences Nombre Total (Somme) FeatureId, , ModeRunId PT1M Oui
Occurrences de caractéristiques contextuelles

Le nombre de fois où chaque élément de contexte apparaît.
ContextFeatureIdOccurrences Nombre Total (Somme) FeatureId, , ModeRunId PT1M Oui
Occurrences des caractéristiques des machines à sous

Nombre de fois où chaque fonction de machine à sous apparaît.
SlotFeatureIdOccurrences Nombre Total (Somme) FeatureId, , ModeRunId PT1M Oui

Catégorie : FeatureCardinality

Unité de mesure Nom dans l’API REST Unité Aggregation Dimensions Grains de temps Exportation DS
Cardinalité des caractéristiques par action

Cardinalité des caractéristiques basée sur l’action.
FeatureCardinality_Action Nombre Average FeatureId, , ModeRunId PT1M Oui
Cardinalité des caractéristiques selon le contexte

Cardinalité des caractéristiques basée sur le contexte.
FeatureCardinality_Context Nombre Average FeatureId, , ModeRunId PT1M Oui
Cardinalité des caractéristiques par emplacement

Cardinalité des caractéristiques basée sur l’emplacement.
FeatureCardinality_Slot Nombre Average FeatureId, , ModeRunId PT1M Oui

Catégorie : Fonctionnalités par événement

Unité de mesure Nom dans l’API REST Unité Aggregation Dimensions Grains de temps Exportation DS
Fonctionnalités d’action par événement

Nombre moyen de longs métrages d’action par événement.
ActionFeaturesPerEvent Nombre Average Mode, RunId PT1M Oui
Caractéristiques contextuelles par événement

Nombre de caractéristiques contextuelles par événement.
ContextFeaturesPerEvent Nombre Average Mode, RunId PT1M Oui
Caractéristiques des machines à sous par événement

Nombre moyen de fonctionnalités de machines à sous par événement.
SlotFeaturesPerEvent Nombre Average Mode, RunId PT1M Oui

Catégorie : Langue - Emplois

Unité de mesure Nom dans l’API REST Unité Aggregation Dimensions Grains de temps Exportation DS
Durée du poste (Aperçu)

Note : cette valeur dépend fortement de la taille de l’entrée, du nombre de documents et de la complexité de la tâche. C’est une valeur agrégée pour toutes les tâches du poste.
JobDuration Millisecondes Minimum, maximum, moyenne JobStatus, JobType PT1M Oui

Catégorie : Modèles - Requêtes HTTP

Unité de mesure Nom dans l’API REST Unité Aggregation Dimensions Grains de temps Exportation DS
Taux de disponibilité des modèles

Pourcentage de disponibilité avec le calcul suivant : (Total d’appels - Erreurs de serveur)/Total d’appels. Les erreurs serveur incluent toutes les réponses >HTTP =500.
ModelAvailabilityRate Pourcentage Minimum, maximum, moyenne Region, , ModelDeploymentNameModelName, ,ModelVersion PT1M Non
Demandes de modèle

Nombre d’appels effectués vers l’API du modèle sur une période donnée. Cela s’applique aux déploiements PTU, PTU-Managed et Pay-as-you-go.
ModelRequests Nombre Total (Somme) ApiName, , OperationName, , RegionStreamTypeModelDeploymentNameModelNameModelVersionStatusCodeIsSpilloverServiceTierRequestServiceTierResponse PT1M Oui

Catégorie : Modèles - Latence

Unité de mesure Nom dans l’API REST Unité Aggregation Dimensions Grains de temps Exportation DS
Temps entre les jetons

Taux de génération de jetons modèles, mesuré en millisecondes. Cela s’applique aux déploiements gérés par PTU et PTU. Pour les requêtes non streamantes, cette valeur est une estimation.
NormalizedTimeBetweenTokens Millisecondes Maximum, minimum, moyenne ApiName, OperationName, , StreamTypeRegion, ModelDeploymentName, , ModelName,ModelVersion PT1M Oui
Temps normalisé jusqu’au premier octet

Le temps nécessaire pour que le premier octet de données de réponse soit reçu après que la requête a été effectuée par le modèle, normalisée par le jeton. Cela s’applique aux déploiements PTU, gérés par PTU et Pay-as-you-go. Pour les requêtes non streamantes, cette valeur est une estimation.
NormalizedTimeToFirstToken Millisecondes Maximum, minimum, moyenne ApiName, OperationName, , StreamTypeRegion, ModelDeploymentName, , ModelName,ModelVersion PT1M Oui
Temps pour le dernier octet

Le temps nécessaire pour que le dernier octet des données de réponse soit reçu après que la requête a été effectuée par le modèle. Cela s’applique aux déploiements PTU, gérés par PTU et Pay-as-you-go. Pour les requêtes non streamantes, cette valeur est une estimation.
TimeToLastByte Millisecondes Maximum, minimum, moyenne ApiName, OperationName, , StreamTypeRegion, ModelDeploymentName, , ModelName,ModelVersion PT1M Oui
Temps d’intervenir

Mesure recommandée de latence (réactivité). Cela s’applique aux déploiements gérés par PTU et PTU. Calculé comme le temps nécessaire pour que la première réponse apparaisse après qu’un utilisateur ait envoyé une invite, mesuré par la passerelle API. Ce chiffre augmente à mesure que la taille de la demande augmente et/ou que la taille des coups de cache diminue. Pour décomposer la métrique de temps de réponse, vous pouvez ajouter un filtre ou appliquer une séparation selon les dimensions suivantes : NomDeDéplayement, NomDeModèle, et VersionModèle.

Note : cette métrique est une approximation, car la latence mesurée dépend fortement de plusieurs facteurs, y compris les appels simultanés et le schéma global de charge de travail. De plus, il ne prend pas en compte toute latence côté client qui pourrait exister entre votre client et le point de terminaison de l’API. Pour les requêtes non streamantes, cette valeur est une estimation. Veuillez consulter votre propre journal pour un suivi optimal de la latence.
TimeToResponse Millisecondes Minimum, maximum, moyenne ApiName, OperationName, RegionStreamType, , ModelDeploymentName, ModelName, ModelVersion, ,StatusCode PT1M Oui
Jetons par seconde

Énumère la vitesse de génération pour une réponse donnée du modèle. Le total des jetons générés est divisé par le temps nécessaire à la génération des jetons, en secondes. Cela s’applique aux déploiements gérés par PTU et PTU. Pour les requêtes non streamantes, cette valeur est une estimation.
TokensPerSecond Nombre Maximum, minimum, moyenne ApiName, OperationName, , StreamTypeRegion, ModelDeploymentName, , ModelName,ModelVersion PT1M Oui

Catégorie : Modèles - Utilisation

Unité de mesure Nom dans l’API REST Unité Aggregation Dimensions Grains de temps Exportation DS
Pages annotées

Nombre total de pages traitées avec annotations. Cela s’applique aux déploiements PTU, PTU-Managed et Pay-as-you-go.
AnnotatedPages Nombre Total (Somme) ApiName, , RegionModelDeploymentName, , ModelNameModelVersion PT1M Oui
Jetons d’entrée audio

Nombre de jetons d’invite audio traités (entrées) sur un modèle OpenAI. S’applique aux déploiements de modèles gérés par PTU.
AudioInputTokens Nombre Total (Somme) ModelDeploymentName, , ModelNameModelVersion, ,Region PT1M Oui
Jetons de sortie audio

Nombre de jetons d’invite audio générés (sortie) sur un modèle OpenAI. S’applique aux déploiements de modèles gérés par PTU.
AudioOutputTokens Nombre Total (Somme) ModelDeploymentName, , ModelNameModelVersion, ,Region PT1M Oui
Jetons d’invite lus depuis le cache

Nombre total de jetons lus depuis le cache. Cela s’applique aux déploiements de modèles Anthropic. Apparu dans la section d’utilisation des réponses comme cache_read_input_tokens
cacheReadInputTokens Nombre Total (Somme) ApiName, , Region, ModelNameModelDeploymentName, , ModelVersionContextLength PT1M Oui
Jetons d’invite écrits en cache (TTL de 1 heure)

Le nombre de jetons de prompt utilisés pour créer l’entrée d’une heure. Cela s’applique aux déploiements de modèles Anthropic. Apparu dans la section d’utilisation des réponses comme cache_creation.ephemeral_1h_input_tokens
ephemeral1hInputTokens Nombre Total (Somme) ApiName, , Region, ModelNameModelDeploymentName, , ModelVersionContextLength PT1M Oui
Jetons d’invite écrits en cache (TTL de 5 minutes)

Le nombre de jetons d’invite utilisés pour créer l’entrée de cache en 5 minutes. Cela s’applique aux déploiements de modèles Anthropic. Apparu dans la section d’utilisation des réponses comme cache_creation.ephemeral_5m_input_tokens
ephemeral5mInputTokens Nombre Total (Somme) ApiName, , Region, ModelNameModelDeploymentName, , ModelVersionContextLength PT1M Oui
Images générées

Nombre total d’images générées. Cela s’applique aux déploiements PTU, PTU-Managed et Pay-as-you-go.
GeneratedImages Nombre Total (Somme) ApiName, , RegionModelDeploymentName, , ModelNameModelVersion PT1M Oui
Jetons d’entrée

Nombre de jetons d’invite traités (entrées) sur un modèle. Cela s’applique aux déploiements PTU, PTU-Managed et Pay-as-you-go.
InputTokens Nombre Total (Somme) ApiName, , RegionModelDeploymentName, , ModelNameModelVersion PT1M Oui
Jetons de sortie

Nombre de jetons générés (sortie) à partir d’un modèle OpenAI. Cela s’applique aux déploiements PTU, PTU-Managed et Pay-as-you-go.
OutputTokens Nombre Total (Somme) ApiName, , RegionModelDeploymentName, , ModelNameModelVersion PT1M Oui
Utilisation provisionnée

L’utilisation % pour un déploiement géré sous provision, calculé comme (PTU consommées / PTU déployées) x 100. Lorsque l’utilisation est supérieure ou égale à 100%, les appels sont limités et le code d’erreur 429 est renvoyé.
ProvisionedUtilization Pourcentage Minimum, maximum, moyenne Region, , ModelDeploymentNameModelName, ,ModelVersion PT1M Non
Total Pages

Nombre total de pages traitées. Cela s’applique aux déploiements PTU, PTU-Managed et Pay-as-you-go.
TotalPages Nombre Total (Somme) ApiName, , RegionModelDeploymentName, , ModelNameModelVersion PT1M Oui
Nombre total de jetons

Nombre de jetons d’inférence traités sur un modèle. Calculé comme des jetons d’invite (entrée) plus des jetons générés (sortie). Cela s’applique aux déploiements PTU, PTU-Managed et Pay-as-you-go.
TotalTokens Nombre Total (Somme) ApiName, , RegionModelDeploymentName, , ModelNameModelVersion PT1M Oui

Catégorie : Espaces de noms par événement

Unité de mesure Nom dans l’API REST Unité Aggregation Dimensions Grains de temps Exportation DS
Espaces de noms d’actions par événement

Nombre moyen d’espaces de noms d’actions par événement.
ActionNamespacesPerEvent Nombre Average Mode, RunId PT1M Oui
Espaces de noms contextuels par événement

Nombre d’espaces de noms contextuels par événement.
ContextNamespacesPerEvent Nombre Average Mode, RunId PT1M Oui
Espaces de noms de machines à sous par événement

Nombre moyen d’espaces de noms de machines à sous par événement.
SlotNamespacesPerEvent Nombre Average Mode, RunId PT1M Oui

Catégorie : Récompenses

Unité de mesure Nom dans l’API REST Unité Aggregation Dimensions Grains de temps Exportation DS
Récompense moyenne par événement

Récompense moyenne par événement.
Reward Nombre Average BaselineAction, , ChosenActionId, NonDefaultRewardMatchesBaseline, , ModeRunId PT1M Oui
Récompense de la machine à sous

Récompense par emplacement.
SlotReward Nombre Average BaselineActionId, ChosenActionId, MatchesBaselineNonDefaultReward, , SlotId, SlotIndex, Mode, ,RunId PT1M Oui

Catégorie : Machines à sous

Unité de mesure Nom dans l’API REST Unité Aggregation Dimensions Grains de temps Exportation DS
Récompense globale par estimateur de référence

Estimateur de référence : récompense globale.
BaselineEstimatorOverallReward Nombre Average Mode, RunId PT1M Oui
Récompense de slot estimatrice de référence

Estimateur de base : récompense par emplacement.
BaselineEstimatorSlotReward Nombre Average SlotId, , SlotIndexMode, ,RunId PT1M Oui
Estimateur aléatoire de référence : Récompense globale

Récompense globale par estimateur aléatoire de base.
BaselineRandomEstimatorOverallReward Nombre Average Mode, RunId PT1M Oui
Récompense de base pour l’emplacement d’estimateur aléatoire

Estimateur aléatoire de base : récompense par emplacement.
BaselineRandomEstimatorSlotReward Nombre Average SlotId, , SlotIndexMode, ,RunId PT1M Oui
Slots

Nombre de places par événement.
NumberOfSlots Nombre Average Mode, RunId PT1M Oui
Estimateur en ligne Récompense globale

Estimateur en ligne Récompense globale.
OnlineEstimatorOverallReward Nombre Average Mode, RunId PT1M Oui
Récompense de machine à sous estimatrice en ligne

Estimateur en ligne Récompense par fente.
OnlineEstimatorSlotReward Nombre Average SlotId, , SlotIndexMode, ,RunId PT1M Oui
Occurrences d’emplacement

Le nombre de fois où chaque emplacement apparaît.
SlotIdOccurrences Nombre Total (Somme) SlotId, , SlotIndexMode, ,RunId PT1M Oui

Catégorie : Services de parole - Utilisation

Unité de mesure Nom dans l’API REST Unité Aggregation Dimensions Grains de temps Exportation DS
Secondes audio transcrites en lot

Nombre de secondes transcrites par lot
AudioSecondsBatchTranscribed Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Secondes audio Chuchotement en lot transcrit

Nombre de secondes du chuchotement du lot transcrit
AudioSecondsBatchWhisperTranscribed Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Secondes audio transcrites rapidement

Nombre rapide de secondes transcrites
AudioSecondsFastTranscribed Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Secondes audio Rapide Chuchotement transcrit

Nombre de secondes rapidement en chuchotement transcrit
AudioSecondsFastWhisperTranscribed Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Secondes audio transcrites

Nombre de secondes transcrites
AudioSecondsTranscribed Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Secondes audio traduites

Nombre de secondes traduites
AudioSecondsTranslated Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Durée d'hébergement en secondes du modèle d'avatar

Nombre de secondes.
AvatarModelHostingSeconds Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Secondes d’entraînement du modèle d’avatar

Nombre de secondes.
AvatarModelTrainingSeconds Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Nombre de profils d’intervenants

Nombre de profils d’intervenants inscrits. Au prorata horaire.
NumberofSpeakerProfiles Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Transactions de reconnaissance des haut-parleurs

Nombre de transactions de reconnaissance des haut-parleurs
SpeakerRecognitionTransactions Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Heures d’animation du modèle de discours

Nombre d’heures d’animation du modèle de discours
SpeechModelHostingHours Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Caractères synthétisés

Nombre de personnages.
SynthesizedCharacters Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Secondes vidéo synthétisées

Nombre de secondes synthétisées
VideoSecondsSynthesized Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Jetons d’entrée audio en direct pour voix

Nombre de jetons d’entrée audio, hors jetons mis en cache.
VoiceLiveAudioInputTokens Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Jetons de sortie audio en direct pour voix

Nombre de jetons de sortie audio.
VoiceLiveAudioOutputTokens Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Jetons d’entrée audio en cache en direct pour voix

Nombre de jetons d’entrée audio mis en cache.
VoiceLiveCachedAudioInputTokens Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Jetons d’entrée de texte en cache Voice Live

Nombre de jetons d’entrée texte mis en cache.
VoiceLiveCachedTextInputTokens Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Jetons d’entrée de texte en direct pour voix

Nombre de jetons d’entrée texte, hors jetons mis en cache.
VoiceLiveTextInputTokens Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Jetons de sortie texte en direct pour voix

Nombre de jetons de sortie texte.
VoiceLiveTextOutputTokens Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Heures d’animation des modèles vocaux

Nombre d’heures.
VoiceModelHostingHours Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Minutes d’entraînement des modèles vocaux

Nombre de minutes.
VoiceModelTrainingMinutes Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui

Catégorie : Services de retraduction - Utilisation

Unité de mesure Nom dans l’API REST Unité Aggregation Dimensions Grains de temps Exportation DS
Personnages entraînés (dépréciés)

Nombre total de personnages entraînés.
CharactersTrained Nombre Total (Somme) ApiName, , OperationNameRegion PT1M Oui
Personnages traduits (dépréciés)

Nombre total de caractères dans les demandes de texte entrantes.
CharactersTranslated Nombre Total (Somme) ApiName, , OperationNameRegion PT1M Oui
Caractères du document traduits

Nombre de caractères dans la demande de traduction du document.
DocumentCharactersTranslated Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Caractères personnalisés du document traduits

Nombre de caractères dans la demande de traduction personnalisée d’un document.
DocumentCustomCharactersTranslated Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Caractères de synchronisation de documents traduits

Nombre de caractères dans la requête de traduction de document (synchrone).
OneDocumentCharactersTranslated Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Synchronisation de documents Caractères personnalisés traduits

Nombre de caractères dans la demande de traduction de document personnalisé (synchrone).
OneDocumentCustomCharactersTranslated Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Caractères de texte traduits

Nombre de caractères dans la demande de traduction de texte entrante.
TextCharactersTranslated Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Caractères personnalisés du texte traduits

Nombre de caractères dans la demande de traduction de texte personnalisée entrante.
TextCustomCharactersTranslated Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Caractères entraînés au texte

Nombre de caractères entraînés par traduction de texte.
TextTrainedCharacters Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Traducteur Pro Application Seconds

Nombre de secondes d’utilisation de l’application Translator Pro.
TranslatorProAppSeconds Secondes Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui

Catégorie : Utilisation

Unité de mesure Nom dans l’API REST Unité Aggregation Dimensions Grains de temps Exportation DS
Nombre d’inférences

Comte d’inférence du service Carnegie Frontdoor
CarnegieInferenceCount Nombre Total (Somme) Region, , Modality, LanguageCategory, , SeverityLevelUseCustomList PT1M Oui
Transactions de vision informatique

Nombre de transactions Vision par ordinateur
ComputerVisionTransactions Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Temps d’entraînement visuel personnalisé

Temps d’entraînement Custom Vision
CustomVisionTrainingTime Secondes Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Transactions Vision personnalisées

Nombre de transactions de prédiction Custom Vision
CustomVisionTransactions Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Images faciales entraînées

Nombre d’images entraînées. 1 000 images entraînées par transaction.
FaceImagesTrained Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Visages enregistrés

Nombre de visages enregistrés, prorata quotidiennement. Le nombre de visages stockés est rapporté quotidiennement.
FacesStored Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Transactions par reconnaissance faciale

Nombre d’appels API effectués vers Face Service
FaceTransactions Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Images stockées

Nombre d’images Custom Vision stockées.
ImagesStored Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Événements détectés

Nombre d’événements appris.
LearnedEvents Nombre Total (Somme) IsMatchBaseline, , ModeRunId PT1M Oui
Demandes de discours LUIS

Nombre de demandes de compréhension LUIS de la parole à intention
LUISSpeechRequests Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Requêtes textuelles LUIS

Nombre de requêtes textuelles LUIS
LUISTextRequests Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Récompenses mises en correspondance

Nombre de récompenses correspondantes.
MatchedRewards Nombre Total (Somme) Mode, RunId PT1M Oui
Événements non activés

Nombre d’épreuves sautées.
NonActivatedEvents Nombre Total (Somme) Mode, RunId PT1M Oui
Récompenses observées

Nombre de récompenses observées.
ObservedRewards Nombre Total (Somme) Mode, RunId PT1M Oui
Caractères traités

Nombre de caractères traités par Immersive Reader.
ProcessedCharacters Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Dossiers textuels de santé traités

Nombre de dossiers textes médicaux traités
ProcessedHealthTextRecords Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Images traitées

Nombre d’images traitées
ProcessedImages Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Pages traitées

Nombre de pages traitées
ProcessedPages Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Enregistrements textuels traités

Compte des enregistrements textuels.
ProcessedTextRecords Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Enregistrements textuels QA

Nombre d’enregistrements textuels traités
QuestionAnsweringTextRecords Nombre Total (Somme) ApiName, , FeatureNameUsageChannel, ,Region PT1M Oui
Durée de la séance de discours (dépréciée)

Durée totale de la séance de parole en quelques secondes.
SpeechSessionDuration Secondes Total (Somme) ApiName, , OperationNameRegion PT1M Oui
Nombre total d'événements

Nombre d’événements.
TotalEvents Nombre Total (Somme) Mode, RunId PT1M Oui
Total des transactions (dépréciées)

Nombre total de transactions.
TotalTransactions Nombre Total (Somme) <aucun> PT1M Oui

Dimensions métriques

Pour des informations sur ce que sont les dimensions métriques, voir Métriques multidimensionnelles.

Ce service comporte les dimensions suivantes associées à ses métriques.

  • ApiName
  • Nom de fonctionnalité
  • ModelDeploymentName
  • ModelName
  • ModelVersion
  • Nom de l'Opération
  • Région
  • StatusCode
  • StreamType
  • UsageChannel

Journaux des ressources

Cette section liste les types de journaux de ressources que vous pouvez collecter pour ce service. Cette section puise dans la liste des types de catégories de journaux de ressources tous supportés dans Azure Monitor.

Journaux de ressources pris en charge pour Microsoft. Services/comptes cognitifs

Catégorie Catégorie nom d’affichage Table de logs Prend en charge, le plan de journalisation de base Prend en charge la transformation du temps d’ingestion Exemples de requêtes Coûts d’exportation
Audit Journaux d’audit AzureDiagnostics

Journaux provenant de plusieurs ressources Azure.

Non Non Non
AzureOpenAIRequestUsage Utilisation des requêtes Azure OpenAI AzureDiagnostics

Journaux provenant de plusieurs ressources Azure.

Non Non Oui
RequestResponse Journaux de requêtes et de réponses AzureDiagnostics

Journaux provenant de plusieurs ressources Azure.

Non Non Non
Trace Journaux de suivi AzureDiagnostics

Journaux provenant de plusieurs ressources Azure.

Non Non Non

Tables Azure Monitor Logs

Cette section liste les tables Azure Monitor Logs pertinentes pour ce service, qui sont disponibles pour requête par Log Analytics via les requêtes Kusto. Les tables contiennent des données de journal de ressources et peut-être plus encore selon ce qui y est collecté et acheminé.

Azure OpenAI microsoft.cognitiveservices/accounts

Journal d’activité

Le tableau lié liste les opérations pouvant être enregistrées dans le journal d’activité de ce service. Ces opérations constituent un sous-ensemble de toutes les opérations possibles du fournisseur de ressources dans le journal d’activité.

Pour plus d’informations sur le schéma des entrées du journal d’activité, voir Schéma du journal d’activité.