Remarque
L’accès à cette page requiert une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page requiert une autorisation. Vous pouvez essayer de modifier des répertoires.
Affichage actuel :Version du portail - Passer à la version du nouveau portail Foundry
Cet article contient toutes les informations de référence de surveillance pour ce service.
Consultez Monitor Azure OpenAI pour plus d’informations sur les données que vous pouvez collecter pour Azure OpenAI dans Microsoft Modèles Foundry et comment l’utiliser.
Metrics
Cette section répertorie toutes les métriques de plateforme collectées automatiquement pour App Service. Ces métriques font également partie de la liste globale des métriques de plateforme alles prises en charge dans Azure Monitor.
Pour plus d’informations sur la rétention des métriques, consultez Azure Monitor Vue d’ensemble des métriques.
Métriques prises en charge pour Microsoft. CognitiveServices/comptes
Voici les métriques les plus importantes que nous pensons que vous devez surveiller pour Azure OpenAI. Plus loin dans cet article est une liste plus longue de toutes les métriques disponibles pour cet espace de noms, qui contient plus de détails sur les métriques de cette liste plus courte. Consultez la liste ci-dessous pour obtenir la plupart des informations à jour. Nous travaillons à actualiser les tableaux dans les sections suivantes.
- Azure demandes OpenAI
- Jetons actifs
- Jetons d’achèvement générés
- Heures de formation FineTuned traitées
- Jetons d’inférence traités
- Jetons d’invite traités
- Utilisation managée provisionnée V2
- Taux de correspondance du cache du jeton d’invite
- Temps de réponse
- Durée entre les jetons
- Durée de la dernière octet
- Temps normalisé pour le premier octet
- Jetons par seconde
Vous pouvez également surveiller les métriques content Safety utilisées par d’autres services associés.
- Volume bloqué
- Volume dangereux détecté
- Nombre potentiel d’utilisateurs abusifs
- Événement du système de sécurité
- Volume total envoyé pour vérification de sécurité
Note
La métrique d’utilisation gérée par l’approvisionnement est désormais déconseillée et n’est plus recommandée. Cette métrique a été remplacée par la métrique d’utilisation managée provisionnée V2. Les jetons par seconde, temps de réponse, temps entre jetons ne sont actuellement pas disponibles pour les déploiements Standard.
Les métriques Cognitive Services ont la catégorie Cognitive Services - Requêtes HTTP dans le tableau suivant. Ces métriques sont des métriques héritées communes à toutes les ressources de ce type. Microsoft ne vous recommande plus d’utiliser ces métriques avec Azure OpenAI.
Le tableau suivant répertorie les métriques disponibles pour la Microsoft. Type de ressource CognitiveServices/accounts.
- Toutes les colonnes peuvent ne pas être présentes dans chaque table.
- Certaines colonnes peuvent dépasser la zone d’affichage de la page. Sélectionnez Développer la table pour afficher toutes les colonnes disponibles.
En-têtes de tableau
- Catégorie : le groupe de métriques ou classification.
- Metric : nom complet de la métrique tel qu’il apparaît dans le portail Azure.
- Name dans l’API REST : nom de métrique appelé dans l’API REST.
- Unité : unité de mesure.
- Aggregation : type aggregation par défaut. Valeurs valides : Moyen (moy), Minimum (min), Maximum (max), Total (somme), Nombre.
- Dimensions - Dimensions disponible pour la métrique.
-
Time Grains - Intervals auquel la métrique est échantillonnée. Par exemple,
PT1Mindique que la métrique est échantillonnée toutes les minutes,PT30Mtoutes les 30 minutes,PT1Htoutes les heures, et ainsi de suite. - DS Export : indique si la métrique est exportable vers Azure Monitor Journaux via les paramètres de diagnostic. Pour plus d’informations sur l’exportation de métriques, consultez Créer les paramètres de diagnostic dans Azure Monitor.
Catégorie : Actions
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Taille | Fragments de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Occurences de l’action Nombre de fois où chaque action apparaît. |
ActionIdOccurrences |
Nombre | Total (Somme) |
ActionId, , ModeRunId |
PT1M | Oui |
|
Actions par événement Nombre d’actions par événement. |
ActionsPerEvent |
Nombre | Moyen |
Mode, RunId |
PT1M | Oui |
Catégorie : Azure OpenAI - Requêtes HTTP
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Taille | Fragments de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Azure OpenAI AvailabilityRate Pourcentage de disponibilité avec le calcul suivant : (Nombre total d’appels - Erreurs de serveur)/Nombre total d’appels. Les erreurs de serveur incluent les réponses HTTP >=500. |
AzureOpenAIAvailabilityRate |
Pourcentage | Minimum, Maximum, Moyenne |
ApiName, OperationName, , RegionStreamType, ModelDeploymentName, , ModelName,ModelVersion |
PT1M | Non |
|
Azure demandes OpenAI Nombre d’appels effectués à l’API OpenAI Azure sur une période donnée. S’applique aux déploiements PTU, managés par PTU, et avec paiement à l’utilisation. Pour décomposer les demandes d’API, vous pouvez ajouter un filtre ou appliquer un fractionnement en fonction des dimensions suivantes : ModelDeploymentName, ModelVersion, StatusCode (réussite, clienterrors, erreurs de serveur), IsSpillover pour les informations de basculement, ServiceTier, StreamType (streaming et demandes de non diffusion en continu) et opération. |
AzureOpenAIRequests |
Nombre | Total (Somme) |
ApiName, , OperationName, , RegionStreamTypeModelDeploymentNameModelNameModelVersionStatusCodeIsSpilloverServiceTierRequestServiceTierResponse |
PT1M | Oui |
Catégorie : Azure OpenAI - Latence
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Taille | Fragments de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Intervalle entre les tokens Pour les demandes de streaming, il s’agit du taux de génération de jetons du modèle, mesuré en millisecondes. S’applique aux déploiements PTU, managés par PTU, et avec paiement à l’utilisation. |
AzureOpenAINormalizedTBTInMS |
Millisecondes | Maximum, Minimum, Moyenne |
Region, , ModelDeploymentNameModelName, ,ModelVersion |
PT1M | Oui |
|
Temps normalisé pour le premier octet Pour les demandes de streaming et non-streaming, il s’agit du temps nécessaire pour que le premier octet des données de réponse soit reçu après la réception de la demande par modèle, normalisé par jeton. S’applique aux déploiements PTU, managés par PTU, et avec paiement à l’utilisation. |
AzureOpenAINormalizedTTFTInMS |
Millisecondes | Maximum, Minimum, Moyenne |
Region, , ModelDeploymentNameModelName, ,ModelVersion |
PT1M | Oui |
|
Temps de réponse Mesure de latence recommandée (réactivité) pour les requêtes de diffusion en continu. S’applique aux déploiements PTU, managés par PTU, et avec paiement à l’utilisation. Calculé comme temps nécessaire pour que la première réponse apparaisse après qu’un utilisateur envoie une invite, comme mesuré par la passerelle API. Ce nombre augmente à mesure que la taille de la requête augmente et/ou que le nombre de consultations du cache diminue. Pour répartir le temps de réponse, vous pouvez ajouter un filtre ou appliquer un fractionnement en fonction des dimensions suivantes : ModelDeploymentName, ModelName et ModelVersion. Remarque : cette métrique est une approximation, car la latence mesurée dépend fortement de plusieurs facteurs, notamment les appels simultanés et le modèle de charge de travail global. En outre, elle ne tient pas compte d’une latence côté client qui peut exister entre votre client et le point de terminaison de l’API. Reportez-vous à votre propre journalisation pour un suivi de latence optimal. |
AzureOpenAITimeToResponse |
Millisecondes | Minimum, Maximum, Moyenne |
ApiName, OperationName, , RegionStreamType, ModelDeploymentName, ModelName, , ModelVersion,StatusCode |
PT1M | Oui |
|
Jetons par seconde Énumère la vitesse de génération d’une réponse de modèle OpenAI donnée Azure. Le nombre total de jetons générés est divisé par le temps nécessaire pour générer les jetons, en secondes. S’applique aux déploiements PTU, managés par PTU, et avec paiement à l’utilisation. |
AzureOpenAITokenPerSecond |
Nombre | Maximum, Minimum, Moyenne |
Region, , ModelDeploymentNameModelName, ,ModelVersion |
PT1M | Oui |
|
Durée de la dernière octet Pour les demandes de diffusion en continu et de non-diffusion en continu ; temps nécessaire pour que le dernier octet des données de réponse soit reçu une fois la demande effectuée par modèle. S’applique aux déploiements PTU, managés par PTU, et avec paiement à l’utilisation. |
AzureOpenAITTLTInMS |
Millisecondes | Maximum, Minimum, Moyenne |
Region, , ModelDeploymentNameModelName, ,ModelVersion |
PT1M | Oui |
Catégorie : Azure OpenAI - Utilisation
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Taille | Fragments de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Jetons actifs Nombre total de jetons moins les jetons mis en cache sur une période donnée. S’applique aux PTU et aux déploiements gérés par le PTU. Utilisez cette métrique pour comprendre votre utilisation basée sur TPS ou TPM pour les PTU et la comparer à vos benchmarks pour le TPM ou TPS cible pour vos scénarios. Pour décomposer les demandes d’API, vous pouvez ajouter un filtre ou appliquer un fractionnement en fonction des dimensions suivantes : ModelDeploymentName, ModelName et ModelVersion. |
ActiveTokens |
Nombre | Minimum, Maximum, Moyenne, Total (Somme) |
Region, , ModelDeploymentNameModelName, ,ModelVersion |
PT1M | Oui |
|
Jetons d’achèvement audio Nombre de jetons d’invite audio générés (sortie) sur un modèle OpenAI. S’applique aux modèles déploiements gérés par PTU et de paiement à l’utilisation. |
AudioCompletionTokens |
Nombre | Total (Somme) |
ModelDeploymentName, , ModelNameModelVersion, ,Region |
PT1M | Oui |
|
Jetons de message vocal audio Nombre de jetons d’invite audio traités (entrée) sur un modèle OpenAI. S’applique aux modèles déploiements gérés par PTU et de paiement à l’utilisation. |
AudioPromptTokens |
Nombre | Total (Somme) |
ModelDeploymentName, , ModelNameModelVersion, ,Region |
PT1M | Oui |
|
Taux de correspondance du cache du jeton d’invite Pourcentage de jetons d’invite qui atteignent le cache. S’applique aux PTU et aux déploiements gérés par le PTU. |
AzureOpenAIContextTokensCacheMatchRate |
Pourcentage | Minimum, Maximum, Moyenne |
Region, , ModelDeploymentNameModelName, ,ModelVersion |
PT1M | Non |
|
Utilisation managée provisionnée (déconseillée) % d’utilisation pour un déploiement géré de manière provisionnée, calculé comme (PTUs consommés / PTUs déployés) x 100. Lorsque l’utilisation est supérieure ou égale à 100 %, les appels sont limités et le code d’erreur 429 est retourné. Pour décomposer cette métrique, vous pouvez ajouter un filtre ou appliquer un fractionnement en fonction des dimensions suivantes : ModelDeploymentName, ModelName, ModelVersion et StreamType (requêtes en streaming et non streaming) |
AzureOpenAIProvisionedManagedUtilization |
Pourcentage | Minimum, Maximum, Moyenne |
Region, StreamType, , ModelDeploymentName, ModelName, ModelVersion |
PT1M | Non |
|
Utilisation managée provisionnée V2 % d’utilisation pour un déploiement géré de manière provisionnée, calculé comme (PTUs consommés / PTUs déployés) x 100. Lorsque l’utilisation est supérieure ou égale à 100 %, les appels sont limités et le code d’erreur 429 est retourné. Pour décomposer cette métrique, vous pouvez ajouter un filtre ou appliquer un fractionnement en fonction des dimensions suivantes : ModelDeploymentName, ModelName, ModelVersion et StreamType (requêtes en streaming et non streaming) |
AzureOpenAIProvisionedManagedUtilizationV2 |
Pourcentage | Minimum, Maximum, Moyenne |
Region, StreamType, , ModelDeploymentName, ModelName, ModelVersion |
PT1M | Non |
|
Heures de formation traitées et affinées Nombre d’heures de formation traitées sur un modèle FineTuned OpenAI |
FineTunedTrainingHours |
Nombre | Total (Somme) |
ApiName, ModelDeploymentName, , FeatureName, UsageChannel, Region |
PT1M | Oui |
|
Jetons d’achèvement générés Nombre de jetons générés (sortie) à partir d’un modèle OpenAI. S’applique aux déploiements PTU, managés par PTU, et avec paiement à l’utilisation. Pour décomposer cette métrique, vous pouvez ajouter un filtre ou appliquer un fractionnement en fonction des dimensions suivantes : ModelDeploymentName et ModelName. |
GeneratedTokens |
Nombre | Total (Somme) |
ApiName, , ModelDeploymentName, FeatureNameUsageChannel, , RegionModelVersion |
PT1M | Oui |
|
Jetons d’invite traités Nombre de jetons de requêtes traités (entrée) sur un modèle OpenAI. S’applique aux déploiements PTU, managés par PTU, et avec paiement à l’utilisation. Pour décomposer cette métrique, vous pouvez ajouter un filtre ou appliquer un fractionnement en fonction des dimensions suivantes : ModelDeploymentName et ModelName. |
ProcessedPromptTokens |
Nombre | Total (Somme) |
ApiName, , ModelDeploymentName, FeatureNameUsageChannel, , RegionModelVersion |
PT1M | Oui |
|
Secondes de l’API en temps réel utilisées Nombre d’API en temps réel utilisé |
RealtimeUsageTime |
Nombre | Total (Somme) |
Region, ModelDeploymentName |
PT1M | Oui |
|
Jetons d’inférence traités Nombre de jetons d’inférence traités sur un modèle OpenAI. Calculé en tant que jetons d’invite (entrée) plus jetons générés (sortie). S’applique aux déploiements PTU, managés par PTU, et avec paiement à l’utilisation. Pour décomposer cette métrique, vous pouvez ajouter un filtre ou appliquer un fractionnement en fonction des dimensions suivantes : ModelDeploymentName et ModelName. |
TokenTransaction |
Nombre | Total (Somme) |
ApiName, , ModelDeploymentName, FeatureNameUsageChannel, , RegionModelVersion |
PT1M | Oui |
Catégorie : Cognitive Services - Requêtes HTTP
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Taille | Fragments de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Appels bloqués Nombre d’appels ayant dépassé la limite de débit ou de quota. N’utilisez pas Azure service OpenAI. |
BlockedCalls |
Nombre | Total (Somme) |
ApiName, , OperationNameRegion, ,RatelimitKey |
PT1M | Oui |
|
Erreurs du client Nombre d’appels avec erreur côté client (code de réponse HTTP : 4xx). N’utilisez pas Azure service OpenAI. |
ClientErrors |
Nombre | Total (Somme) |
ApiName, , OperationNameRegion, ,RatelimitKey |
PT1M | Oui |
|
Données entrantes Taille des données entrantes en octets. N’utilisez pas Azure service OpenAI. |
DataIn |
Octets | Total (Somme) |
ApiName, , OperationNameRegion |
PT1M | Oui |
|
Données sortantes Taille des données sortantes en octets. N’utilisez pas Azure service OpenAI. |
DataOut |
Octets | Total (Somme) |
ApiName, , OperationNameRegion |
PT1M | Oui |
|
Latency Latence en millisecondes. N’utilisez pas Azure service OpenAI. |
Latency |
Millisecondes | Moyen |
ApiName, , OperationNameRegion, ,RatelimitKey |
PT1M | Oui |
|
Limitation de débit La limite de débit actuelle de la clé ratelimit. N’utilisez pas Azure service OpenAI. |
Ratelimit |
Nombre | Total (Somme) |
Region, RatelimitKey |
PT1M | Oui |
|
Erreurs de serveur Nombre d’appels avec erreur interne du service (code de réponse HTTP : 5xx). N’utilisez pas Azure service OpenAI. |
ServerErrors |
Nombre | Total (Somme) |
ApiName, , OperationNameRegion, ,RatelimitKey |
PT1M | Oui |
|
Appels réussis Nombre d’appels réussis. N’utilisez pas Azure service OpenAI. |
SuccessfulCalls |
Nombre | Total (Somme) |
ApiName, , OperationNameRegion, ,RatelimitKey |
PT1M | Oui |
|
Nombre total d’appels Nombre total d’appels. N’utilisez pas Azure service OpenAI. |
TotalCalls |
Nombre | Total (Somme) |
ApiName, , OperationNameRegion, ,RatelimitKey |
PT1M | Oui |
|
Nombre total d’erreurs Nombre total d’appels avec réponse d’erreur (code de réponse HTTP : 4xx ou 5xx). N’utilisez pas Azure service OpenAI. |
TotalErrors |
Nombre | Total (Somme) |
ApiName, , OperationNameRegion, ,RatelimitKey |
PT1M | Oui |
|
Nombre total d’appels de token Nombre total d’appels de tokens. |
TotalTokenCalls |
Nombre | Total (Somme) |
ApiName, , OperationNameRegion |
PT1M | Oui |
Catégorie : Cognitive Services - SLI
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Taille | Fragments de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
AvailabilityRate Pourcentage de disponibilité avec le calcul suivant : (Nombre total d’appels - Erreurs de serveur)/Nombre total d’appels. Les erreurs de serveur incluent les réponses HTTP >=500. N’utilisez pas Azure service OpenAI. |
SuccessRate |
Pourcentage | Minimum, Maximum, Moyenne |
ApiName, , OperationNameRegion, ,RatelimitKey |
PT1M | Non |
Catégorie : Compréhension du contenu - Utilisation
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Taille | Fragments de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Transactions par reconnaissance faciale Nombre d’appels d’API effectués au service Face |
FaceApiTransactions |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Minutes audio traitées Minutes de traitement audio |
ProcessedAudioMinutes |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Pages traitées Nombre de pages de document traitées |
ProcessedDocumentPages |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Images traitées Nombre d’images traitées |
ProcessedImageCount |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Minutes de vidéo traitées Minutes de traitement vidéo |
ProcessedVideoMinutes |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Jetons Nombre de jetons consommés |
Tokens |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
Catégorie : SécuritéDuContenu - Risques et Sécurité
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Taille | Fragments de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Nombre d’utilisateurs potentiellement abusifs Nombre d’utilisateurs potentiellement abusifs détectés sur une période donnée. Vous pouvez ajouter un filtre ou appliquer un fractionnement par la dimension suivante : ModelDeploymentName. |
RAIAbusiveUsersCount |
Nombre | Total (Somme) |
Region, ModelDeploymentName |
PT1M | Oui |
|
Volume dangereux détecté Nombre d’appels effectués à Azure’API OpenAI et détectés comme nuisibles (à la fois en mode bloc et annoté) par le filtre de contenu appliqué sur une période donnée. Vous pouvez ajouter un filtre ou appliquer un fractionnement en fonction des dimensions suivantes : ModelDeploymentName, ModelName et TextType. |
RAIHarmfulRequests |
Nombre | Total (Somme) |
Region, ModelDeploymentName, , ModelNameModelVersion, ApiName, TextType, , Category,Severity |
PT1M | Oui |
|
Volume bloqué Nombre d’appels effectués à Azure’API OpenAI et rejetés par le filtre de contenu appliqué sur une période donnée. Vous pouvez ajouter un filtre ou appliquer un fractionnement en fonction des dimensions suivantes : ModelDeploymentName, ModelName et TextType. |
RAIRejectedRequests |
Nombre | Total (Somme) |
Region, ModelDeploymentName, , ModelNameModelVersion, ApiName, , TextType,Category |
PT1M | Oui |
|
Événement du système de sécurité Événement système pour la surveillance des risques et de la sécurité. Vous pouvez ajouter un filtre ou appliquer un fractionnement par la dimension suivante : EventType. |
RAISystemEvent |
Nombre | Moyen |
Region, EventType |
PT1M | Oui |
|
Volume total envoyé pour vérification de sécurité Nombre d’appels effectués à Azure’API OpenAI et détectés par le filtre de contenu appliqué sur une période donnée. Vous pouvez ajouter un filtre ou appliquer un fractionnement en fonction des dimensions suivantes : ModelDeploymentName, ModelName. |
RAITotalRequests |
Nombre | Total (Somme) |
Region, ModelDeploymentName, , ModelName, ModelVersion, ApiName |
PT1M | Oui |
Catégorie : ContentSafety - Utilisation
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Taille | Fragments de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Nombre de demandes de modération d'images Nombre d'appels pour la modération des images. |
ContentSafetyImageAnalyzeRequestCount |
Nombre | Total (Somme) | ApiVersion |
PT1M | Oui |
|
Nombre d’appels pour la modération du texte Nombre d'appels liés à la modération de textes. |
ContentSafetyTextAnalyzeRequestCount |
Nombre | Total (Somme) | ApiVersion |
PT1M | Oui |
Catégorie : Estimations
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Taille | Fragments de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Nombre de base d’événements aléatoires Estimation du nombre d’événements aléatoires de référence. |
BaselineRandomEventCount |
Nombre | Total (Somme) |
Mode, RunId |
PT1M | Oui |
|
Récompense aléatoire de référence Estimation de la récompense aléatoire de référence. |
BaselineRandomReward |
Nombre | Total (Somme) |
Mode, RunId |
PT1M | Oui |
|
Nombre d’événements en ligne Estimation du nombre d’événements en ligne. |
OnlineEventCount |
Nombre | Total (Somme) |
Mode, RunId |
PT1M | Oui |
|
Récompense en ligne Estimation de la récompense en ligne. |
OnlineReward |
Nombre | Total (Somme) |
Mode, RunId |
PT1M | Oui |
|
Nombre d’événements de référence utilisateur Estimation du nombre d’événements de référence définis par l’utilisateur. |
UserBaselineEventCount |
Nombre | Total (Somme) |
Mode, RunId |
PT1M | Oui |
|
Récompense de référence de l’utilisateur Estimation de la récompense de référence définie par l’utilisateur. |
UserBaselineReward |
Nombre | Total (Somme) |
Mode, RunId |
PT1M | Oui |
Catégorie : Occurrences de fonctionnalité
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Taille | Fragments de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Occurrences des fonctionnalités d’action Nombre de fois où chaque fonctionnalité d’action apparaît. |
ActionFeatureIdOccurrences |
Nombre | Total (Somme) |
FeatureId, , ModeRunId |
PT1M | Oui |
|
Occurrences d'éléments contextuels Nombre de fois où chaque fonctionnalité de contexte apparaît. |
ContextFeatureIdOccurrences |
Nombre | Total (Somme) |
FeatureId, , ModeRunId |
PT1M | Oui |
|
Occurrences des fonctionnalités d’emplacement Nombre de fois où chaque fonctionnalité d’emplacement apparaît. |
SlotFeatureIdOccurrences |
Nombre | Total (Somme) |
FeatureId, , ModeRunId |
PT1M | Oui |
Catégorie : FeatureCardinality
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Taille | Fragments de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Cardinalité des caractéristiques par action Cardinalité des fonctionnalités basée sur l’action. |
FeatureCardinality_Action |
Nombre | Moyen |
FeatureId, , ModeRunId |
PT1M | Oui |
|
Cardinalité des variables par contexte Cardinalité des caractéristiques basée sur le contexte. |
FeatureCardinality_Context |
Nombre | Moyen |
FeatureId, , ModeRunId |
PT1M | Oui |
|
Cardinalité des fonctionnalités par emplacement Cardinalité des fonctionnalités basée sur l’emplacement. |
FeatureCardinality_Slot |
Nombre | Moyen |
FeatureId, , ModeRunId |
PT1M | Oui |
Catégorie : Fonctionnalités par événement
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Taille | Fragments de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Fonctionnalités d’action par événement Nombre moyen de fonctionnalités d’action par événement. |
ActionFeaturesPerEvent |
Nombre | Moyen |
Mode, RunId |
PT1M | Oui |
|
Fonctionnalités de contexte par événement Nombre de fonctionnalités de contexte par événement. |
ContextFeaturesPerEvent |
Nombre | Moyen |
Mode, RunId |
PT1M | Oui |
|
Fonctionnalités d’emplacement par événement Nombre moyen de fonctionnalités d’emplacement par événement. |
SlotFeaturesPerEvent |
Nombre | Moyen |
Mode, RunId |
PT1M | Oui |
Catégorie : Langue - Travaux
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Taille | Fragments de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Durée de l'emploi (aperçu) Remarque : cette valeur dépend fortement de la taille d’entrée, du nombre de documents et de la complexité de la tâche. Il s’agit d’une valeur d’agrégation sur toutes les tâches de travail. |
JobDuration |
Millisecondes | Minimum, Maximum, Moyenne |
JobStatus, JobType |
PT1M | Oui |
Catégorie : Modèles - Requêtes HTTP
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Taille | Fragments de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Taux de disponibilité du modèle Pourcentage de disponibilité avec le calcul suivant : (Nombre total d’appels - Erreurs de serveur)/Nombre total d’appels. Les erreurs de serveur incluent les réponses HTTP >=500. |
ModelAvailabilityRate |
Pourcentage | Minimum, Maximum, Moyenne |
Region, , ModelDeploymentNameModelName, ,ModelVersion |
PT1M | Non |
|
Demandes de modèle Nombre d’appels effectués à l’API de modèle sur une période donnée. S’applique aux déploiements PTU, managés par PTU, et avec paiement à l’utilisation. |
ModelRequests |
Nombre | Total (Somme) |
ApiName, , OperationName, , RegionStreamTypeModelDeploymentNameModelNameModelVersionStatusCodeIsSpilloverServiceTierRequestServiceTierResponse |
PT1M | Oui |
Catégorie : Modèles - Latence
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Taille | Fragments de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Durée entre les jetons Taux de génération de jetons de modèle, mesuré en millisecondes. S’applique aux PTU et aux déploiements gérés par le PTU. Pour les demandes sans diffusion en continu, cette valeur est une estimation. |
NormalizedTimeBetweenTokens |
Millisecondes | Maximum, Minimum, Moyenne |
ApiName, OperationName, , RegionStreamType, ModelDeploymentName, , ModelName,ModelVersion |
PT1M | Oui |
|
Temps normalisé pour le premier octet Le temps nécessaire pour que le premier octet des données de réponse soit reçu après la réception de la demande par modèle, normalisé par jeton. S’applique aux déploiements PTU, managés par PTU, et avec paiement à l’utilisation. Pour les demandes sans diffusion en continu, cette valeur est une estimation. |
NormalizedTimeToFirstToken |
Millisecondes | Maximum, Minimum, Moyenne |
ApiName, OperationName, , RegionStreamType, ModelDeploymentName, , ModelName,ModelVersion |
PT1M | Oui |
|
Durée de la dernière octet Temps nécessaire pour que le dernier octet des données de réponse soit reçu une fois la demande effectuée par modèle. S’applique aux déploiements PTU, managés par PTU, et avec paiement à l’utilisation. Pour les demandes sans diffusion en continu, cette valeur est une estimation. |
TimeToLastByte |
Millisecondes | Maximum, Minimum, Moyenne |
ApiName, OperationName, , RegionStreamType, ModelDeploymentName, , ModelName,ModelVersion |
PT1M | Oui |
|
Temps de réponse Mesure de latence recommandée (réactivité). S’applique aux PTU et aux déploiements gérés par le PTU. Calculé comme temps nécessaire pour que la première réponse apparaisse après qu’un utilisateur envoie une invite, comme mesuré par la passerelle API. Ce nombre augmente à mesure que la taille de la requête augmente et/ou que le nombre de consultations du cache diminue. Pour répartir le temps de réponse, vous pouvez ajouter un filtre ou appliquer un fractionnement en fonction des dimensions suivantes : ModelDeploymentName, ModelName et ModelVersion. Remarque : cette métrique est une approximation, car la latence mesurée dépend fortement de plusieurs facteurs, notamment les appels simultanés et le modèle de charge de travail global. En outre, elle ne tient pas compte d’une latence côté client qui peut exister entre votre client et le point de terminaison de l’API. Pour les demandes sans diffusion en continu, cette valeur est une estimation. Reportez-vous à votre propre journalisation pour un suivi de latence optimal. |
TimeToResponse |
Millisecondes | Minimum, Maximum, Moyenne |
ApiName, OperationName, , RegionStreamType, ModelDeploymentName, ModelName, , ModelVersion,StatusCode |
PT1M | Oui |
|
Jetons par seconde Énumère la vitesse de génération d’une réponse de modèle donnée. Le nombre total de jetons générés est divisé par le temps nécessaire pour générer les jetons, en secondes. S’applique aux PTU et aux déploiements gérés par le PTU. Pour les demandes sans diffusion en continu, cette valeur est une estimation. |
TokensPerSecond |
Nombre | Maximum, Minimum, Moyenne |
ApiName, OperationName, , RegionStreamType, ModelDeploymentName, , ModelName,ModelVersion |
PT1M | Oui |
Catégorie : Modèles - Utilisation
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Taille | Fragments de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Pages annotées Nombre total de pages traitées avec des annotations. S’applique aux déploiements PTU, managés par PTU, et avec paiement à l’utilisation. |
AnnotatedPages |
Nombre | Total (Somme) |
ApiName, Region, , ModelDeploymentName, ModelName, ModelVersion |
PT1M | Oui |
|
Jetons d’entrée audio Nombre de jetons d’invite audio traités (entrée) sur un modèle OpenAI. S’applique aux déploiements de modèles gérés par PTU. |
AudioInputTokens |
Nombre | Total (Somme) |
ModelDeploymentName, , ModelNameModelVersion, ,Region |
PT1M | Oui |
|
Jetons de sortie audio Nombre de jetons d’invite audio générés (sortie) sur un modèle OpenAI. S’applique aux déploiements de modèles gérés par PTU. |
AudioOutputTokens |
Nombre | Total (Somme) |
ModelDeploymentName, , ModelNameModelVersion, ,Region |
PT1M | Oui |
|
Jetons d’invite lus à partir du cache Nombre total de jetons lus à partir du cache. S’applique aux déploiements de modèles anthropices. Surfaced in response usage section as cache_read_input_tokens |
cacheReadInputTokens |
Nombre | Total (Somme) |
ApiName, , Region, ModelDeploymentNameModelName, , ModelVersionContextLength |
PT1M | Oui |
|
Jetons d’invite écrits dans le cache (durée de vie de 1 heure) Nombre de jetons d’invite utilisés pour créer l’entrée de 1 heure. S’applique aux déploiements de modèles anthropices. Surfaced in response usage section as cache_creation.ephemeral_1h_input_tokens |
ephemeral1hInputTokens |
Nombre | Total (Somme) |
ApiName, , Region, ModelDeploymentNameModelName, , ModelVersionContextLength |
PT1M | Oui |
|
Jetons d’invite écrits dans le cache (durée de vie de 5 minutes) Nombre de jetons d’invite utilisés pour créer l’entrée de cache de 5 minutes. S’applique aux déploiements de modèles anthropices. Surfaced in response usage section as cache_creation.ephemeral_5m_input_tokens |
ephemeral5mInputTokens |
Nombre | Total (Somme) |
ApiName, , Region, ModelDeploymentNameModelName, , ModelVersionContextLength |
PT1M | Oui |
|
Images générées Nombre total d’images générées. S’applique aux déploiements PTU, managés par PTU, et avec paiement à l’utilisation. |
GeneratedImages |
Nombre | Total (Somme) |
ApiName, Region, , ModelDeploymentName, ModelName, ModelVersion |
PT1M | Oui |
|
Jetons d’entrée Nombre de jetons d’invite traités (entrée) sur un modèle. S’applique aux déploiements PTU, managés par PTU, et avec paiement à l’utilisation. |
InputTokens |
Nombre | Total (Somme) |
ApiName, Region, , ModelDeploymentName, ModelName, ModelVersion |
PT1M | Oui |
|
Jetons de sortie Nombre de jetons générés (sortie) à partir d’un modèle OpenAI. S’applique aux déploiements PTU, managés par PTU, et avec paiement à l’utilisation. |
OutputTokens |
Nombre | Total (Somme) |
ApiName, Region, , ModelDeploymentName, ModelName, ModelVersion |
PT1M | Oui |
|
Utilisation provisionnée % d’utilisation pour un déploiement géré de manière provisionnée, calculé comme (PTUs consommés / PTUs déployés) x 100. Lorsque l’utilisation est supérieure ou égale à 100 %, les appels sont limités et le code d’erreur 429 est retourné. |
ProvisionedUtilization |
Pourcentage | Minimum, Maximum, Moyenne |
Region, , ModelDeploymentNameModelName, ,ModelVersion |
PT1M | Non |
|
Total Pages Nombre total de pages traitées. S’applique aux déploiements PTU, managés par PTU, et avec paiement à l’utilisation. |
TotalPages |
Nombre | Total (Somme) |
ApiName, Region, , ModelDeploymentName, ModelName, ModelVersion |
PT1M | Oui |
|
Nombre total de jetons Nombre de jetons d’inférence traités sur un modèle. Calculé en tant que jetons d’invite (entrée) plus jetons générés (sortie). S’applique aux déploiements PTU, managés par PTU, et avec paiement à l’utilisation. |
TotalTokens |
Nombre | Total (Somme) |
ApiName, Region, , ModelDeploymentName, ModelName, ModelVersion |
PT1M | Oui |
Catégorie : Espaces de noms par événement
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Taille | Fragments de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Espaces de noms d’action par événement Nombre moyen d’espaces de noms d’action par événement. |
ActionNamespacesPerEvent |
Nombre | Moyen |
Mode, RunId |
PT1M | Oui |
|
Espaces de noms de contexte par événement Nombre d’espaces de noms de contexte par événement. |
ContextNamespacesPerEvent |
Nombre | Moyen |
Mode, RunId |
PT1M | Oui |
|
Espaces de noms d’emplacement par événement Nombre moyen d’espaces de noms d’emplacement par événement. |
SlotNamespacesPerEvent |
Nombre | Moyen |
Mode, RunId |
PT1M | Oui |
Catégorie : Récompenses
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Taille | Fragments de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Récompense moyenne par événement Récompense moyenne par événement. |
Reward |
Nombre | Moyen |
BaselineAction, , ChosenActionId, MatchesBaselineNonDefaultReward, , ModeRunId |
PT1M | Oui |
|
Récompense de la machine à sous Récompense par emplacement. |
SlotReward |
Nombre | Moyen |
BaselineActionId, ChosenActionId, , MatchesBaselineNonDefaultReward, SlotId, SlotIndex, , Mode,RunId |
PT1M | Oui |
Catégorie : Machines à sous
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Taille | Fragments de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Récompense globale de l'estimateur de référence Estimation de la récompense de référence globale. |
BaselineEstimatorOverallReward |
Nombre | Moyen |
Mode, RunId |
PT1M | Oui |
|
Récompense de l’emplacement estimateur de référence Estimation de la récompense de référence par emplacement. |
BaselineEstimatorSlotReward |
Nombre | Moyen |
SlotId, , SlotIndexMode, ,RunId |
PT1M | Oui |
|
Récompense globale de l’estimateur aléatoire de référence Estimation de la récompense de référence aléatoire globale. |
BaselineRandomEstimatorOverallReward |
Nombre | Moyen |
Mode, RunId |
PT1M | Oui |
|
Récompense de l’estimateur aléatoire de référence Estimation de la récompense aléatoire de référence par emplacement. |
BaselineRandomEstimatorSlotReward |
Nombre | Moyen |
SlotId, , SlotIndexMode, ,RunId |
PT1M | Oui |
|
Slots Nombre d’emplacements par événement. |
NumberOfSlots |
Nombre | Moyen |
Mode, RunId |
PT1M | Oui |
|
Récompense Totale de l'Estimateur en Ligne Estimation de la récompense en ligne globale. |
OnlineEstimatorOverallReward |
Nombre | Moyen |
Mode, RunId |
PT1M | Oui |
|
Récompense de l’emplacement estimateur en ligne Estimation de la récompense en ligne par emplacement. |
OnlineEstimatorSlotReward |
Nombre | Moyen |
SlotId, , SlotIndexMode, ,RunId |
PT1M | Oui |
|
Occurrences d’emplacement Nombre de fois où chaque emplacement apparaît. |
SlotIdOccurrences |
Nombre | Total (Somme) |
SlotId, , SlotIndexMode, ,RunId |
PT1M | Oui |
Catégorie : SpeechServices - Utilisation
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Taille | Fragments de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Traitement par lots de secondes audio transcrit Nombre de secondes transcrites par lot |
AudioSecondsBatchTranscribed |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Audio Seconds Batch Whisper transcrit Nombre de secondes de chuchotement par lot transcrites |
AudioSecondsBatchWhisperTranscribed |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Transcrite rapide en secondes audio Nombre rapide de secondes transcrites |
AudioSecondsFastTranscribed |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Audio Seconds Fast Whisper transcrit Nombre rapide de secondes transcrites |
AudioSecondsFastWhisperTranscribed |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Secondes audio transcrites Nombre de secondes transcrites |
AudioSecondsTranscribed |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Secondes d'audio traduites Nombre de secondes traduites |
AudioSecondsTranslated |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Durée d'hébergement en secondes du modèle d'avatar Nombre de secondes. |
AvatarModelHostingSeconds |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Secondes d’entraînement du modèle avatar Nombre de secondes. |
AvatarModelTrainingSeconds |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Nombre de profils d’orateur Nombre de profils d’orateur inscrits. Au prorata horaire. |
NumberofSpeakerProfiles |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Transactions de reconnaissance de l’orateur Nombre de transactions de reconnaissance de l’orateur |
SpeakerRecognitionTransactions |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Heures d’hébergement du modèle Speech Nombre d’heures d’hébergement du modèle vocal |
SpeechModelHostingHours |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Caractères synthétisés Nombre de caractères. |
SynthesizedCharacters |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Secondes de vidéo synthétisées Nombre de secondes synthétisées |
VideoSecondsSynthesized |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Jetons d’entrée audio en direct vocal Nombre de jetons d’entrée audio, à l’exclusion des jetons mis en cache. |
VoiceLiveAudioInputTokens |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Jetons de sortie audio en direct vocal Nombre de jetons de sortie audio. |
VoiceLiveAudioOutputTokens |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Jetons d’entrée audio en cache vocal Nombre de jetons d’entrée audio mis en cache. |
VoiceLiveCachedAudioInputTokens |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Jetons d’entrée de texte mis en cache vocal Nombre de jetons d’entrée de texte mis en cache. |
VoiceLiveCachedTextInputTokens |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Jetons d’entrée de texte en direct vocaux Nombre de jetons d’entrée de texte, à l’exclusion des jetons mis en cache. |
VoiceLiveTextInputTokens |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Jetons de sortie de texte en direct vocaux Nombre de jetons de sortie de texte. |
VoiceLiveTextOutputTokens |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Heures d’hébergement du modèle vocal Nombre d’heures. |
VoiceModelHostingHours |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Minutes d’entraînement du modèle vocal Nombre de minutes. |
VoiceModelTrainingMinutes |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
Catégorie : Translator Services - Utilisation
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Taille | Fragments de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Caractères entraînés (déconseillés) Nombre total de caractères entraînés. |
CharactersTrained |
Nombre | Total (Somme) |
ApiName, , OperationNameRegion |
PT1M | Oui |
|
Caractères traduits (déconseillés) Nombre total de caractères dans la requête de texte entrante. |
CharactersTranslated |
Nombre | Total (Somme) |
ApiName, , OperationNameRegion |
PT1M | Oui |
|
Caractères de document traduits Nombre de caractères dans la demande de traduction de documentation. |
DocumentCharactersTranslated |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Caractères personnalisés de document traduits Nombre de caractères dans la demande de traduction de document personnalisée. |
DocumentCustomCharactersTranslated |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Caractères de synchronisation de documents traduits Nombre de caractères dans la requête de traduction de documents (synchrone). |
OneDocumentCharactersTranslated |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Caractères personnalisés traduits pour la synchronisation de documents Nombre de caractères dans la requête de traduction de documents personnalisée (synchrone). |
OneDocumentCustomCharactersTranslated |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Caractères de texte traduits Nombre de caractères dans la demande de traduction de texte entrante. |
TextCharactersTranslated |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Caractères personnalisés de texte traduits Nombre de caractères dans la demande de traduction de texte personnalisée entrante. |
TextCustomCharactersTranslated |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Caractères entraînés par le texte Nombre de caractères utilisés lors de l'entraînement à l'aide de la traduction de texte. |
TextTrainedCharacters |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Secondes de l’application Translator Pro Nombre de secondes d’utilisation de Translator Application Pro. |
TranslatorProAppSeconds |
Secondes | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
Catégorie : Utilisation
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Taille | Fragments de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Nombre d’inférences Nombre d’inférences de Carnegie Frontdoor Service |
CarnegieInferenceCount |
Nombre | Total (Somme) |
Region, , Modality, CategoryLanguage, , SeverityLevelUseCustomList |
PT1M | Oui |
| transactions Vision par ordinateur Nombre de transactions Vision par ordinateur |
ComputerVisionTransactions |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Custom Vision Temps de formation temps de formation Custom Vision |
CustomVisionTrainingTime |
Secondes | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
| transactions Custom Vision Nombre de transactions de prédiction Custom Vision |
CustomVisionTransactions |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Images visage entraînées Nombre d’images entraînées. 1 000 images traitées par transaction. |
FaceImagesTrained |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Visages enregistrés Nombre de visages stockés, calculé au prorata quotidien. Le nombre de visages stockés est indiqué quotidiennement. |
FacesStored |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Transactions par reconnaissance faciale Nombre d’appels d’API effectués au service Face |
FaceTransactions |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Images stockées Nombre d’images Custom Vision stockées. |
ImagesStored |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Événements détectés Nombre d’événements appris. |
LearnedEvents |
Nombre | Total (Somme) |
IsMatchBaseline, , ModeRunId |
PT1M | Oui |
|
Demandes vocales LUIS Nombre de demandes de compréhension de conversion de sortie orale en intention LUIS |
LUISSpeechRequests |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Demandes de texte LUIS Nombre de demandes de texte LUIS |
LUISTextRequests |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Récompenses mises en correspondance Nombre de récompenses correspondantes. |
MatchedRewards |
Nombre | Total (Somme) |
Mode, RunId |
PT1M | Oui |
|
Événements non activés Nombre d’événements sautés. |
NonActivatedEvents |
Nombre | Total (Somme) |
Mode, RunId |
PT1M | Oui |
|
Récompenses observées Nombre de récompenses observées. |
ObservedRewards |
Nombre | Total (Somme) |
Mode, RunId |
PT1M | Oui |
|
Caractères traités Nombre de caractères traités par Immersive Reader. |
ProcessedCharacters |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Enregistrements de texte de santé traités Nombre d’enregistrements texte de santé traités |
ProcessedHealthTextRecords |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Images traitées Nombre d’images traitées |
ProcessedImages |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Pages traitées Nombre de pages traitées |
ProcessedPages |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Enregistrements de texte traités Nombre d’enregistrements texte. |
ProcessedTextRecords |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Enregistrements de texte qaïa Nombre d’enregistrements texte traités |
QuestionAnsweringTextRecords |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Durée de session de discours (déconseillée) Durée totale de la session vocale en secondes. |
SpeechSessionDuration |
Secondes | Total (Somme) |
ApiName, , OperationNameRegion |
PT1M | Oui |
|
Nombre total d'événements Nombre d’événements. |
TotalEvents |
Nombre | Total (Somme) |
Mode, RunId |
PT1M | Oui |
|
Total des transactions (obsolète) Nombre total de transactions. |
TotalTransactions |
Nombre | Total (Somme) | <aucune> | PT1M | Oui |
Dimensions de métrique
Pour plus d’informations sur les dimensions des métriques, consultez Métriques multidimensionnelles.
Ce service a les dimensions suivantes associées à ses métriques.
- ApiName
- Nom de fonctionnalité
- ModelDeploymentName
- ModelName
- ModèleVersion
- NomOpération
- Région
- StatusCode
- Type de flux
- UsageChannel
Journaux d’activité de ressources
Cette section répertorie les types de journaux d’activité de ressources que vous pouvez collecter pour ce service. La section extrait la liste des types de catégories de journaux de ressources alles pris en charge dans Azure Monitor.
Journaux de ressources pris en charge pour Microsoft. CognitiveServices/comptes
| Catégorie | Nom de présentation de la catégorie | Table de journal | Supports plan de journal de base | Soutient la transformation au moment de l'ingestion | Exemples de requêtes | Coûts d’exportation |
|---|---|---|---|---|---|---|
Audit |
Journaux d’audit |
AzureDiagnostics Journaux de plusieurs ressources Azure. |
Non | Non | Non | |
AzureOpenAIRequestUsage |
Azure l’utilisation des demandes OpenAI |
AzureDiagnostics Journaux de plusieurs ressources Azure. |
Non | Non | Oui | |
RequestResponse |
Journaux des requêtes et des réponses |
AzureDiagnostics Journaux de plusieurs ressources Azure. |
Non | Non | Non | |
Trace |
Journaux de suivi |
AzureDiagnostics Journaux de plusieurs ressources Azure. |
Non | Non | Non |
tables journaux d’activité Azure Monitor
Cette section répertorie les tables Azure Monitor Journaux pertinentes pour ce service, qui sont disponibles pour la requête par Log Analytics à l’aide de requêtes Kusto. Les tables contiennent les données du journal des ressources et éventuellement d’autres données en fonction de ce qui est collecté et acheminé vers elles.
Azure OpenAI microsoft.cognitiveservices/accounts
Journal d’activité
La table liée répertorie les opérations qui peuvent être enregistrées dans le journal d’activité de ce service. Ces opérations sont un sous-ensemble de toutes les opérations possibles du fournisseur de ressources dans le journal d’activité.
Pour plus d’informations sur le schéma des entrées du journal d’activité, consultez Schéma du journal d’activité.
Contenu connexe
- Consultez Monitor Azure OpenAI pour obtenir une description de la surveillance Azure OpenAI.
- Consultez Monitor Azure ressources avec Azure Monitor pour plus d’informations sur la surveillance des ressources Azure.