Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Cet article contient toutes les informations de référence de surveillance pour ce service.
Pour plus d’informations sur les données que vous pouvez collecter pour Azure OpenAI dans Microsoft Modèles Foundry et comment l’utiliser, consultez Monitor Azure OpenAI.
Metrics
Cette section liste tous les indicateurs de plateforme collectés automatiquement pour ce service. Ces indicateurs font également partie de la liste mondiale des métriques toutes les plateformes prises en charge dans Azure Monitor.
Pour des informations sur la rétention des métriques, voir Azure Monitor Aperçu des métriques.
Métriques prises en charge pour Microsoft. Services/comptes cognitifs
Surveillez les métriques les plus importantes pour Azure OpenAI. Plus loin dans cet article, vous trouverez une liste plus longue de toutes les métriques disponibles pour cet espace de noms, qui contient plus de détails sur les métriques de cette liste plus courte. Consultez la liste suivante pour obtenir les informations les plus up-to-date. L’équipe Azure travaille à actualiser les tables dans les sections suivantes.
Important
Ne confondez pas les métriques de cette section avec l’ancienne Latency métrique listée sous Services cognitifs - Requêtes HTTP plus loin dans cet article. L'ancienne métrique Latency n'est pas conçue pour Azure charges de travail OpenAI et produit des résultats trompeurs lorsqu'elle est utilisée pour diagnostiquer Azure latence OpenAI. Pour Azure surveillance de latence OpenAI, utilisez Temps à la Réponse (AzureOpenAITimeToResponse), Temps jusqu’au dernier octet (AzureOpenAITTLTInMS), Temps entre jetons (AzureOpenAINormalizedTBTInMS), ou Temps normalisé jusqu’au premier octet (AzureOpenAINormalizedTTFTInMS). Pour des conseils sur l’interprétation de ces métriques, voir Performance et latence.
- Azure demandes OpenAI
- Jetons actifs
- Jetons de complétion générés
- Heures de formation FineTuned traitées
- Jetons d’inférence traités
- Jetons d’invite traités
- Utilisation gérée par provisionnement V2
- Taux de correspondance du cache de jetons sur prompt
- Temps d’intervenir
- Temps entre les jetons
- Temps pour le dernier octet
- Temps normalisé jusqu’au premier octet
- Jetons par seconde
Vous pouvez également surveiller les métriques content Safety utilisées par d’autres services associés.
- Volume bloqué
- Volume nuisible détecté
- Nombre potentiel d’utilisateurs abusifs
- Événement du système de sécurité
- Volume total envoyé pour contrôle de sécurité
Note
L’indicateur d’utilisation gérée par provisionnement est désormais obsolète et n’est plus recommandée. Cette métrique est remplacée par la métrique d’utilisation managée provisionnée V2 . Les jetons par seconde, le temps de réponse et le temps entre les jetons ne sont actuellement pas disponibles pour les déploiements Standard.
Référence rapide : indicateurs clés par cas d’usage
Utilisez ce tableau pour trouver la bonne métrique pour un objectif de surveillance spécifique. Pour des conseils de bout en bout sur l’interprétation de ces métriques, voir Performance et latence.
| Je veux surveiller... | Utilisez cette métrique | Nom de l’API REST |
|---|---|---|
| Temps de réponse global | Temps pour le dernier octet | AzureOpenAITTLTInMS |
| Réactivité du premier jeton (streaming) | Temps d’intervenir | AzureOpenAITimeToResponse |
| Vitesse de génération de jetons | Temps entre les jetons | AzureOpenAINormalizedTBTInMS |
| Efficacité du premier jeton normalisée par la taille du prompt | Temps normalisé jusqu’au premier octet | AzureOpenAINormalizedTTFTInMS |
| Volume de jetons de sortie par requête | Jetons de complétion générés | GeneratedTokens |
| Volume de jeton d’entrée par requête | Jetons d’invite traités | ProcessedPromptTokens |
| Utilisation de la capacité PTU | Utilisation gérée par provisionnement V2 | AzureOpenAIProvisionedManagedUtilizationV2 |
| Volume de requêtes et erreurs | Azure demandes OpenAI | AzureOpenAIRequests |
Tip
Associez toujours une métrique de latence à une métrique de comptage de jetons. Une augmentation de latence sans augmentation correspondante du jeton pourrait indiquer un vrai problème. Une augmentation de latence avec une augmentation proportionnelle des jetons est un comportement attendu.
Avertissement
Les métriques sous Cognitive Services - HTTP Requests plus loin dans cet article sont des métriques héritées de Cognitive Services et ne sont pas conçues pour Azure charges de travail OpenAI. En particulier, la métrique Latency dans cette catégorie n'est pas la même que celle des métriques de latence Azure OpenAI (temps avant la réponse, temps jusqu'au dernier octet, temps entre les jetons, temps normalisé jusqu'au premier octet). L’utilisation de la métrique ancienne Latency pour Azure dépannage OpenAI produit des résultats trompeurs. Utilisez plutôt les métriques Azure OpenAI listées dans cette section.
Le tableau suivant présente les indicateurs disponibles pour Microsoft. Cognitive Services/type de ressource comptes.
- Toutes les colonnes ne sont peut-être pas présentes dans chaque tableau.
- Certaines colonnes peuvent être au-delà de la zone de vue de la page. Sélectionnez Tableau agrandi pour voir toutes les colonnes disponibles.
En-têtes de tableau
- Catégorie - Le groupe métrique ou la classification.
- Metric - Le nom d’affichage métrique tel qu’il apparaît dans le portail Azure.
- Nom dans l’API REST - Le nom de la métrique tel qu’il est mentionné dans l’API REST.
- Unité - Unité de mesure.
- Agrégation - Le type d’agrégation par défaut. Valeurs valides : Moyenne (moyenne), Minimum (Min), Maximum (Max), Total (Somme), Compte.
- Dimensions - Dimensions disponibles pour la métrique.
-
Graaux temporels - Intervalles auxquels la métrique est échantillonnée. Par exemple,
PT1Mindique que la métrique est échantillonnée toutes les minutes,PT30Mtoutes les 30 minutes,PT1Htoutes les heures, etc. - DS Export - Si la métrique est exportable vers Azure Monitor Logs via les paramètres de diagnostic. Pour des informations sur l’exportation des métriques, voir Créer des paramètres de diagnostic dans Azure Monitor.
Catégorie : Actions
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Dimensions | Grains de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Occurences de l’action Le nombre de fois où chaque action apparaît. |
ActionIdOccurrences |
Nombre | Total (Somme) |
ActionId, , ModeRunId |
PT1M | Oui |
|
Actions par événement Nombre d’actions par événement. |
ActionsPerEvent |
Nombre | Average |
Mode, RunId |
PT1M | Oui |
Catégorie : Azure OpenAI - Requêtes HTTP
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Dimensions | Grains de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Disponibilité d’Azure OpenAI Pourcentage de disponibilité avec le calcul suivant : (Total d’appels - Erreurs de serveur)/Total d’appels. Les erreurs serveur incluent toutes les réponses >HTTP =500. |
AzureOpenAIAvailabilityRate |
Pourcentage | Minimum, maximum, moyenne |
ApiName, OperationName, , StreamTypeRegion, ModelDeploymentName, , ModelName,ModelVersion |
PT1M | Non |
|
Azure Requêtes OpenAI Nombre d’appels effectués vers l’API OpenAI d’Azure sur une période donnée. Cela s’applique aux déploiements PTU, PTU-Managed et Pay-as-you-go. Pour décomposer les requêtes API, vous pouvez ajouter un filtre ou appliquer une division selon les dimensions suivantes : ModelDeploymentName, ModelName, ModelVersion, StatusCode (réussi, clienterrors, erreurs serveur), IsSpillover pour les informations de débordement, ServiceTier, StreamType (requêtes en streaming vs non-streaming) et opération. |
AzureOpenAIRequests |
Nombre | Total (Somme) |
ApiName, , OperationName, , RegionStreamTypeModelDeploymentNameModelNameModelVersionStatusCodeIsSpilloverServiceTierRequestServiceTierResponse |
PT1M | Oui |
Catégorie : Azure OpenAI - Latence
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Dimensions | Grains de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Temps entre jetons Pour les demandes de streaming ; Taux de génération de jetons modèle, mesuré en millisecondes. Cela s’applique aux déploiements PTU, gérés par PTU et Pay-as-you-go. |
AzureOpenAINormalizedTBTInMS |
Millisecondes | Maximum, minimum, moyenne |
Region, , ModelDeploymentNameModelName, ,ModelVersion |
PT1M | Oui |
|
Temps normalisé jusqu’au premier octet Pour les demandes en streaming et non en streaming ; Le temps nécessaire pour que le premier octet de données de réponse soit reçu après que la requête a été effectuée par le modèle, normalisée par le jeton. Cela s’applique aux déploiements PTU, gérés par PTU et Pay-as-you-go. |
AzureOpenAINormalizedTTFTInMS |
Millisecondes | Maximum, minimum, moyenne |
Region, , ModelDeploymentNameModelName, ,ModelVersion |
PT1M | Oui |
|
Temps d’intervenir Mesure recommandée de latence (réactivité) pour les requêtes en streaming. Cela s’applique aux déploiements PTU, gérés par PTU et Pay-as-you-go. Calculé comme le temps nécessaire pour que la première réponse apparaisse après qu’un utilisateur ait envoyé une invite, mesuré par la passerelle API. Ce chiffre augmente à mesure que la taille de la demande augmente et/ou que la taille des coups de cache diminue. Pour décomposer la métrique de temps de réponse, vous pouvez ajouter un filtre ou appliquer une séparation selon les dimensions suivantes : NomDeDéplayement, NomDeModèle, et VersionModèle. Note : cette métrique est une approximation, car la latence mesurée dépend fortement de plusieurs facteurs, y compris les appels simultanés et le schéma global de charge de travail. De plus, il ne prend pas en compte toute latence côté client qui pourrait exister entre votre client et le point de terminaison de l’API. Veuillez consulter votre propre journal pour un suivi optimal de la latence. |
AzureOpenAITimeToResponse |
Millisecondes | Minimum, maximum, moyenne |
ApiName, OperationName, RegionStreamType, , ModelDeploymentName, ModelName, ModelVersion, ,StatusCode |
PT1M | Oui |
|
Jetons par seconde Énumère la vitesse de génération pour la réponse donnée d’un modèle Azure OpenAI. Le total des jetons générés est divisé par le temps nécessaire à la génération des jetons, en secondes. Cela s’applique aux déploiements PTU, gérés par PTU et Pay-as-you-go. |
AzureOpenAITokenPerSecond |
Nombre | Maximum, minimum, moyenne |
Region, , ModelDeploymentNameModelName, ,ModelVersion |
PT1M | Oui |
|
Temps pour le dernier octet Pour les demandes en streaming et non en streaming ; Le temps nécessaire pour que le dernier octet de données de réponse soit reçu après la requête effectuée par le modèle. Cela s’applique aux déploiements PTU, gérés par PTU et Pay-as-you-go. |
AzureOpenAITTLTInMS |
Millisecondes | Maximum, minimum, moyenne |
Region, , ModelDeploymentNameModelName, ,ModelVersion |
PT1M | Oui |
Catégorie : Azure OpenAI - Utilisation
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Dimensions | Grains de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Jetons actifs Total des jetons moins les jetons mis en cache sur une période donnée. Cela s’applique aux déploiements gérés par PTU et PTU. Utilisez cette métrique pour comprendre votre utilisation basée sur le TPS ou TPM pour les PTU et comparez avec vos benchmarks pour le TPS cible ou le TPM pour vos scénarios. Pour décomposer les requêtes API, vous pouvez ajouter un filtre ou appliquer une division selon les dimensions suivantes : ModelDeploymentName, ModelName, et ModelVersion. |
ActiveTokens |
Nombre | Minimum, maximum, moyenne, total (somme) |
Region, , ModelDeploymentNameModelName, ,ModelVersion |
PT1M | Oui |
|
Jetons de complétion audio Nombre de jetons d’invite audio générés (sortie) sur un modèle OpenAI. Cela s’applique aux déploiements gérés par PTU et au modèle Pay-as-you-go. |
AudioCompletionTokens |
Nombre | Total (Somme) |
ModelDeploymentName, , ModelNameModelVersion, ,Region |
PT1M | Oui |
|
Jetons d’invite audio Nombre de jetons d’invite audio traités (entrées) sur un modèle OpenAI. Cela s’applique aux déploiements gérés par PTU et au modèle Pay-as-you-go. |
AudioPromptTokens |
Nombre | Total (Somme) |
ModelDeploymentName, , ModelNameModelVersion, ,Region |
PT1M | Oui |
|
Taux de correspondance du cache de jetons sur prompt Pourcentage de jetons d’invite qui ont été envoyés dans la cache. Cela s’applique aux déploiements gérés par PTU et PTU. |
AzureOpenAIContextTokensCacheMatchRate |
Pourcentage | Minimum, maximum, moyenne |
Region, , ModelDeploymentNameModelName, ,ModelVersion |
PT1M | Non |
|
Utilisation gérée par provisionnement (dépréciée) L’utilisation % pour un déploiement géré sous provision, calculé comme (PTU consommées / PTU déployées) x 100. Lorsque l’utilisation est supérieure ou égale à 100%, les appels sont limités et le code d’erreur 429 est renvoyé. Pour décomposer cette métrique, vous pouvez ajouter un filtre ou appliquer une répartition selon les dimensions suivantes : ModelDeploymentName, ModelName, ModelVersion et StreamType (requêtes en streaming vs non-streaming) |
AzureOpenAIProvisionedManagedUtilization |
Pourcentage | Minimum, maximum, moyenne |
Region, , StreamTypeModelDeploymentName, , ModelNameModelVersion |
PT1M | Non |
|
Utilisation gérée par provisionnement V2 L’utilisation % pour un déploiement géré sous provision, calculé comme (PTU consommées / PTU déployées) x 100. Lorsque l’utilisation est supérieure ou égale à 100%, les appels sont limités et le code d’erreur 429 est renvoyé. Pour décomposer cette métrique, vous pouvez ajouter un filtre ou appliquer une répartition selon les dimensions suivantes : ModelDeploymentName, ModelName, ModelVersion et StreamType (requêtes en streaming vs non-streaming) |
AzureOpenAIProvisionedManagedUtilizationV2 |
Pourcentage | Minimum, maximum, moyenne |
Region, , StreamTypeModelDeploymentName, , ModelNameModelVersion |
PT1M | Non |
|
Heures de formation FineTuned traitées Nombre d’heures d’entraînement traitées sur un modèle OpenAI FineTuned |
FineTunedTrainingHours |
Nombre | Total (Somme) |
ApiName, , ModelDeploymentNameFeatureName, , UsageChannelRegion |
PT1M | Oui |
|
Jetons de complétion générés Nombre de jetons générés (sortie) à partir d’un modèle OpenAI. Cela s’applique aux déploiements PTU, gérés par PTU et Pay-as-you-go. Pour décomposer cette métrique, vous pouvez ajouter un filtre ou appliquer une division selon les dimensions suivantes : ModelDeploymentName et ModelName. |
GeneratedTokens |
Nombre | Total (Somme) |
ApiName, , ModelDeploymentName, UsageChannelFeatureName, , RegionModelVersion |
PT1M | Oui |
|
Jetons d’invite traités Nombre de jetons d’invite traités (entrées) sur un modèle OpenAI. Cela s’applique aux déploiements PTU, gérés par PTU et Pay-as-you-go. Pour décomposer cette métrique, vous pouvez ajouter un filtre ou appliquer une division selon les dimensions suivantes : ModelDeploymentName et ModelName. |
ProcessedPromptTokens |
Nombre | Total (Somme) |
ApiName, , ModelDeploymentName, UsageChannelFeatureName, , RegionModelVersion |
PT1M | Oui |
|
Secondes API en temps réel utilisées Nombre de secondes utilisées dans RealtimeAPI |
RealtimeUsageTime |
Nombre | Total (Somme) |
Region, ModelDeploymentName |
PT1M | Oui |
|
Jetons d’inférence traités Nombre de tokens d’inférence traités sur un modèle OpenAI. Calculé comme des jetons d’invite (entrée) plus des jetons générés (sortie). Cela s’applique aux déploiements PTU, gérés par PTU et Pay-as-you-go. Pour décomposer cette métrique, vous pouvez ajouter un filtre ou appliquer une division selon les dimensions suivantes : ModelDeploymentName et ModelName. |
TokenTransaction |
Nombre | Total (Somme) |
ApiName, , ModelDeploymentName, UsageChannelFeatureName, , RegionModelVersion |
PT1M | Oui |
Catégorie : Services cognitifs - Requêtes HTTP
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Dimensions | Grains de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Appels bloqués Nombre d’appels dépassant la limite de taux ou de quota. Ne pas utiliser pour Azure OpenAI service. |
BlockedCalls |
Nombre | Total (Somme) |
ApiName, , OperationNameRegion, ,RatelimitKey |
PT1M | Oui |
|
Erreurs du client Nombre d’appels avec erreur côté client (code de réponse HTTP 4xx). Ne pas utiliser pour Azure OpenAI service. |
ClientErrors |
Nombre | Total (Somme) |
ApiName, , OperationNameRegion, ,RatelimitKey |
PT1M | Oui |
|
Données entrantes Taille des données entrantes en octets. Ne pas utiliser pour Azure OpenAI service. |
DataIn |
Octets | Total (Somme) |
ApiName, , OperationNameRegion |
PT1M | Oui |
|
Données sortantes Taille des données sortantes en octets. Ne pas utiliser pour Azure OpenAI service. |
DataOut |
Octets | Total (Somme) |
ApiName, , OperationNameRegion |
PT1M | Oui |
|
Latency Latence en millisecondes. Ne pas utiliser pour Azure OpenAI service. |
Latency |
Millisecondes | Average |
ApiName, , OperationNameRegion, ,RatelimitKey |
PT1M | Oui |
|
Limitation de débit La limite de vitesse actuelle de la clé de limite de vitesse. Ne pas utiliser pour Azure OpenAI service. |
Ratelimit |
Nombre | Total (Somme) |
Region, RatelimitKey |
PT1M | Oui |
|
Erreurs de serveur Nombre d’appels avec erreur interne du service (code de réponse HTTP 5xx). Ne pas utiliser pour Azure OpenAI service. |
ServerErrors |
Nombre | Total (Somme) |
ApiName, , OperationNameRegion, ,RatelimitKey |
PT1M | Oui |
|
Appels réussis Nombre d’appels réussis. Ne pas utiliser pour Azure OpenAI service. |
SuccessfulCalls |
Nombre | Total (Somme) |
ApiName, , OperationNameRegion, ,RatelimitKey |
PT1M | Oui |
|
Nombre total d’appels Nombre total d’appels. Ne pas utiliser pour Azure OpenAI service. |
TotalCalls |
Nombre | Total (Somme) |
ApiName, , OperationNameRegion, ,RatelimitKey |
PT1M | Oui |
|
Nombre total d’erreurs Nombre total d’appels avec réponse d’erreur (code de réponse HTTP 4xx ou 5xx). Ne pas utiliser pour Azure OpenAI service. |
TotalErrors |
Nombre | Total (Somme) |
ApiName, , OperationNameRegion, ,RatelimitKey |
PT1M | Oui |
|
Total des appels de jetons Nombre total d’appels de tokens. |
TotalTokenCalls |
Nombre | Total (Somme) |
ApiName, , OperationNameRegion |
PT1M | Oui |
Catégorie : Services cognitifs - SLI
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Dimensions | Grains de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
AvailabilityRate Pourcentage de disponibilité avec le calcul suivant : (Total d’appels - Erreurs de serveur)/Total d’appels. Les erreurs serveur incluent toutes les réponses >HTTP =500. Ne pas utiliser pour Azure OpenAI service. |
SuccessRate |
Pourcentage | Minimum, maximum, moyenne |
ApiName, , OperationNameRegion, ,RatelimitKey |
PT1M | Non |
Catégorie : Compréhension du contenu - Utilisation
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Dimensions | Grains de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Transactions par reconnaissance faciale Nombre d’appels API effectués vers Face Service |
FaceApiTransactions |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Minutes audio traitées Minutes d’audio traitées |
ProcessedAudioMinutes |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Pages traitées Nombre de pages de documents traitées |
ProcessedDocumentPages |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Images traitées Nombre d’images traitées |
ProcessedImageCount |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Minutes vidéo traitées Minutes de vidéo traitées |
ProcessedVideoMinutes |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Jetons Nombre de jetons consommés |
Tokens |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
Catégorie : ContenuSécurité - Risques et Sécurité
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Dimensions | Grains de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Nombre d’utilisateurs potentiellement abusifs Nombre d’utilisateurs potentiellement abusifs détectés sur une période donnée. Vous pouvez ajouter un filtre ou appliquer une division selon la dimension suivante : ModelDeploymentName. |
RAIAbusiveUsersCount |
Nombre | Total (Somme) |
Region, ModelDeploymentName |
PT1M | Oui |
|
Volume nuisible détecté Nombre d’appels effectués vers l’API OpenAI d’Azure et détectés comme nuisibles (modèle par blocs et mode annotage) par un filtre de contenu appliqué sur une période donnée. Vous pouvez ajouter un filtre ou appliquer une séparation selon les dimensions suivantes : NomModelDéploiement, NomModèleNom et Type de Texte. |
RAIHarmfulRequests |
Nombre | Total (Somme) |
Region, ModelDeploymentName, ModelNameModelVersion, , ApiName, TextType, Category, ,Severity |
PT1M | Oui |
|
Volume bloqué Nombre d’appels effectués vers l’API OpenAI Azure et rejetés par un filtre de contenu appliqué sur une période donnée. Vous pouvez ajouter un filtre ou appliquer une séparation selon les dimensions suivantes : NomModelDéploiement, NomModèleNom et Type de Texte. |
RAIRejectedRequests |
Nombre | Total (Somme) |
Region, ModelDeploymentName, , ModelVersionModelName, ApiName, , TextType,Category |
PT1M | Oui |
|
Événement du système de sécurité Événement système pour la surveillance des risques et de la sécurité. Vous pouvez ajouter un filtre ou appliquer une division selon la dimension suivante : EventType. |
RAISystemEvent |
Nombre | Average |
Region, EventType |
PT1M | Oui |
|
Volume total envoyé pour contrôle de sécurité Nombre d’appels effectués vers l’API OpenAI d’Azure et détectés par un filtre de contenu appliqué sur une période donnée. Vous pouvez ajouter un filtre ou appliquer une division selon les dimensions suivantes : NomDeDéploiementModèle, NomDeModèle. |
RAITotalRequests |
Nombre | Total (Somme) |
Region, , ModelDeploymentNameModelName, , ModelVersionApiName |
PT1M | Oui |
Catégorie : Sécurité du contenu - Utilisation
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Dimensions | Grains de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Nombre d’appels pour la modération d’images Nombre d’appels à la modération d’images. |
ContentSafetyImageAnalyzeRequestCount |
Nombre | Total (Somme) | ApiVersion |
PT1M | Oui |
|
Nombre d’appels pour la modération par SMS Nombre d’appels à la modération par texto. |
ContentSafetyTextAnalyzeRequestCount |
Nombre | Total (Somme) | ApiVersion |
PT1M | Oui |
Catégorie : Estimations
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Dimensions | Grains de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Nombre de base des événements aléatoires Estimation du nombre d’événements aléatoires de base. |
BaselineRandomEventCount |
Nombre | Total (Somme) |
Mode, RunId |
PT1M | Oui |
|
Récompense aléatoire de base Estimation de la récompense aléatoire de base. |
BaselineRandomReward |
Nombre | Total (Somme) |
Mode, RunId |
PT1M | Oui |
|
Comptage des événements en ligne Estimation du nombre d’événements en ligne. |
OnlineEventCount |
Nombre | Total (Somme) |
Mode, RunId |
PT1M | Oui |
|
Récompense en ligne Estimation pour la récompense en ligne. |
OnlineReward |
Nombre | Total (Somme) |
Mode, RunId |
PT1M | Oui |
|
Nombre d’événements de référence utilisateur Estimation du nombre d’événements de référence défini par l’utilisateur. |
UserBaselineEventCount |
Nombre | Total (Somme) |
Mode, RunId |
PT1M | Oui |
|
Récompense de base utilisateur Estimation de la récompense de référence définie par l’utilisateur. |
UserBaselineReward |
Nombre | Total (Somme) |
Mode, RunId |
PT1M | Oui |
Catégorie : Occurrences de caractéristiques
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Dimensions | Grains de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Occurrences des longs métrages d’action Nombre de fois où chaque action apparaît. |
ActionFeatureIdOccurrences |
Nombre | Total (Somme) |
FeatureId, , ModeRunId |
PT1M | Oui |
|
Occurrences de caractéristiques contextuelles Le nombre de fois où chaque élément de contexte apparaît. |
ContextFeatureIdOccurrences |
Nombre | Total (Somme) |
FeatureId, , ModeRunId |
PT1M | Oui |
|
Occurrences des caractéristiques des machines à sous Nombre de fois où chaque fonction de machine à sous apparaît. |
SlotFeatureIdOccurrences |
Nombre | Total (Somme) |
FeatureId, , ModeRunId |
PT1M | Oui |
Catégorie : FeatureCardinality
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Dimensions | Grains de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Cardinalité des caractéristiques par action Cardinalité des caractéristiques basée sur l’action. |
FeatureCardinality_Action |
Nombre | Average |
FeatureId, , ModeRunId |
PT1M | Oui |
|
Cardinalité des caractéristiques selon le contexte Cardinalité des caractéristiques basée sur le contexte. |
FeatureCardinality_Context |
Nombre | Average |
FeatureId, , ModeRunId |
PT1M | Oui |
|
Cardinalité des caractéristiques par emplacement Cardinalité des caractéristiques basée sur l’emplacement. |
FeatureCardinality_Slot |
Nombre | Average |
FeatureId, , ModeRunId |
PT1M | Oui |
Catégorie : Fonctionnalités par événement
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Dimensions | Grains de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Fonctionnalités d’action par événement Nombre moyen de longs métrages d’action par événement. |
ActionFeaturesPerEvent |
Nombre | Average |
Mode, RunId |
PT1M | Oui |
|
Caractéristiques contextuelles par événement Nombre de caractéristiques contextuelles par événement. |
ContextFeaturesPerEvent |
Nombre | Average |
Mode, RunId |
PT1M | Oui |
|
Caractéristiques des machines à sous par événement Nombre moyen de fonctionnalités de machines à sous par événement. |
SlotFeaturesPerEvent |
Nombre | Average |
Mode, RunId |
PT1M | Oui |
Catégorie : Langue - Emplois
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Dimensions | Grains de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Durée du poste (Aperçu) Note : cette valeur dépend fortement de la taille de l’entrée, du nombre de documents et de la complexité de la tâche. C’est une valeur agrégée pour toutes les tâches du poste. |
JobDuration |
Millisecondes | Minimum, maximum, moyenne |
JobStatus, JobType |
PT1M | Oui |
Catégorie : Modèles - Requêtes HTTP
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Dimensions | Grains de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Taux de disponibilité des modèles Pourcentage de disponibilité avec le calcul suivant : (Total d’appels - Erreurs de serveur)/Total d’appels. Les erreurs serveur incluent toutes les réponses >HTTP =500. |
ModelAvailabilityRate |
Pourcentage | Minimum, maximum, moyenne |
Region, , ModelDeploymentNameModelName, ,ModelVersion |
PT1M | Non |
|
Demandes de modèle Nombre d’appels effectués vers l’API du modèle sur une période donnée. Cela s’applique aux déploiements PTU, PTU-Managed et Pay-as-you-go. |
ModelRequests |
Nombre | Total (Somme) |
ApiName, , OperationName, , RegionStreamTypeModelDeploymentNameModelNameModelVersionStatusCodeIsSpilloverServiceTierRequestServiceTierResponse |
PT1M | Oui |
Catégorie : Modèles - Latence
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Dimensions | Grains de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Temps entre les jetons Taux de génération de jetons modèles, mesuré en millisecondes. Cela s’applique aux déploiements gérés par PTU et PTU. Pour les requêtes non streamantes, cette valeur est une estimation. |
NormalizedTimeBetweenTokens |
Millisecondes | Maximum, minimum, moyenne |
ApiName, OperationName, , StreamTypeRegion, ModelDeploymentName, , ModelName,ModelVersion |
PT1M | Oui |
|
Temps normalisé jusqu’au premier octet Le temps nécessaire pour que le premier octet de données de réponse soit reçu après que la requête a été effectuée par le modèle, normalisée par le jeton. Cela s’applique aux déploiements PTU, gérés par PTU et Pay-as-you-go. Pour les requêtes non streamantes, cette valeur est une estimation. |
NormalizedTimeToFirstToken |
Millisecondes | Maximum, minimum, moyenne |
ApiName, OperationName, , StreamTypeRegion, ModelDeploymentName, , ModelName,ModelVersion |
PT1M | Oui |
|
Temps pour le dernier octet Le temps nécessaire pour que le dernier octet des données de réponse soit reçu après que la requête a été effectuée par le modèle. Cela s’applique aux déploiements PTU, gérés par PTU et Pay-as-you-go. Pour les requêtes non streamantes, cette valeur est une estimation. |
TimeToLastByte |
Millisecondes | Maximum, minimum, moyenne |
ApiName, OperationName, , StreamTypeRegion, ModelDeploymentName, , ModelName,ModelVersion |
PT1M | Oui |
|
Temps d’intervenir Mesure recommandée de latence (réactivité). Cela s’applique aux déploiements gérés par PTU et PTU. Calculé comme le temps nécessaire pour que la première réponse apparaisse après qu’un utilisateur ait envoyé une invite, mesuré par la passerelle API. Ce chiffre augmente à mesure que la taille de la demande augmente et/ou que la taille des coups de cache diminue. Pour décomposer la métrique de temps de réponse, vous pouvez ajouter un filtre ou appliquer une séparation selon les dimensions suivantes : NomDeDéplayement, NomDeModèle, et VersionModèle. Note : cette métrique est une approximation, car la latence mesurée dépend fortement de plusieurs facteurs, y compris les appels simultanés et le schéma global de charge de travail. De plus, il ne prend pas en compte toute latence côté client qui pourrait exister entre votre client et le point de terminaison de l’API. Pour les requêtes non streamantes, cette valeur est une estimation. Veuillez consulter votre propre journal pour un suivi optimal de la latence. |
TimeToResponse |
Millisecondes | Minimum, maximum, moyenne |
ApiName, OperationName, RegionStreamType, , ModelDeploymentName, ModelName, ModelVersion, ,StatusCode |
PT1M | Oui |
|
Jetons par seconde Énumère la vitesse de génération pour une réponse donnée du modèle. Le total des jetons générés est divisé par le temps nécessaire à la génération des jetons, en secondes. Cela s’applique aux déploiements gérés par PTU et PTU. Pour les requêtes non streamantes, cette valeur est une estimation. |
TokensPerSecond |
Nombre | Maximum, minimum, moyenne |
ApiName, OperationName, , StreamTypeRegion, ModelDeploymentName, , ModelName,ModelVersion |
PT1M | Oui |
Catégorie : Modèles - Utilisation
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Dimensions | Grains de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Pages annotées Nombre total de pages traitées avec annotations. Cela s’applique aux déploiements PTU, PTU-Managed et Pay-as-you-go. |
AnnotatedPages |
Nombre | Total (Somme) |
ApiName, , RegionModelDeploymentName, , ModelNameModelVersion |
PT1M | Oui |
|
Jetons d’entrée audio Nombre de jetons d’invite audio traités (entrées) sur un modèle OpenAI. S’applique aux déploiements de modèles gérés par PTU. |
AudioInputTokens |
Nombre | Total (Somme) |
ModelDeploymentName, , ModelNameModelVersion, ,Region |
PT1M | Oui |
|
Jetons de sortie audio Nombre de jetons d’invite audio générés (sortie) sur un modèle OpenAI. S’applique aux déploiements de modèles gérés par PTU. |
AudioOutputTokens |
Nombre | Total (Somme) |
ModelDeploymentName, , ModelNameModelVersion, ,Region |
PT1M | Oui |
|
Jetons d’invite lus depuis le cache Nombre total de jetons lus depuis le cache. Cela s’applique aux déploiements de modèles Anthropic. Apparu dans la section d’utilisation des réponses comme cache_read_input_tokens |
cacheReadInputTokens |
Nombre | Total (Somme) |
ApiName, , Region, ModelNameModelDeploymentName, , ModelVersionContextLength |
PT1M | Oui |
|
Jetons d’invite écrits en cache (TTL de 1 heure) Le nombre de jetons de prompt utilisés pour créer l’entrée d’une heure. Cela s’applique aux déploiements de modèles Anthropic. Apparu dans la section d’utilisation des réponses comme cache_creation.ephemeral_1h_input_tokens |
ephemeral1hInputTokens |
Nombre | Total (Somme) |
ApiName, , Region, ModelNameModelDeploymentName, , ModelVersionContextLength |
PT1M | Oui |
|
Jetons d’invite écrits en cache (TTL de 5 minutes) Le nombre de jetons d’invite utilisés pour créer l’entrée de cache en 5 minutes. Cela s’applique aux déploiements de modèles Anthropic. Apparu dans la section d’utilisation des réponses comme cache_creation.ephemeral_5m_input_tokens |
ephemeral5mInputTokens |
Nombre | Total (Somme) |
ApiName, , Region, ModelNameModelDeploymentName, , ModelVersionContextLength |
PT1M | Oui |
|
Images générées Nombre total d’images générées. Cela s’applique aux déploiements PTU, PTU-Managed et Pay-as-you-go. |
GeneratedImages |
Nombre | Total (Somme) |
ApiName, , RegionModelDeploymentName, , ModelNameModelVersion |
PT1M | Oui |
|
Jetons d’entrée Nombre de jetons d’invite traités (entrées) sur un modèle. Cela s’applique aux déploiements PTU, PTU-Managed et Pay-as-you-go. |
InputTokens |
Nombre | Total (Somme) |
ApiName, , RegionModelDeploymentName, , ModelNameModelVersion |
PT1M | Oui |
|
Jetons de sortie Nombre de jetons générés (sortie) à partir d’un modèle OpenAI. Cela s’applique aux déploiements PTU, PTU-Managed et Pay-as-you-go. |
OutputTokens |
Nombre | Total (Somme) |
ApiName, , RegionModelDeploymentName, , ModelNameModelVersion |
PT1M | Oui |
|
Utilisation provisionnée L’utilisation % pour un déploiement géré sous provision, calculé comme (PTU consommées / PTU déployées) x 100. Lorsque l’utilisation est supérieure ou égale à 100%, les appels sont limités et le code d’erreur 429 est renvoyé. |
ProvisionedUtilization |
Pourcentage | Minimum, maximum, moyenne |
Region, , ModelDeploymentNameModelName, ,ModelVersion |
PT1M | Non |
|
Total Pages Nombre total de pages traitées. Cela s’applique aux déploiements PTU, PTU-Managed et Pay-as-you-go. |
TotalPages |
Nombre | Total (Somme) |
ApiName, , RegionModelDeploymentName, , ModelNameModelVersion |
PT1M | Oui |
|
Nombre total de jetons Nombre de jetons d’inférence traités sur un modèle. Calculé comme des jetons d’invite (entrée) plus des jetons générés (sortie). Cela s’applique aux déploiements PTU, PTU-Managed et Pay-as-you-go. |
TotalTokens |
Nombre | Total (Somme) |
ApiName, , RegionModelDeploymentName, , ModelNameModelVersion |
PT1M | Oui |
Catégorie : Espaces de noms par événement
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Dimensions | Grains de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Espaces de noms d’actions par événement Nombre moyen d’espaces de noms d’actions par événement. |
ActionNamespacesPerEvent |
Nombre | Average |
Mode, RunId |
PT1M | Oui |
|
Espaces de noms contextuels par événement Nombre d’espaces de noms contextuels par événement. |
ContextNamespacesPerEvent |
Nombre | Average |
Mode, RunId |
PT1M | Oui |
|
Espaces de noms de machines à sous par événement Nombre moyen d’espaces de noms de machines à sous par événement. |
SlotNamespacesPerEvent |
Nombre | Average |
Mode, RunId |
PT1M | Oui |
Catégorie : Récompenses
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Dimensions | Grains de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Récompense moyenne par événement Récompense moyenne par événement. |
Reward |
Nombre | Average |
BaselineAction, , ChosenActionId, NonDefaultRewardMatchesBaseline, , ModeRunId |
PT1M | Oui |
|
Récompense de la machine à sous Récompense par emplacement. |
SlotReward |
Nombre | Average |
BaselineActionId, ChosenActionId, MatchesBaselineNonDefaultReward, , SlotId, SlotIndex, Mode, ,RunId |
PT1M | Oui |
Catégorie : Machines à sous
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Dimensions | Grains de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Récompense globale par estimateur de référence Estimateur de référence : récompense globale. |
BaselineEstimatorOverallReward |
Nombre | Average |
Mode, RunId |
PT1M | Oui |
|
Récompense de slot estimatrice de référence Estimateur de base : récompense par emplacement. |
BaselineEstimatorSlotReward |
Nombre | Average |
SlotId, , SlotIndexMode, ,RunId |
PT1M | Oui |
|
Estimateur aléatoire de référence : Récompense globale Récompense globale par estimateur aléatoire de base. |
BaselineRandomEstimatorOverallReward |
Nombre | Average |
Mode, RunId |
PT1M | Oui |
|
Récompense de base pour l’emplacement d’estimateur aléatoire Estimateur aléatoire de base : récompense par emplacement. |
BaselineRandomEstimatorSlotReward |
Nombre | Average |
SlotId, , SlotIndexMode, ,RunId |
PT1M | Oui |
|
Slots Nombre de places par événement. |
NumberOfSlots |
Nombre | Average |
Mode, RunId |
PT1M | Oui |
|
Estimateur en ligne Récompense globale Estimateur en ligne Récompense globale. |
OnlineEstimatorOverallReward |
Nombre | Average |
Mode, RunId |
PT1M | Oui |
|
Récompense de machine à sous estimatrice en ligne Estimateur en ligne Récompense par fente. |
OnlineEstimatorSlotReward |
Nombre | Average |
SlotId, , SlotIndexMode, ,RunId |
PT1M | Oui |
|
Occurrences d’emplacement Le nombre de fois où chaque emplacement apparaît. |
SlotIdOccurrences |
Nombre | Total (Somme) |
SlotId, , SlotIndexMode, ,RunId |
PT1M | Oui |
Catégorie : Services de parole - Utilisation
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Dimensions | Grains de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Secondes audio transcrites en lot Nombre de secondes transcrites par lot |
AudioSecondsBatchTranscribed |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Secondes audio Chuchotement en lot transcrit Nombre de secondes du chuchotement du lot transcrit |
AudioSecondsBatchWhisperTranscribed |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Secondes audio transcrites rapidement Nombre rapide de secondes transcrites |
AudioSecondsFastTranscribed |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Secondes audio Rapide Chuchotement transcrit Nombre de secondes rapidement en chuchotement transcrit |
AudioSecondsFastWhisperTranscribed |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Secondes audio transcrites Nombre de secondes transcrites |
AudioSecondsTranscribed |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Secondes audio traduites Nombre de secondes traduites |
AudioSecondsTranslated |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Durée d'hébergement en secondes du modèle d'avatar Nombre de secondes. |
AvatarModelHostingSeconds |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Secondes d’entraînement du modèle d’avatar Nombre de secondes. |
AvatarModelTrainingSeconds |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Nombre de profils d’intervenants Nombre de profils d’intervenants inscrits. Au prorata horaire. |
NumberofSpeakerProfiles |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Transactions de reconnaissance des haut-parleurs Nombre de transactions de reconnaissance des haut-parleurs |
SpeakerRecognitionTransactions |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Heures d’animation du modèle de discours Nombre d’heures d’animation du modèle de discours |
SpeechModelHostingHours |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Caractères synthétisés Nombre de personnages. |
SynthesizedCharacters |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Secondes vidéo synthétisées Nombre de secondes synthétisées |
VideoSecondsSynthesized |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Jetons d’entrée audio en direct pour voix Nombre de jetons d’entrée audio, hors jetons mis en cache. |
VoiceLiveAudioInputTokens |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Jetons de sortie audio en direct pour voix Nombre de jetons de sortie audio. |
VoiceLiveAudioOutputTokens |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Jetons d’entrée audio en cache en direct pour voix Nombre de jetons d’entrée audio mis en cache. |
VoiceLiveCachedAudioInputTokens |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Jetons d’entrée de texte en cache Voice Live Nombre de jetons d’entrée texte mis en cache. |
VoiceLiveCachedTextInputTokens |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Jetons d’entrée de texte en direct pour voix Nombre de jetons d’entrée texte, hors jetons mis en cache. |
VoiceLiveTextInputTokens |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Jetons de sortie texte en direct pour voix Nombre de jetons de sortie texte. |
VoiceLiveTextOutputTokens |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Heures d’animation des modèles vocaux Nombre d’heures. |
VoiceModelHostingHours |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Minutes d’entraînement des modèles vocaux Nombre de minutes. |
VoiceModelTrainingMinutes |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
Catégorie : Services de retraduction - Utilisation
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Dimensions | Grains de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Personnages entraînés (dépréciés) Nombre total de personnages entraînés. |
CharactersTrained |
Nombre | Total (Somme) |
ApiName, , OperationNameRegion |
PT1M | Oui |
|
Personnages traduits (dépréciés) Nombre total de caractères dans les demandes de texte entrantes. |
CharactersTranslated |
Nombre | Total (Somme) |
ApiName, , OperationNameRegion |
PT1M | Oui |
|
Caractères du document traduits Nombre de caractères dans la demande de traduction du document. |
DocumentCharactersTranslated |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Caractères personnalisés du document traduits Nombre de caractères dans la demande de traduction personnalisée d’un document. |
DocumentCustomCharactersTranslated |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Caractères de synchronisation de documents traduits Nombre de caractères dans la requête de traduction de document (synchrone). |
OneDocumentCharactersTranslated |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Synchronisation de documents Caractères personnalisés traduits Nombre de caractères dans la demande de traduction de document personnalisé (synchrone). |
OneDocumentCustomCharactersTranslated |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Caractères de texte traduits Nombre de caractères dans la demande de traduction de texte entrante. |
TextCharactersTranslated |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Caractères personnalisés du texte traduits Nombre de caractères dans la demande de traduction de texte personnalisée entrante. |
TextCustomCharactersTranslated |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Caractères entraînés au texte Nombre de caractères entraînés par traduction de texte. |
TextTrainedCharacters |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Traducteur Pro Application Seconds Nombre de secondes d’utilisation de l’application Translator Pro. |
TranslatorProAppSeconds |
Secondes | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
Catégorie : Utilisation
| Unité de mesure | Nom dans l’API REST | Unité | Aggregation | Dimensions | Grains de temps | Exportation DS |
|---|---|---|---|---|---|---|
|
Nombre d’inférences Comte d’inférence du service Carnegie Frontdoor |
CarnegieInferenceCount |
Nombre | Total (Somme) |
Region, , Modality, LanguageCategory, , SeverityLevelUseCustomList |
PT1M | Oui |
|
Transactions de vision informatique Nombre de transactions Vision par ordinateur |
ComputerVisionTransactions |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Temps d’entraînement visuel personnalisé Temps d’entraînement Custom Vision |
CustomVisionTrainingTime |
Secondes | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Transactions Vision personnalisées Nombre de transactions de prédiction Custom Vision |
CustomVisionTransactions |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Images faciales entraînées Nombre d’images entraînées. 1 000 images entraînées par transaction. |
FaceImagesTrained |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Visages enregistrés Nombre de visages enregistrés, prorata quotidiennement. Le nombre de visages stockés est rapporté quotidiennement. |
FacesStored |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Transactions par reconnaissance faciale Nombre d’appels API effectués vers Face Service |
FaceTransactions |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Images stockées Nombre d’images Custom Vision stockées. |
ImagesStored |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Événements détectés Nombre d’événements appris. |
LearnedEvents |
Nombre | Total (Somme) |
IsMatchBaseline, , ModeRunId |
PT1M | Oui |
|
Demandes de discours LUIS Nombre de demandes de compréhension LUIS de la parole à intention |
LUISSpeechRequests |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Requêtes textuelles LUIS Nombre de requêtes textuelles LUIS |
LUISTextRequests |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Récompenses mises en correspondance Nombre de récompenses correspondantes. |
MatchedRewards |
Nombre | Total (Somme) |
Mode, RunId |
PT1M | Oui |
|
Événements non activés Nombre d’épreuves sautées. |
NonActivatedEvents |
Nombre | Total (Somme) |
Mode, RunId |
PT1M | Oui |
|
Récompenses observées Nombre de récompenses observées. |
ObservedRewards |
Nombre | Total (Somme) |
Mode, RunId |
PT1M | Oui |
|
Caractères traités Nombre de caractères traités par Immersive Reader. |
ProcessedCharacters |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Dossiers textuels de santé traités Nombre de dossiers textes médicaux traités |
ProcessedHealthTextRecords |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Images traitées Nombre d’images traitées |
ProcessedImages |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Pages traitées Nombre de pages traitées |
ProcessedPages |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Enregistrements textuels traités Compte des enregistrements textuels. |
ProcessedTextRecords |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Enregistrements textuels QA Nombre d’enregistrements textuels traités |
QuestionAnsweringTextRecords |
Nombre | Total (Somme) |
ApiName, , FeatureNameUsageChannel, ,Region |
PT1M | Oui |
|
Durée de la séance de discours (dépréciée) Durée totale de la séance de parole en quelques secondes. |
SpeechSessionDuration |
Secondes | Total (Somme) |
ApiName, , OperationNameRegion |
PT1M | Oui |
|
Nombre total d'événements Nombre d’événements. |
TotalEvents |
Nombre | Total (Somme) |
Mode, RunId |
PT1M | Oui |
|
Total des transactions (dépréciées) Nombre total de transactions. |
TotalTransactions |
Nombre | Total (Somme) | <aucun> | PT1M | Oui |
Dimensions métriques
Pour des informations sur ce que sont les dimensions métriques, voir Métriques multidimensionnelles.
Ce service comporte les dimensions suivantes associées à ses métriques.
- ApiName
- Nom de fonctionnalité
- ModelDeploymentName
- ModelName
- ModelVersion
- Nom de l'Opération
- Région
- StatusCode
- StreamType
- UsageChannel
Journaux des ressources
Cette section liste les types de journaux de ressources que vous pouvez collecter pour ce service. Cette section puise dans la liste des types de catégories de journaux de ressources tous supportés dans Azure Monitor.
Journaux de ressources pris en charge pour Microsoft. Services/comptes cognitifs
| Catégorie | Catégorie nom d’affichage | Table de logs | Prend en charge, le plan de journalisation de base | Prend en charge la transformation du temps d’ingestion | Exemples de requêtes | Coûts d’exportation |
|---|---|---|---|---|---|---|
Audit |
Journaux d’audit |
AzureDiagnostics Journaux provenant de plusieurs ressources Azure. |
Non | Non | Non | |
AzureOpenAIRequestUsage |
Utilisation des requêtes Azure OpenAI |
AzureDiagnostics Journaux provenant de plusieurs ressources Azure. |
Non | Non | Oui | |
RequestResponse |
Journaux de requêtes et de réponses |
AzureDiagnostics Journaux provenant de plusieurs ressources Azure. |
Non | Non | Non | |
Trace |
Journaux de suivi |
AzureDiagnostics Journaux provenant de plusieurs ressources Azure. |
Non | Non | Non |
Tables Azure Monitor Logs
Cette section liste les tables Azure Monitor Logs pertinentes pour ce service, qui sont disponibles pour requête par Log Analytics via les requêtes Kusto. Les tables contiennent des données de journal de ressources et peut-être plus encore selon ce qui y est collecté et acheminé.
Azure OpenAI microsoft.cognitiveservices/accounts
Journal d’activité
Le tableau lié liste les opérations pouvant être enregistrées dans le journal d’activité de ce service. Ces opérations constituent un sous-ensemble de toutes les opérations possibles du fournisseur de ressources dans le journal d’activité.
Pour plus d’informations sur le schéma des entrées du journal d’activité, voir Schéma du journal d’activité.
Contenu connexe
- Pour obtenir une description de la surveillance Azure OpenAI, consultez Monitor Azure OpenAI.
- Pour plus d’informations sur la surveillance des ressources Azure, consultez Surveiller les ressources Azure avec Azure Monitor.