Métricas admitidas para Microsoft.CognitiveServices/accounts

En la tabla siguiente se enumeran las métricas disponibles para el tipo de recurso Microsoft.CognitiveServices/accounts.

Encabezados de tabla

Métrica: nombre para mostrar de la métrica tal como aparece en el Azure Portal.
Nombre de la API rest : nombre de métrica, tal como se conoce en la API REST.
Unidad: unidad de medida.
Agregación : tipo de agregación predeterminado. Valores válidos: Average, Minimum, Maximum, Total, Count.
Dimensiones - Dimensiones disponibles para la métrica.
Granos de - tiempoIntervalos en los que se muestrea la métrica. Por ejemplo, PT1M indica que la métrica se muestrea cada minuto, PT30M cada 30 minutos, PT1H cada hora, etc.
Exportación de DS: indica si la métrica se puede exportar a los registros de Azure Monitor mediante la configuración de diagnóstico. Para obtener información sobre la exportación de métricas, consulte Creación de una configuración de diagnóstico en Azure Monitor.

Para más información sobre la retención de métricas, consulte Introducción a las métricas de Azure Monitor.

Para obtener una lista de los registros admitidos, consulte Categorías de registro admitidas: Microsoft.CognitiveServices/accounts.

Category Métrica Nombre en la API REST Unidad Agregación Dimensions Granos de tiempo Exportación de DS
Repeticiones de características Action Feature Occurrences

Número de veces que aparece cada característica de acción.
ActionFeatureIdOccurrences Count Total FeatureId, Mode, RunId PT1M
Características por evento Action Features Per Event

Número medio de características de acción por evento.
ActionFeaturesPerEvent Count Average Mode, RunId PT1M
Acciones Action Occurences

Número de veces que aparece cada acción.
ActionIdOccurrences Count Total ActionId, Mode, RunId PT1M
Espacios de nombres por evento Action Namespaces Per Event

Número medio de espacios de nombres de acción por evento.
ActionNamespacesPerEvent Count Average Mode, RunId PT1M
Acciones Actions Per Event

Número de acciones por evento.
ActionsPerEvent Count Average Mode, RunId PT1M
Azure OpenAI: uso Tokens activos

Total de tokens menos tokens almacenados en caché durante un período de tiempo. Se aplica a las implementaciones administradas por PTU y PTU. Use esta métrica para comprender el uso basado en TPS o TPM para las PTUs y compararlos con los puntos de referencia de TPS o TPM de destino para sus escenarios. Para desglosar las solicitudes de API, puede agregar un filtro o aplicar la división por las dimensiones siguientes: ModelDeploymentName, ModelName y ModelVersion.
ActiveTokens Count Mínimo, Máximo, Promedio, Total Region, ModelDeploymentName, ModelName, ModelVersion PT1M
SpeechServices: uso Audio Seconds Transcribed (Segundos de audio transcritos)

Número de segundos transcritos.
AudioSecondsTranscribed Count Total ApiName, FeatureName, UsageChannel, Region PT1M
SpeechServices: uso Audio Seconds Translated (Segundos de audio traducidos)

Número de segundos traducidos.
AudioSecondsTranslated Count Total ApiName, FeatureName, UsageChannel, Region PT1M
Azure OpenAI: solicitudes HTTP Solicitud de tasa de coincidencias de caché de tokens

Porcentaje de los tokens de solicitud alcanzados la memoria caché, avaiable para la administración de PTU.
AzureOpenAIContextTokensCacheMatchRate Percent Mínimo, Máximo, Promedio Region, ModelDeploymentName, ModelName, ModelVersion PT1M No
Azure OpenAI: uso Uso administrado aprovisionado

Porcentaje de uso para una implementación administrada provisonada, calculada como (PTUs consumidas o PTUs implementadas) x 100. Cuando el uso es mayor o igual que el 100 %, se limitan las llamadas y se devuelve el código de error 429. Para desglosar esta métrica, puede agregar un filtro o aplicar la división por las dimensiones siguientes: ModelDeploymentName, ModelName, ModelVersion y StreamType (solicitudes de streaming frente a no streaming)
AzureOpenAIProvisionedManagedUtilization Percent Mínimo, Máximo, Promedio Region, StreamType, ModelDeploymentName, ModelName, ModelVersion PT1M No
Azure OpenAI: uso Uso administrado aprovisionado V2

Porcentaje de uso para una implementación administrada provisonada, calculada como (PTUs consumidas o PTUs implementadas) x 100. Cuando el uso es mayor o igual que el 100 %, se limitan las llamadas y se devuelve el código de error 429. Para desglosar esta métrica, puede agregar un filtro o aplicar la división por las dimensiones siguientes: ModelDeploymentName, ModelName, ModelVersion y StreamType (solicitudes de streaming frente a no streaming)
AzureOpenAIProvisionedManagedUtilizationV2 Percent Mínimo, Máximo, Promedio Region, StreamType, ModelDeploymentName, ModelName, ModelVersion PT1M No
Azure OpenAI: solicitudes HTTP Solicitudes openAI de Azure

Número de llamadas realizadas a la API de Azure OpenAI durante un período de tiempo. Se aplica a las implementaciones de PTU, PTU-Managed y pago por uso. Para desglosar las solicitudes de API, puede agregar un filtro o aplicar la división por las dimensiones siguientes: ModelDeploymentName, ModelName, ModelVersion, StatusCode (correcto, clienterrors, errores de servidor), StreamType (streaming frente a solicitudes que no son de streaming) y operación.
AzureOpenAIRequests Count Total ApiName, OperationName, Region, StreamType, ModelDeploymentName, ModelName, ModelVersion, StatusCode PT1M
Azure OpenAI: solicitudes HTTP Tiempo de respuesta

Medida de latencia recomendada (capacidad de respuesta) para las solicitudes de streaming. Se aplica a las implementaciones administradas por PTU y PTU. Se calcula como tiempo necesario para que aparezca la primera respuesta después de que un usuario envíe una solicitud, medida por la puerta de enlace de API. Este número aumenta a medida que aumenta el tamaño del símbolo del sistema o se reduce el tamaño de aciertos de caché. Para desglosar el tiempo de la métrica de respuesta, puede agregar un filtro o aplicar la división por las dimensiones siguientes: ModelDeploymentName, ModelName y ModelVersion.

Nota: Esta métrica es una aproximación, ya que la latencia medida depende en gran medida de varios factores, incluidas las llamadas simultáneas y el patrón general de carga de trabajo. Además, no tiene en cuenta ninguna latencia del lado cliente que pueda existir entre el cliente y el punto de conexión de API. Consulte su propio registro para obtener un seguimiento óptimo de la latencia.
AzureOpenAITimeToResponse MilliSeconds Mínimo, Máximo, Promedio ApiName, OperationName, Region, StreamType, ModelDeploymentName, ModelName, ModelVersion, StatusCode PT1M
Slots Recompensa general del estimador de línea de base

Recompensa general del estimador de línea de base.
BaselineEstimatorOverallReward Count Average Mode, RunId PT1M
Slots Baseline Estimator Slot Reward

Recompensa del estimador de línea de base por ranura.
BaselineEstimatorSlotReward Count Average SlotId, SlotIndex, Mode, RunId PT1M
Slots Recompensa general del estimador aleatorio de línea de base

Recompensa general del estimador aleatorio de línea de base.
BaselineRandomEstimatorOverallReward Count Average Mode, RunId PT1M
Slots Baseline Random Estimator Slot Reward

Recompensa aleatoria del estimador de línea de base por ranura.
BaselineRandomEstimatorSlotReward Count Average SlotId, SlotIndex, Mode, RunId PT1M
Estimaciones Baseline Random Event count

Estimación del número de eventos aleatorios de línea de base.
BaselineRandomEventCount Count Total Mode, RunId PT1M
Estimaciones Baseline Random Reward

Estimación de la recompensa aleatoria de línea de base.
BaselineRandomReward Count Total Mode, RunId PT1M
Cognitive Services: solicitudes HTTP Llamadas bloqueadas

Número de llamadas que han superado la tasa o el límite de cuota. No use para el servicio Azure OpenAI.
BlockedCalls Count Total ApiName, OperationName, Region, RatelimitKey PT1M
Uso Recuento de inferencias

Recuento de inferencias del servicio Carnegie Frontdoor
CarnegieInferenceCount Count Total Region, Modality, Category, Language, SeverityLevel, UseCustomList PT1M
Uso Caracteres entrenados (en desuso)

Número total de caracteres entrenados.
CharactersTrained Count Total ApiName, OperationName, Region PT1M
Uso Caracteres traducidos (en desuso)

Número total de caracteres de la solicitud entrante de texto.
CharactersTranslated Count Total ApiName, OperationName, Region PT1M
Cognitive Services: solicitudes HTTP Errores de cliente

Número de llamadas con error interno del lado cliente (código de respuesta HTTP 4xx). No use para el servicio Azure OpenAI.
ClientErrors Count Total ApiName, OperationName, Region, RatelimitKey PT1M
Uso Computer Vision Transactions (Transacciones de Computer Vision)

Número de transacciones de Computer Vision.
ComputerVisionTransactions Count Total ApiName, FeatureName, UsageChannel, Region PT1M
ContentSafety: uso Recuento de llamadas para la moderación de imágenes

Número de llamadas para la moderación de imágenes.
ContentSafetyImageAnalyzeRequestCount Count Total ApiVersion PT1M
ContentSafety: uso Recuento de llamadas para moderación de texto

Número de llamadas para la moderación de texto.
ContentSafetyTextAnalyzeRequestCount Count Total ApiVersion PT1M
Repeticiones de características Context Feature Occurrences

Número de veces que aparece cada característica de contexto.
ContextFeatureIdOccurrences Count Total FeatureId, Mode, RunId PT1M
Características por evento Context Features Per Event

Número de características de contexto por evento.
ContextFeaturesPerEvent Count Average Mode, RunId PT1M
Espacios de nombres por evento Context Namespaces Per Event

Número de espacios de nombres de contexto por evento.
ContextNamespacesPerEvent Count Average Mode, RunId PT1M
Uso Custom Vision Training Time (Tiempo de entrenamiento de Custom Vision)

Tiempo de entrenamiento de Custom Vision.
CustomVisionTrainingTime Segundos Total ApiName, FeatureName, UsageChannel, Region PT1M
Uso Custom Vision Transactions (Transacciones de Custom Vision)

Número de transacciones de predicción de Custom Vision.
CustomVisionTransactions Count Total ApiName, FeatureName, UsageChannel, Region PT1M
Cognitive Services: solicitudes HTTP Entrada de datos

Tamaño de los datos de entrada en bytes. No use para el servicio Azure OpenAI.
DataIn Bytes Total ApiName, OperationName, Region PT1M
Cognitive Services: solicitudes HTTP Salida de datos

Tamaño de los datos de salida en bytes. No use para el servicio Azure OpenAI.
DataOut Bytes Total ApiName, OperationName, Region PT1M
Uso Document Characters Translated (Caracteres de documento traducidos)

Número de caracteres en la solicitud de traducción de documentos.
DocumentCharactersTranslated Count Total ApiName, FeatureName, UsageChannel, Region PT1M
Uso Document Custom Characters Translated (Caracteres personalizados de documento traducidos)

Número de caracteres en la solicitud de traducción de documentos personalizada.
DocumentCustomCharactersTranslated Count Total ApiName, FeatureName, UsageChannel, Region PT1M
Uso Face Images Trained (Imágenes de caras entrenadas)

Número de imágenes entrenadas. 1000 imágenes entrenadas por transacción.
FaceImagesTrained Count Total ApiName, FeatureName, UsageChannel, Region PT1M
Uso Faces Stored (Caras almacenadas)

Número de caras almacenadas, prorrateadas diariamente. El número de caras almacenadas se notifica a diario.
FacesStored Count Total ApiName, FeatureName, UsageChannel, Region PT1M
Uso Face Transactions (Transacciones de Face)

Número de llamadas API realizadas al servicio Face.
FaceTransactions Count Total ApiName, FeatureName, UsageChannel, Region PT1M
FeatureCardinality Feature Cardinality by Action

Cardinalidad de las características basada en la acción.
FeatureCardinality_Action Count Average FeatureId, Mode, RunId PT1M
FeatureCardinality Feature Cardinality by Context

Cardinalidad de las características basada en el contexto.
FeatureCardinality_Context Count Average FeatureId, Mode, RunId PT1M
FeatureCardinality Feature Cardinality by Slot

Cardinalidad de las características basada en la ranura.
FeatureCardinality_Slot Count Average FeatureId, Mode, RunId PT1M
Azure OpenAI: uso Processed FineTuned Training Hours

Número de horas de entrenamiento procesadas en un modelo OpenAI FineTuned
FineTunedTrainingHours Count Total ApiName, ModelDeploymentName, FeatureName, UsageChannel, Region PT1M
Azure OpenAI: uso Tokens de finalización generados

Número de tokens generados (salida) de un modelo openAI. Se aplica a las implementaciones de PTU, PTU-Managed y pago por uso. Para desglosar esta métrica, puede agregar un filtro o aplicar la división por las dimensiones siguientes: ModelDeploymentName y ModelName.
GeneratedTokens Count Total ApiName, ModelDeploymentName, FeatureName, UsageChannel, Region, ModelVersion PT1M
Uso Images Stored (Imágenes almacenadas)

Número de imágenes de Custom Vision almacenadas.
ImagesStored Count Total ApiName, FeatureName, UsageChannel, Region PT1M
Cognitive Services: solicitudes HTTP Latency

Latencia en milisegundos. No use para el servicio Azure OpenAI.
Latency MilliSeconds Average ApiName, OperationName, Region, RatelimitKey PT1M
Uso Eventos aprendidos

Número de eventos aprendidos.
LearnedEvents Count Total IsMatchBaseline, Mode, RunId PT1M
Uso LUIS Speech Requests (Solicitudes de voz de LUIS)

Número de solicitudes de conversión de voz en intención de LUIS.
LUISSpeechRequests Count Total ApiName, FeatureName, UsageChannel, Region PT1M
Uso LUIS Text Requests (Solicitudes de texto de LUIS)

Número de solicitudes de texto de LUIS.
LUISTextRequests Count Total ApiName, FeatureName, UsageChannel, Region PT1M
Uso Recompensas coincidentes

Número de recompensas coincidentes.
MatchedRewards Count Total Mode, RunId PT1M
Uso Eventos no activados

Número de eventos omitidos.
NonActivatedEvents Count Total Mode, RunId PT1M
Slots Ranuras

Número de ranuras por evento.
NumberOfSlots Count Average Mode, RunId PT1M
SpeechServices: uso Number of Speaker Profiles (Número de perfiles de hablante)

Número de perfiles de hablante inscritos. Se prorratea cada hora.
NumberofSpeakerProfiles Count Total ApiName, FeatureName, UsageChannel, Region PT1M
Uso Recompensas observadas

Número de recompensas observadas.
ObservedRewards Count Total Mode, RunId PT1M
Uso Caracteres de sincronización de documentos traducidos

Número de caracteres en la solicitud de traducción de documentos (sincrónica).
OneDocumentCharactersTranslated Count Total ApiName, FeatureName, UsageChannel, Region PT1M
Slots Recompensa general del estimador en línea

Recompensa general del estimador en línea.
OnlineEstimatorOverallReward Count Average Mode, RunId PT1M
Slots Online Estimator Slot Reward

Recompensa del estimador en línea por ranura.
OnlineEstimatorSlotReward Count Average SlotId, SlotIndex, Mode, RunId PT1M
Estimaciones Online Event Count

Estimación del recuento de eventos en línea.
OnlineEventCount Count Total Mode, RunId PT1M
Estimaciones Online Reward

Estimación de la recompensa en línea.
OnlineReward Count Total Mode, RunId PT1M
Uso Caracteres procesados

Número de caracteres procesados por Immersive Reader.
ProcessedCharacters Count Total ApiName, FeatureName, UsageChannel, Region PT1M
Uso Processed Health Text Records (Registros de texto del estado procesados)

Número de registros de texto del estado procesados.
ProcessedHealthTextRecords Count Total ApiName, FeatureName, UsageChannel, Region PT1M
Uso Imágenes procesadas

Número de imágenes procesadas.
ProcessedImages Count Total ApiName, FeatureName, UsageChannel, Region PT1M
Uso Processed Pages (Páginas procesadas)

Número de páginas procesadas.
ProcessedPages Count Total ApiName, FeatureName, UsageChannel, Region PT1M
Azure OpenAI: uso Tokens de solicitud procesados

Número de tokens de solicitud procesados (entrada) en un modelo de OpenAI. Se aplica a las implementaciones de PTU, PTU-Managed y pago por uso. Para desglosar esta métrica, puede agregar un filtro o aplicar la división por las dimensiones siguientes: ModelDeploymentName y ModelName.
ProcessedPromptTokens Count Total ApiName, ModelDeploymentName, FeatureName, UsageChannel, Region, ModelVersion PT1M
Uso Registros de texto procesados

Número de registros de texto.
ProcessedTextRecords Count Total ApiName, FeatureName, UsageChannel, Region PT1M
Uso Registros de texto de QA

Número de registros de texto procesados
QuestionAnsweringTextRecords Count Total ApiName, FeatureName, UsageChannel, Region PT1M
ContentSafety: riesgos&seguridad Recuento de usuarios potencialmente abusivos

Número de usuarios potencialmente abusivos que se detectaron durante un período de tiempo. Puede agregar un filtro o aplicar la división por la siguiente dimensión: ModelDeploymentName.
RAIAbusiveUsersCount Count Total Region, ModelDeploymentName PT1M
ContentSafety: riesgos&seguridad Volumen dañino detectado

Número de llamadas realizadas a la API de Azure OpenAI y detectadas como perjudiciales (modelo de bloqueo y modo de anotación) por filtro de contenido aplicado durante un período de tiempo. Puede agregar un filtro o aplicar la división por las dimensiones siguientes: ModelDeploymentName, ModelName y TextType.
RAIHarmfulRequests Count Total Region, ModelDeploymentName, ModelName, ModelVersion, ApiName, TextType, Category, Severity PT1M
ContentSafety: riesgos&seguridad Volumen bloqueado

Número de llamadas realizadas a la API de Azure OpenAI y rechazadas por el filtro de contenido aplicado durante un período de tiempo. Puede agregar un filtro o aplicar la división por las dimensiones siguientes: ModelDeploymentName, ModelName y TextType.
RAIRejectedRequests Count Total Region, ModelDeploymentName, ModelName, ModelVersion, ApiName, TextType, Category PT1M
ContentSafety: riesgos&seguridad Total de volumen enviado para comprobación de seguridad

Número de llamadas realizadas a la API de Azure OpenAI y detectadas por el filtro de contenido aplicado durante un período de tiempo. Puede agregar un filtro o aplicar la división por las dimensiones siguientes: ModelDeploymentName, ModelName.
RAITotalRequests Count Total Region, ModelDeploymentName, ModelName, ModelVersion, ApiName PT1M
Cognitive Services: solicitudes HTTP Ratelimit

El límite de frecuencia actual de la clave ratelimit. No use para el servicio Azure OpenAI.
Ratelimit Count Total Region, RatelimitKey PT1M
Recompensas Average Reward Per Event

Recompensa media por evento.
Reward Count Average BaselineAction, ChosenActionId, MatchesBaseline, NonDefaultReward, Mode, RunId PT1M
Cognitive Services: solicitudes HTTP Errores del servidor

Número de llamadas con error interno del servicio (código de respuesta HTTP 5xx). No use para el servicio Azure OpenAI.
ServerErrors Count Total ApiName, OperationName, Region, RatelimitKey PT1M
Repeticiones de características Slot Feature Occurrences

Número de veces que aparece cada característica de ranura.
SlotFeatureIdOccurrences Count Total FeatureId, Mode, RunId PT1M
Características por evento Slot Features Per Event

Número medio de características de ranura por evento.
SlotFeaturesPerEvent Count Average Mode, RunId PT1M
Slots Slot Occurrences

Número de veces que aparece cada ranura.
SlotIdOccurrences Count Total SlotId, SlotIndex, Mode, RunId PT1M
Espacios de nombres por evento Slot Namespaces Per Event

Número medio de espacios de nombres de ranura por evento.
SlotNamespacesPerEvent Count Average Mode, RunId PT1M
Recompensas Slot Reward

Recompensa por ranura.
SlotReward Count Average BaselineActionId, ChosenActionId, MatchesBaseline, NonDefaultReward, SlotId, SlotIndex, Mode, RunId PT1M
SpeechServices: uso Speaker Recognition Transactions (Transacciones de Speaker Recognition)

Número de transacciones de reconocimiento del hablante.
SpeakerRecognitionTransactions Count Total ApiName, FeatureName, UsageChannel, Region PT1M
SpeechServices: uso Speech Model Hosting Hours (Horas de hospedaje del modelo de voz)

Número de horas de hospedaje del modelo de voz.
SpeechModelHostingHours Count Total ApiName, FeatureName, UsageChannel, Region PT1M
Uso Duración de la sesión de voz (en desuso)

Duración total de la sesión de voz en segundos.
SpeechSessionDuration Segundos Total ApiName, OperationName, Region PT1M
Cognitive Services: solicitudes HTTP Llamadas correctas

Número de llamadas correctas. No use para el servicio Azure OpenAI.
SuccessfulCalls Count Total ApiName, OperationName, Region, RatelimitKey PT1M
Cognitive Services: SLI AvailabilityRate

Porcentaje de disponibilidad con el cálculo siguiente: (total de llamadas - errores del servidor) / total de llamadas. Los errores del servidor incluyen las respuestas HTTP >=500. No use para el servicio Azure OpenAI.
SuccessRate Percent Mínimo, Máximo, Promedio ApiName, OperationName, Region, RatelimitKey PT1M No
SpeechServices: uso Caracteres sintetizados

Número de caracteres.
SynthesizedCharacters Count Total ApiName, FeatureName, UsageChannel, Region PT1M
Uso Text Characters Translated (Caracteres de texto traducidos)

Número de caracteres en la solicitud entrante de traducción de texto.
TextCharactersTranslated Count Total ApiName, FeatureName, UsageChannel, Region PT1M
Uso Text Custom Characters Translated (Caracteres de texto personalizados traducidos)

Número de caracteres en la solicitud entrante personalizada de traducción de texto.
TextCustomCharactersTranslated Count Total ApiName, FeatureName, UsageChannel, Region PT1M
Uso Text Trained Characters (Caracteres de texto entrenados)

Número de caracteres entrenados mediante la traducción de texto.
TextTrainedCharacters Count Total ApiName, FeatureName, UsageChannel, Region PT1M
Azure OpenAI: uso Processed Inference Tokens

Número de tokens de inferencia procesados en un modelo de OpenAI. Se calcula como tokens de solicitud (entrada) más tokens generados (salida). Se aplica a las implementaciones de PTU, PTU-Managed y pago por uso. Para desglosar esta métrica, puede agregar un filtro o aplicar la división por las dimensiones siguientes: ModelDeploymentName y ModelName.
TokenTransaction Count Total ApiName, ModelDeploymentName, FeatureName, UsageChannel, Region, ModelVersion PT1M
Cognitive Services: solicitudes HTTP Total de llamadas

Número total de llamadas. No use para el servicio Azure OpenAI.
TotalCalls Count Total ApiName, OperationName, Region, RatelimitKey PT1M
Cognitive Services: solicitudes HTTP Total de errores

Número total de llamadas con respuesta de error (código de respuesta HTTP 4xx o 5xx). No use para el servicio Azure OpenAI.
TotalErrors Count Total ApiName, OperationName, Region, RatelimitKey PT1M
Uso N.º total de eventos

Número de eventos.
TotalEvents Count Total Mode, RunId PT1M
Cognitive Services: solicitudes HTTP Llamadas de token totales

Número total de llamadas de token.
TotalTokenCalls Count Total ApiName, OperationName, Region PT1M
Uso Transacciones totales (en desuso)

Número total de transacciones.
TotalTransactions Count Total <Ninguna> PT1M
Estimaciones User Baseline Event Count

Estimación del número de eventos de línea de base definidos por el usuario.
UserBaselineEventCount Count Total Mode, RunId PT1M
Estimaciones User Baseline Reward

Estimación de la recompensa de línea de base definida por el usuario.
UserBaselineReward Count Total Mode, RunId PT1M
SpeechServices: uso Horas de hospedaje del modelo de voz

Número de horas.
VoiceModelHostingHours Count Total ApiName, FeatureName, UsageChannel, Region PT1M
SpeechServices: uso Minutos de entrenamiento del modelo de voz

Número de minutos.
VoiceModelTrainingMinutes Count Total ApiName, FeatureName, UsageChannel, Region PT1M