Referencia de datos de supervisión de Azure OpenAI

2025-07-02

Este artículo contiene toda la información de referencia de supervisión de este servicio.

Consulte Supervisión de Azure OpenAI para más información sobre los datos que puede recopilar para Azure OpenAI en azure AI Foundry Models y cómo usarlo.

Métricas

En esta sección se indican todas las métricas de la plataforma recopiladas automáticamente para este servicio. Estas métricas también forman parte de la lista global de todas las métricas de plataforma admitidas en Azure Monitor.

Para obtener información sobre la retención de métricas, consulte Información general sobre las métricas de Azure Monitor.

Métricas admitidas para Microsoft.CognitiveServices/accounts

Estas son las métricas más importantes que creemos que debe supervisar para Azure OpenAI. Más adelante en este artículo se muestra una lista más larga de todas las métricas disponibles para este espacio de nombres que contiene más detalles sobre las métricas de esta lista más corta. Consulte la lista siguiente para obtener la información más actualizada. Estamos trabajando para actualizar las tablas en las secciones siguientes.

Solicitudes de Azure OpenAI
Tokens activos
Tokens de finalización generados
Horas de entrenamiento de FineTuned procesadas
Tokens de inferencia procesados
Tokens de solicitud procesados
Uso administrado aprovisionado V2
Solicitud de tasa de coincidencia de caché de tokens
Tiempo de respuesta
Tiempo entre tokens
Hora a último byte
Tiempo normalizado a primer byte
Tokens por segundo

También puede supervisar las métricas de seguridad de contenido que usan otros servicios relacionados.

Volumen bloqueado
Volumen dañino detectado
Recuento de usuarios potencialmente abusivos
Evento del sistema de seguridad
Total de volumen enviado para comprobación de seguridad

Nota:

La métrica Uso administrado aprovisionado está en desuso y ya no se recomienda. Esta métrica se reemplazó por la métrica Uso administrado aprovisionado V2. Los tokens por segundo, el tiempo de respuesta, el tiempo entre tokens no están disponibles actualmente para las implementaciones estándar.

Las métricas de Cognitive Services tienen la categoría Cognitive Services: solicitudes HTTP en la tabla siguiente. Estas métricas son métricas heredadas que son comunes a todos los recursos de este tipo. Microsoft ya no recomienda usar estas métricas con Azure OpenAI.

En la tabla siguiente se enumeran las métricas disponibles para el tipo de recurso Microsoft.CognitiveServices/accounts.

Es posible que todas las columnas no estén presentes en todas las tablas.
Es posible que algunas columnas estén fuera del área de visualización de la página. Seleccione Expandir tabla para ver todas las columnas disponibles.

Encabezados de tabla

Categoría: el grupo de métricas o la clasificación.
Métrica: el nombre de presentación de la métrica tal como aparece en el portal de Azure.
Nombre en la API REST: el nombre de la métrica por el que se conoce en la API REST.
Unidad: unidad de medida.
Agregación: el tipo de agregación predeterminado. Valores válidos: promedio (Avg), mínimo (Min), máximo (Max), total (Sum), recuento.
Dimensiones - : dimensiones disponibles para la métrica.
Intervalos de agregación - : intervalos en los que se obtiene una muestra de la métrica. Por ejemplo, PT1M indica que la métrica se muestrea cada minuto, PT30M cada 30 minutos, PT1H cada hora, etc.
Exportación de DS: indica si la métrica se puede exportar a los registros de Azure Monitor a través de la configuración de diagnóstico. Para obtener más información, consulte Creación de configuración de diagnóstico en Azure Monitor.

Categoría: Acciones

Métrica	Nombre en la API de REST	Unidad	Agregación	Dimensiones	Granulos de tiempo	Exportación de DS
Ocurrencias de acciones Número de veces que aparece cada acción.	`ActionIdOccurrences`	Contar	Suma (Total)	`ActionId`, , `Mode`, `RunId`	PT1M	Sí
Acciones por evento Número de acciones por evento.	`ActionsPerEvent`	Contar	Promedio	`Mode`, `RunId`	PT1M	Sí

Categoría: Azure OpenAI: solicitudes HTTP

Métrica	Nombre en la API de REST	Unidad	Agregación	Dimensiones	Granulos de tiempo	Exportación de DS
Azure OpenAI AvailabilityRate Porcentaje de disponibilidad con el cálculo siguiente: (total de llamadas - errores del servidor) / total de llamadas. Los errores del servidor incluyen las respuestas HTTP >=500.	`AzureOpenAIAvailabilityRate`	Porcentaje	Mínimo, Máximo, Promedio	`ApiName`, `OperationName`, `Region`, `StreamType`, `ModelDeploymentName`, , `ModelNameModelVersion`	PT1M	No
Solicitudes de Azure OpenAI Número de llamadas realizadas a la API de Azure OpenAI durante un período de tiempo. Se aplica a las implementaciones PTU, administradas por PTU y de pago por uso. Para desglosar las solicitudes de API, puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName, ModelName, ModelVersion, StatusCode (correcto, clienterrors, errores de servidor), StreamType (solicitudes de streaming frente a solicitudes que no son de streaming) y operación.	`AzureOpenAIRequests`	Contar	Suma (Total)	`ApiName`, `OperationName`, `Region`, `StreamType`, `ModelDeploymentName`, `ModelName`, , `ModelVersionStatusCode`	PT1M	Sí

Categoría: Azure OpenAI- Latencia

Métrica	Nombre en la API de REST	Unidad	Agregación	Dimensiones	Granulos de tiempo	Exportación de DS
Tiempo entre token Para las solicitudes de streaming; tasa de generación de tokens de modelo, medida en milisegundos. Se aplica a las implementaciones PTU, administradas por PTU y de pago por uso.	`AzureOpenAINormalizedTBTInMS`	Milisegundos	Máximo, mínimo, promedio	`Region`, `ModelDeploymentName`, , `ModelName`, `ModelVersion`	PT1M	Sí
Tiempo normalizado a primer byte Para las solicitudes de streaming y no streaming, el tiempo que tarda en recibirse el primer byte de los datos de respuesta después de que el modelo realiza la solicitud, normalizado por token. Se aplica a las implementaciones PTU, administradas por PTU y de pago por uso.	`AzureOpenAINormalizedTTFTInMS`	Milisegundos	Máximo, mínimo, promedio	`Region`, `ModelDeploymentName`, , `ModelName`, `ModelVersion`	PT1M	Sí
Tiempo de respuesta Tiempo de respuesta: medida de latencia recomendada (capacidad de respuesta) para las solicitudes de streaming. Se aplica a las implementaciones PTU, administradas por PTU y de pago por uso. Se calcula como el tiempo necesario para que la primera respuesta aparezca después de que un usuario envíe una solicitud, según lo mida la puerta de enlace de API. Este número aumenta a medida que aumenta el tamaño de la solicitud o se reduzca el tamaño de aciertos de caché. Para desglosar el tiempo de la métrica de respuesta, puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName, ModelName y ModelVersion. Nota: Esta métrica es una aproximación, ya que la latencia medida depende en gran medida de varios factores, incluidas las llamadas simultáneas y el patrón general de carga de trabajo. Además, no tiene en cuenta ninguna latencia del lado cliente que pueda existir entre el cliente y el punto de conexión de API. Consulte su propio registro para obtener un seguimiento óptimo de la latencia.	`AzureOpenAITimeToResponse`	Milisegundos	Mínimo, Máximo, Promedio	`ApiName`, `OperationName`, `Region`, `StreamType`, `ModelDeploymentName`, `ModelName`, , `ModelVersionStatusCode`	PT1M	Sí
Tokens por segundo Enumera la velocidad de generación de una respuesta de modelo de Azure OpenAI determinada. El número total de tokens generados se divide por el tiempo para generar los tokens, en segundos. Se aplica a las implementaciones PTU, administradas por PTU y de pago por uso.	`AzureOpenAITokenPerSecond`	Contar	Máximo, mínimo, promedio	`Region`, `ModelDeploymentName`, , `ModelName`, `ModelVersion`	PT1M	Sí
Tiempo hasta el último byte Para las solicitudes de streaming y no streaming; tiempo que tarda el último byte de los datos de respuesta en recibirse después de que el modelo realice la solicitud. Se aplica a las implementaciones PTU, administradas por PTU y de pago por uso.	`AzureOpenAITTLTInMS`	Milisegundos	Máximo, mínimo, promedio	`Region`, `ModelDeploymentName`, , `ModelName`, `ModelVersion`	PT1M	Sí

Categoría: Azure OpenAI- Uso

Métrica	Nombre en la API de REST	Unidad	Agregación	Dimensiones	Granulos de tiempo	Exportación de DS
Tokens activos Total de tokens menos los tokens almacenados en caché durante un período de tiempo. Se aplica a las PTU y a las implementaciones administradas por PTU. Utiliza esta métrica para comprender la utilización basada en TPS o TPM de las PTU y compáralo con tus puntos de referencia para el TPS o TPM objetivo en tus escenarios. Para desglosar las solicitudes de API, puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName, ModelName y ModelVersion.	`ActiveTokens`	Contar	Mínimo, Máximo, Promedio, Total (Suma)	`Region`, `ModelDeploymentName`, , `ModelName`, `ModelVersion`	PT1M	Sí
Indicadores de finalización de audio Número de tokens de solicitud de audio generados (salida) en un modelo de OpenAI. Se aplica a las implementaciones gestionadas por PTU y al modelo de pago por uso.	`AudioCompletionTokens`	Contar	Suma (Total)	`ModelDeploymentName`, `ModelName`, , `ModelVersion`, `Region`	PT1M	Sí
Tokens de solicitud de audio Número de tokens de solicitud de audio procesados (entrada) en un modelo de OpenAI. Se aplica a las implementaciones gestionadas por PTU y al modelo de pago por uso.	`AudioPromptTokens`	Contar	Suma (Total)	`ModelDeploymentName`, `ModelName`, , `ModelVersion`, `Region`	PT1M	Sí
Tasa de coincidencia de caché de tokens de solicitud Porcentaje de tokens de solicitud que alcanzan la memoria caché. Se aplica a las PTU y a las implementaciones administradas por PTU.	`AzureOpenAIContextTokensCacheMatchRate`	Porcentaje	Mínimo, Máximo, Promedio	`Region`, `ModelDeploymentName`, , `ModelName`, `ModelVersion`	PT1M	No
Uso administrado aprovisionado (en desuso) Porcentaje de uso para una implementación administrada provisionada, se calcula como (PTUs consumidas / PTUs implementadas) x 100. Cuando el uso es mayor o igual que 100 %, se limitan las llamadas y se devuelve el código de error 429. Para desglosar esta métrica, puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName, ModelName, ModelVersion y StreamType (solicitudes de streaming frente a no streaming).	`AzureOpenAIProvisionedManagedUtilization`	Porcentaje	Mínimo, Máximo, Promedio	`Region`, `StreamType`, `ModelDeploymentName`, , `ModelName`, `ModelVersion`	PT1M	No
Uso administrado aprovisionado V2 Porcentaje de uso para una implementación administrada provisionada, se calcula como (PTUs consumidas / PTUs implementadas) x 100. Cuando el uso es mayor o igual que 100 %, se limitan las llamadas y se devuelve el código de error 429. Para desglosar esta métrica, puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName, ModelName, ModelVersion y StreamType (solicitudes de streaming frente a no streaming).	`AzureOpenAIProvisionedManagedUtilizationV2`	Porcentaje	Mínimo, Máximo, Promedio	`Region`, `StreamType`, `ModelDeploymentName`, , `ModelName`, `ModelVersion`	PT1M	No
Horas de entrenamiento de FineTuned procesadas Número de horas de entrenamiento procesadas en un modelo OpenAI FineTuned	`FineTunedTrainingHours`	Contar	Suma (Total)	`ApiName`, `ModelDeploymentName`, `FeatureName`, , `UsageChannel`, `Region`	PT1M	Sí
Tokens de finalización generados Número de tokens generados (salida) a partir de un modelo de OpenAI. Se aplica a las implementaciones PTU, administradas por PTU y de pago por uso. Para desglosar esta métrica, puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName y ModelName.	`GeneratedTokens`	Contar	Suma (Total)	`ApiName`, `ModelDeploymentName`, `FeatureName`, `UsageChannel`, , `Region`, `ModelVersion`	PT1M	Sí
Tokens de solicitud procesados Número de tokens de solicitud procesados (entrada) en un modelo de OpenAI. Se aplica a las implementaciones PTU, administradas por PTU y de pago por uso. Para desglosar esta métrica, puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName y ModelName.	`ProcessedPromptTokens`	Contar	Suma (Total)	`ApiName`, `ModelDeploymentName`, `FeatureName`, `UsageChannel`, , `Region`, `ModelVersion`	PT1M	Sí
Tokens de inferencia procesados Número de tokens de inferencia procesados en un modelo de OpenAI. Se calcula como tokens de solicitud (entrada) más tokens generados (salida). Se aplica a las implementaciones PTU, administradas por PTU y de pago por uso. Para desglosar esta métrica, puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName y ModelName.	`TokenTransaction`	Contar	Suma (Total)	`ApiName`, `ModelDeploymentName`, `FeatureName`, `UsageChannel`, , `Region`, `ModelVersion`	PT1M	Sí

Categoría: Servicios Cognitivos - Solicitudes HTTP

Métrica	Nombre en la API de REST	Unidad	Agregación	Dimensiones	Granulos de tiempo	Exportación de DS
Llamadas bloqueadas Número de llamadas que han superado la tasa o el límite de cuota. No use para Azure OpenAI Service.	`BlockedCalls`	Contar	Suma (Total)	`ApiName`, `OperationName`, , `Region`, `RatelimitKey`	PT1M	Sí
Errores de cliente Número de llamadas con error interno del lado cliente (código de respuesta HTTP 4xx). No use para Azure OpenAI Service.	`ClientErrors`	Contar	Suma (Total)	`ApiName`, `OperationName`, , `Region`, `RatelimitKey`	PT1M	Sí
Entrada de datos Tamaño de los datos de entrada en bytes. No use para Azure OpenAI Service.	`DataIn`	Bytes (unidades de información digital)	Suma (Total)	`ApiName`, , `OperationName`, `Region`	PT1M	Sí
Salida de datos Tamaño de los datos de salida en bytes. No use para Azure OpenAI Service.	`DataOut`	Bytes (unidades de información digital)	Suma (Total)	`ApiName`, , `OperationName`, `Region`	PT1M	Sí
Latencia Latencia en milisegundos. No use para Azure OpenAI Service.	`Latency`	Milisegundos	Promedio	`ApiName`, `OperationName`, , `Region`, `RatelimitKey`	PT1M	Sí
Ratelimit El límite de frecuencia actual de la clave ratelimit. No use para Azure OpenAI Service.	`Ratelimit`	Contar	Suma (Total)	`Region`, `RatelimitKey`	PT1M	Sí
Errores del servidor Número de llamadas con error interno del servicio (código de respuesta HTTP 5xx). No use para Azure OpenAI Service.	`ServerErrors`	Contar	Suma (Total)	`ApiName`, `OperationName`, , `Region`, `RatelimitKey`	PT1M	Sí
Llamadas exitosas Número de llamadas exitosas. No use para Azure OpenAI Service.	`SuccessfulCalls`	Contar	Suma (Total)	`ApiName`, `OperationName`, , `Region`, `RatelimitKey`	PT1M	Sí
Total de llamadas Número total de llamadas. No use para Azure OpenAI Service.	`TotalCalls`	Contar	Suma (Total)	`ApiName`, `OperationName`, , `Region`, `RatelimitKey`	PT1M	Sí
Total de errores Número total de llamadas con respuesta de error (código de respuesta HTTP 4xx o 5xx). No use para Azure OpenAI Service.	`TotalErrors`	Contar	Suma (Total)	`ApiName`, `OperationName`, , `Region`, `RatelimitKey`	PT1M	Sí
Llamadas de token totales Número total de llamadas de token.	`TotalTokenCalls`	Contar	Suma (Total)	`ApiName`, , `OperationName`, `Region`	PT1M	Sí

Categoría: Cognitive Services - SLI

Métrica	Nombre en la API de REST	Unidad	Agregación	Dimensiones	Granulos de tiempo	Exportación de DS
AvailabilityRate Porcentaje de disponibilidad con el cálculo siguiente: (total de llamadas - errores del servidor) / total de llamadas. Los errores del servidor incluyen las respuestas HTTP >=500. No use para Azure OpenAI Service.	`SuccessRate`	Porcentaje	Mínimo, Máximo, Promedio	`ApiName`, `OperationName`, , `Region`, `RatelimitKey`	PT1M	No

Categoría: ContentSafety - Riesgos y seguridad

Métrica	Nombre en la API de REST	Unidad	Agregación	Dimensiones	Granulos de tiempo	Exportación de DS
Recuento de usuarios potencialmente abusivos Número de usuarios potencialmente abusivos que detectaron durante un período de tiempo. Puede agregar un filtro o aplicar la división mediante la siguiente dimensión: ModelDeploymentName.	`RAIAbusiveUsersCount`	Contar	Suma (Total)	`Region`, `ModelDeploymentName`	PT1M	Sí
Volumen dañino detectado Número de llamadas realizadas a la API de Azure OpenAI y detectadas como perjudiciales (tanto el modelo de bloque como el modo de anotación) por filtro de contenido aplicado durante un período de tiempo. Puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName, ModelName y TextType.	`RAIHarmfulRequests`	Contar	Suma (Total)	`Region`, `ModelDeploymentName`, `ModelName`, `ModelVersion`, `ApiName`, `TextType`, , `CategorySeverity`	PT1M	Sí
Volumen bloqueado Número de llamadas realizadas a la API de Azure OpenAI y rechazadas por el filtro de contenido aplicado durante un período de tiempo. Puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName, ModelName y TextType.	`RAIRejectedRequests`	Contar	Suma (Total)	`Region`, `ModelDeploymentName`, `ModelName`, `ModelVersion`, `ApiName`, , `TextTypeCategory`	PT1M	Sí
Evento del sistema de seguridad Evento del sistema para riesgos y supervisión de seguridad. Puede agregar un filtro o aplicar la división mediante la siguiente dimensión: EventType.	`RAISystemEvent`	Contar	Promedio	`Region`, `EventType`	PT1M	Sí
Número total de volúmenes enviados para la comprobación de seguridad Número de llamadas realizadas a la API de Azure OpenAI y detectadas por el filtro de contenido aplicado durante un período de tiempo. Puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName, ModelName.	`RAITotalRequests`	Contar	Suma (Total)	`Region`, `ModelDeploymentName`, `ModelName`, , `ModelVersion`, `ApiName`	PT1M	Sí

Categoría: Seguridad de Contenidos - Uso

Métrica	Nombre en la API de REST	Unidad	Agregación	Dimensiones	Granulos de tiempo	Exportación de DS
Recuento de llamadas para la moderación de imágenes Número de llamadas para la moderación de imágenes.	`ContentSafetyImageAnalyzeRequestCount`	Contar	Suma (Total)	`ApiVersion`	PT1M	Sí
Recuento de llamadas para moderación de texto Número de llamadas para la moderación de texto.	`ContentSafetyTextAnalyzeRequestCount`	Contar	Suma (Total)	`ApiVersion`	PT1M	Sí

Categoría: Estimaciones

Métrica	Nombre en la API de REST	Unidad	Agregación	Dimensiones	Granulos de tiempo	Exportación de DS
Recuento de eventos aleatorios de línea base Estimación del número de eventos aleatorios de línea de base.	`BaselineRandomEventCount`	Contar	Suma (Total)	`Mode`, `RunId`	PT1M	Sí
Recompensa aleatoria base Estimación de la recompensa aleatoria inicial.	`BaselineRandomReward`	Contar	Suma (Total)	`Mode`, `RunId`	PT1M	Sí
Recuento de eventos en línea Estimación del recuento de eventos en línea.	`OnlineEventCount`	Contar	Suma (Total)	`Mode`, `RunId`	PT1M	Sí
Recompensa en línea Estimación de la recompensa en línea.	`OnlineReward`	Contar	Suma (Total)	`Mode`, `RunId`	PT1M	Sí
Recuento de eventos de referencia de usuario Estimación del número de eventos de línea de base definidos por el usuario.	`UserBaselineEventCount`	Contar	Suma (Total)	`Mode`, `RunId`	PT1M	Sí
Recompensa de referencia del usuario Estimación de la recompensa de línea de base definida por el usuario.	`UserBaselineReward`	Contar	Suma (Total)	`Mode`, `RunId`	PT1M	Sí

Categoría: Ocurrencias de características

Métrica	Nombre en la API de REST	Unidad	Agregación	Dimensiones	Granulos de tiempo	Exportación de DS
Ocurrencias de característica de acción Número de veces que aparece cada característica de acción.	`ActionFeatureIdOccurrences`	Contar	Suma (Total)	`FeatureId`, , `Mode`, `RunId`	PT1M	Sí
Apariciones de características del contexto Número de veces que aparece cada característica de contexto.	`ContextFeatureIdOccurrences`	Contar	Suma (Total)	`FeatureId`, , `Mode`, `RunId`	PT1M	Sí
Ocurrencias de característica de ranura Número de veces que aparece cada característica de ranura.	`SlotFeatureIdOccurrences`	Contar	Suma (Total)	`FeatureId`, , `Mode`, `RunId`	PT1M	Sí

Categoría: FeatureCardinality

Métrica	Nombre en la API de REST	Unidad	Agregación	Dimensiones	Granulos de tiempo	Exportación de DS
Cardinalidad de características por acción Cardinalidad de las características basada en la acción.	`FeatureCardinality_Action`	Contar	Promedio	`FeatureId`, , `Mode`, `RunId`	PT1M	Sí
Cardinalidad de funciones por contexto Cardinalidad de las funciones basada en el contexto.	`FeatureCardinality_Context`	Contar	Promedio	`FeatureId`, , `Mode`, `RunId`	PT1M	Sí
Cardinalidad de características por ranura Cardinalidad de las características basada en la ranura.	`FeatureCardinality_Slot`	Contar	Promedio	`FeatureId`, , `Mode`, `RunId`	PT1M	Sí

Categoría: Características por evento

Métrica	Nombre en la API de REST	Unidad	Agregación	Dimensiones	Granulos de tiempo	Exportación de DS
Características de acción por evento Número medio de características de acción por evento.	`ActionFeaturesPerEvent`	Contar	Promedio	`Mode`, `RunId`	PT1M	Sí
Características de contexto por evento Número de características de contexto por evento.	`ContextFeaturesPerEvent`	Contar	Promedio	`Mode`, `RunId`	PT1M	Sí
Características de las Tragamonedas por Evento Número promedio de características de ranura por evento.	`SlotFeaturesPerEvent`	Contar	Promedio	`Mode`, `RunId`	PT1M	Sí

Categoría: Idioma - Trabajos

Métrica	Nombre en la API de REST	Unidad	Agregación	Dimensiones	Granulos de tiempo	Exportación de DS
Duración del trabajo (versión preliminar) Nota: este valor depende en gran medida del tamaño de entrada, el número de documentos y la complejidad de la tarea. Se trata de un valor agregado en todas las tareas de trabajo.	`JobDuration`	Milisegundos	Mínimo, Máximo, Promedio	`JobStatus`, `JobType`	PT1M	Sí

Categoría: Modelos: solicitudes HTTP

Métrica	Nombre en la API de REST	Unidad	Agregación	Dimensiones	Granulos de tiempo	Exportación de DS
Tasa de disponibilidad del modelo Porcentaje de disponibilidad con el cálculo siguiente: (total de llamadas - errores del servidor) / total de llamadas. Los errores del servidor incluyen las respuestas HTTP >=500.	`ModelAvailabilityRate`	Porcentaje	Mínimo, Máximo, Promedio	`Region`, `ModelDeploymentName`, , `ModelName`, `ModelVersion`	PT1M	No
Solicitudes de modelo Número de llamadas realizadas a la API de modelo durante un período de tiempo. Se aplica a las implementaciones PTU, administradas por PTU y de pago por uso.	`ModelRequests`	Contar	Suma (Total)	`ApiName`, `OperationName`, `Region`, `StreamType`, `ModelDeploymentName`, `ModelName`, , `ModelVersionStatusCode`	PT1M	Sí

Categoría: Modelos - Latencia

Métrica	Nombre en la API de REST	Unidad	Agregación	Dimensiones	Granulos de tiempo	Exportación de DS
Tiempo entre tokens Para las solicitudes de streaming; Tasa de generación de tokens de modelo, medida en milisegundos. Se aplica a las PTU y a las implementaciones administradas por PTU.	`NormalizedTimeBetweenTokens`	Milisegundos	Máximo, mínimo, promedio	`ApiName`, `OperationName`, `Region`, `StreamType`, `ModelDeploymentName`, , `ModelNameModelVersion`	PT1M	Sí
Tiempo normalizado a primer byte Para las solicitudes de streaming y no streaming, el tiempo que tarda en recibirse el primer byte de los datos de respuesta después de que el modelo realiza la solicitud, normalizado por token. Se aplica a las implementaciones PTU, administradas por PTU y de pago por uso.	`NormalizedTimeToFirstToken`	Milisegundos	Máximo, mínimo, promedio	`ApiName`, `OperationName`, `Region`, `StreamType`, `ModelDeploymentName`, , `ModelNameModelVersion`	PT1M	Sí
Tiempo hasta el último byte Para las solicitudes de streaming y no streaming; tiempo que tarda el último byte de los datos de respuesta en recibirse después de que el modelo realice la solicitud. Se aplica a las implementaciones PTU, administradas por PTU y de pago por uso.	`TimeToLastByte`	Milisegundos	Máximo, mínimo, promedio	`ApiName`, `OperationName`, `Region`, `StreamType`, `ModelDeploymentName`, , `ModelNameModelVersion`	PT1M	Sí
Tiempo de respuesta Tiempo de respuesta: medida de latencia recomendada (capacidad de respuesta) para las solicitudes de streaming. Se aplica a las PTU y a las implementaciones administradas por PTU. Se calcula como el tiempo necesario para que la primera respuesta aparezca después de que un usuario envíe una solicitud, según lo mida la puerta de enlace de API. Este número aumenta a medida que aumenta el tamaño de la solicitud o se reduzca el tamaño de aciertos de caché. Para desglosar el tiempo de la métrica de respuesta, puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName, ModelName y ModelVersion. Nota: Esta métrica es una aproximación, ya que la latencia medida depende en gran medida de varios factores, incluidas las llamadas simultáneas y el patrón general de carga de trabajo. Además, no tiene en cuenta ninguna latencia del lado cliente que pueda existir entre el cliente y el punto de conexión de API. Consulte su propio registro para obtener un seguimiento óptimo de la latencia.	`TimeToResponse`	Milisegundos	Mínimo, Máximo, Promedio	`ApiName`, `OperationName`, `Region`, `StreamType`, `ModelDeploymentName`, `ModelName`, , `ModelVersionStatusCode`	PT1M	Sí
Tokens por segundo Enumera la velocidad de generación de una respuesta de modelo determinada. El número total de tokens generados se divide por el tiempo para generar los tokens, en segundos. Se aplica a las PTU y a las implementaciones administradas por PTU.	`TokensPerSecond`	Contar	Máximo, mínimo, promedio	`ApiName`, `OperationName`, `Region`, `StreamType`, `ModelDeploymentName`, , `ModelNameModelVersion`	PT1M	Sí

Categoría: Modelos- Uso

Métrica	Nombre en la API de REST	Unidad	Agregación	Dimensiones	Granulos de tiempo	Exportación de DS
Tokens de entrada Número de tokens de solicitud procesados (entrada) en un modelo. Se aplica a las implementaciones PTU, administradas por PTU y de pago por uso.	`InputTokens`	Contar	Suma (Total)	`ApiName`, `Region`, `ModelDeploymentName`, , `ModelName`, `ModelVersion`	PT1M	Sí
Tokens de salida Número de tokens generados (salida) a partir de un modelo de OpenAI. Se aplica a las implementaciones PTU, administradas por PTU y de pago por uso.	`OutputTokens`	Contar	Suma (Total)	`ApiName`, `Region`, `ModelDeploymentName`, , `ModelName`, `ModelVersion`	PT1M	Sí
Uso aprovisionado Porcentaje de uso para una implementación administrada provisionada, se calcula como (PTUs consumidas / PTUs implementadas) x 100. Cuando el uso es mayor o igual que 100 %, se limitan las llamadas y se devuelve el código de error 429.	`ProvisionedUtilization`	Porcentaje	Mínimo, Máximo, Promedio	`Region`, `ModelDeploymentName`, , `ModelName`, `ModelVersion`	PT1M	No
Total Tokens Número de tokens de inferencia procesados en un modelo. Se calcula como tokens de solicitud (entrada) más tokens generados (salida). Se aplica a las implementaciones PTU, administradas por PTU y de pago por uso.	`TotalTokens`	Contar	Suma (Total)	`ApiName`, `Region`, `ModelDeploymentName`, , `ModelName`, `ModelVersion`	PT1M	Sí

Categoría: Espacios de nombres por evento

Métrica	Nombre en la API de REST	Unidad	Agregación	Dimensiones	Granulos de tiempo	Exportación de DS
Espacios de nombres de acción por eventos Número promedio de espacios de nombres de acción por evento.	`ActionNamespacesPerEvent`	Contar	Promedio	`Mode`, `RunId`	PT1M	Sí
Espacios de nombres de contexto por eventos Número de espacios de nombres de contexto por evento.	`ContextNamespacesPerEvent`	Contar	Promedio	`Mode`, `RunId`	PT1M	Sí
Espacios de nombres de ranura por eventos Número promedio de espacios de nombres de ranura por evento.	`SlotNamespacesPerEvent`	Contar	Promedio	`Mode`, `RunId`	PT1M	Sí

Categoría: Recompensas

Métrica	Nombre en la API de REST	Unidad	Agregación	Dimensiones	Granulos de tiempo	Exportación de DS
Promedio de recompensas por evento Recompensa media por evento.	`Reward`	Contar	Promedio	`BaselineAction`, `ChosenActionId`, `MatchesBaseline`, `NonDefaultReward`, , `Mode`, `RunId`	PT1M	Sí
Recompensa de tragamonedas Recompensa por ranura.	`SlotReward`	Contar	Promedio	`BaselineActionId`, `ChosenActionId`, `MatchesBaseline`, `NonDefaultReward`, `SlotId`, `SlotIndex`, , `ModeRunId`	PT1M	Sí

Categoría: Tragamonedas

Métrica	Nombre en la API de REST	Unidad	Agregación	Dimensiones	Granulos de tiempo	Exportación de DS
Recompensa general del estimador de línea base Recompensa general del estimador de línea de base.	`BaselineEstimatorOverallReward`	Contar	Promedio	`Mode`, `RunId`	PT1M	Sí
Recompensa de ranura de estimador de línea base Recompensa del estimador de línea de base por ranura.	`BaselineEstimatorSlotReward`	Contar	Promedio	`SlotId`, `SlotIndex`, , `Mode`, `RunId`	PT1M	Sí
Recompensa general del estimador aleatorio de línea base Recompensa general del estimador aleatorio de línea base.	`BaselineRandomEstimatorOverallReward`	Contar	Promedio	`Mode`, `RunId`	PT1M	Sí
Recompensa de ranura de estimador aleatorio de línea base Recompensa del estimador aleatorio de línea base por ranura.	`BaselineRandomEstimatorSlotReward`	Contar	Promedio	`SlotId`, `SlotIndex`, , `Mode`, `RunId`	PT1M	Sí
Ranuras Número de plazas por evento.	`NumberOfSlots`	Contar	Promedio	`Mode`, `RunId`	PT1M	Sí
Recompensa general del estimador en línea Recompensa general del estimador en línea.	`OnlineEstimatorOverallReward`	Contar	Promedio	`Mode`, `RunId`	PT1M	Sí
Recompensa de ranura de estimador en línea Recompensa del estimador en línea por ranura.	`OnlineEstimatorSlotReward`	Contar	Promedio	`SlotId`, `SlotIndex`, , `Mode`, `RunId`	PT1M	Sí
Ocurrencias de ranuras Número de veces que aparece cada ranura.	`SlotIdOccurrences`	Contar	Suma (Total)	`SlotId`, `SlotIndex`, , `Mode`, `RunId`	PT1M	Sí

Categoría: SpeechServices - Uso

Métrica	Nombre en la API de REST	Unidad	Agregación	Dimensiones	Granulos de tiempo	Exportación de DS
Segundos de audio transcritos Número de segundos transcritos.	`AudioSecondsTranscribed`	Contar	Suma (Total)	`ApiName`, `FeatureName`, , `UsageChannel`, `Region`	PT1M	Sí
Segundos de audio traducidos Número de segundos traducidos.	`AudioSecondsTranslated`	Contar	Suma (Total)	`ApiName`, `FeatureName`, , `UsageChannel`, `Region`	PT1M	Sí
Segundos de hosting del modelo de avatar Número de segundos.	`AvatarModelHostingSeconds`	Contar	Suma (Total)	`ApiName`, `FeatureName`, , `UsageChannel`, `Region`	PT1M	Sí
Segundos de entrenamiento del modelo de Avatar Número de segundos.	`AvatarModelTrainingSeconds`	Contar	Suma (Total)	`ApiName`, `FeatureName`, , `UsageChannel`, `Region`	PT1M	Sí
Número de perfiles de hablante Número de perfiles de hablante inscritos. Se prorratea cada hora.	`NumberofSpeakerProfiles`	Contar	Suma (Total)	`ApiName`, `FeatureName`, , `UsageChannel`, `Region`	PT1M	Sí
Transacciones de Reconocimiento de Voz Número de transacciones de reconocimiento del hablante.	`SpeakerRecognitionTransactions`	Contar	Suma (Total)	`ApiName`, `FeatureName`, , `UsageChannel`, `Region`	PT1M	Sí
Horas de hospedaje del modelo de voz Número de horas de hospedaje del modelo de voz.	`SpeechModelHostingHours`	Contar	Suma (Total)	`ApiName`, `FeatureName`, , `UsageChannel`, `Region`	PT1M	Sí
Caracteres sintetizados Número de caracteres.	`SynthesizedCharacters`	Contar	Suma (Total)	`ApiName`, `FeatureName`, , `UsageChannel`, `Region`	PT1M	Sí
Segundos de vídeo sintetizados Número de segundos sintetizados	`VideoSecondsSynthesized`	Contar	Suma (Total)	`ApiName`, `FeatureName`, , `UsageChannel`, `Region`	PT1M	Sí
Horas de alojamiento del modelo de voz Número de horas.	`VoiceModelHostingHours`	Contar	Suma (Total)	`ApiName`, `FeatureName`, , `UsageChannel`, `Region`	PT1M	Sí
Minutos de entrenamiento del modelo de voz Número de minutos.	`VoiceModelTrainingMinutes`	Contar	Suma (Total)	`ApiName`, `FeatureName`, , `UsageChannel`, `Region`	PT1M	Sí

Categoría: uso

Métrica	Nombre en la API de REST	Unidad	Agregación	Dimensiones	Granulos de tiempo	Exportación de DS
Recuento de inferencias Recuento de inferencias del servicio Carnegie Frontdoor	`CarnegieInferenceCount`	Contar	Suma (Total)	`Region`, `Modality`, `Category`, `Language`, , `SeverityLevel`, `UseCustomList`	PT1M	Sí
Caracteres entrenados (en desuso) Número total de caracteres entrenados.	`CharactersTrained`	Contar	Suma (Total)	`ApiName`, , `OperationName`, `Region`	PT1M	Sí
Caracteres traducidos (en desuso) Número total de caracteres de la solicitud entrante de texto.	`CharactersTranslated`	Contar	Suma (Total)	`ApiName`, , `OperationName`, `Region`	PT1M	Sí
Transacciones de Computer Vision Número de transacciones de Computer Vision.	`ComputerVisionTransactions`	Contar	Suma (Total)	`ApiName`, `FeatureName`, , `UsageChannel`, `Region`	PT1M	Sí
Tiempo de entrenamiento de Custom Vision Tiempo de entrenamiento de Custom Vision.	`CustomVisionTrainingTime`	Segundos	Suma (Total)	`ApiName`, `FeatureName`, , `UsageChannel`, `Region`	PT1M	Sí
Transacciones de Custom Vision Número de transacciones de predicción de Custom Vision.	`CustomVisionTransactions`	Contar	Suma (Total)	`ApiName`, `FeatureName`, , `UsageChannel`, `Region`	PT1M	Sí
Caracteres de documento traducidos Número de caracteres en la solicitud de traducción de documentos.	`DocumentCharactersTranslated`	Contar	Suma (Total)	`ApiName`, `FeatureName`, , `UsageChannel`, `Region`	PT1M	Sí
Caracteres personalizados de documento traducidos Número de caracteres en la solicitud de traducción de documentos personalizada.	`DocumentCustomCharactersTranslated`	Contar	Suma (Total)	`ApiName`, `FeatureName`, , `UsageChannel`, `Region`	PT1M	Sí
imágenes de caras entrenadas Número de imágenes entrenadas. 1000 imágenes entrenadas por transacción.	`FaceImagesTrained`	Contar	Suma (Total)	`ApiName`, `FeatureName`, , `UsageChannel`, `Region`	PT1M	Sí
Caras almacenadas Número de caras almacenadas, prorrateado diariamente. El número de caras almacenadas se notifica a diario.	`FacesStored`	Contar	Suma (Total)	`ApiName`, `FeatureName`, , `UsageChannel`, `Region`	PT1M	Sí
Transacciones faciales Número de llamadas API realizadas al servicio Face.	`FaceTransactions`	Contar	Suma (Total)	`ApiName`, `FeatureName`, , `UsageChannel`, `Region`	PT1M	Sí
Imágenes almacenadas Número de imágenes de Custom Vision almacenadas.	`ImagesStored`	Contar	Suma (Total)	`ApiName`, `FeatureName`, , `UsageChannel`, `Region`	PT1M	Sí
Eventos aprendidos Número de eventos aprendidos.	`LearnedEvents`	Contar	Suma (Total)	`IsMatchBaseline`, , `Mode`, `RunId`	PT1M	Sí
Solicitudes de voz de LUIS Número de solicitudes de conversión de voz en intención de LUIS.	`LUISSpeechRequests`	Contar	Suma (Total)	`ApiName`, `FeatureName`, , `UsageChannel`, `Region`	PT1M	Sí
Solicitudes de texto de LUIS Número de solicitudes de texto de LUIS.	`LUISTextRequests`	Contar	Suma (Total)	`ApiName`, `FeatureName`, , `UsageChannel`, `Region`	PT1M	Sí
Recompensas coincidentes Número de recompensas coincidentes.	`MatchedRewards`	Contar	Suma (Total)	`Mode`, `RunId`	PT1M	Sí
Eventos no activados Número de eventos omitidos.	`NonActivatedEvents`	Contar	Suma (Total)	`Mode`, `RunId`	PT1M	Sí
Recompensas observadas Número de recompensas observadas.	`ObservedRewards`	Contar	Suma (Total)	`Mode`, `RunId`	PT1M	Sí
Caracteres de sincronización de documentos traducidos Número de caracteres en la solicitud de traducción de documentos (sincrónica).	`OneDocumentCharactersTranslated`	Contar	Suma (Total)	`ApiName`, `FeatureName`, , `UsageChannel`, `Region`	PT1M	Sí
Caracteres personalizados de sincronización de documentos traducidos Número de caracteres en la solicitud de traducción de documentos personalizada (sincrónica).	`OneDocumentCustomCharactersTranslated`	Contar	Suma (Total)	`ApiName`, `FeatureName`, , `UsageChannel`, `Region`	PT1M	Sí
Caracteres procesados Número de caracteres procesados por Immersive Reader.	`ProcessedCharacters`	Contar	Suma (Total)	`ApiName`, `FeatureName`, , `UsageChannel`, `Region`	PT1M	Sí
Registros de texto de estado procesados Número de registros de texto de estado procesados	`ProcessedHealthTextRecords`	Contar	Suma (Total)	`ApiName`, `FeatureName`, , `UsageChannel`, `Region`	PT1M	Sí
Imágenes procesadas Número de imágenes procesadas.	`ProcessedImages`	Contar	Suma (Total)	`ApiName`, `FeatureName`, , `UsageChannel`, `Region`	PT1M	Sí
Páginas procesadas Número de páginas procesadas.	`ProcessedPages`	Contar	Suma (Total)	`ApiName`, `FeatureName`, , `UsageChannel`, `Region`	PT1M	Sí
Registros de texto procesados Número de registros de texto.	`ProcessedTextRecords`	Contar	Suma (Total)	`ApiName`, `FeatureName`, , `UsageChannel`, `Region`	PT1M	Sí
Registros de texto de QA Número de registros de texto procesados	`QuestionAnsweringTextRecords`	Contar	Suma (Total)	`ApiName`, `FeatureName`, , `UsageChannel`, `Region`	PT1M	Sí
Duración de la sesión de voz (en desuso) Duración total de la sesión de voz en segundos.	`SpeechSessionDuration`	Segundos	Suma (Total)	`ApiName`, , `OperationName`, `Region`	PT1M	Sí
Caracteres de texto traducidos Número de caracteres en la solicitud entrante de traducción de texto.	`TextCharactersTranslated`	Contar	Suma (Total)	`ApiName`, `FeatureName`, , `UsageChannel`, `Region`	PT1M	Sí
Caracteres personalizados de texto traducidos Número de caracteres en la solicitud entrante personalizada de traducción de texto.	`TextCustomCharactersTranslated`	Contar	Suma (Total)	`ApiName`, `FeatureName`, , `UsageChannel`, `Region`	PT1M	Sí
Caracteres entrenados de texto Número de caracteres entrenados mediante la traducción de texto.	`TextTrainedCharacters`	Contar	Suma (Total)	`ApiName`, `FeatureName`, , `UsageChannel`, `Region`	PT1M	Sí
N.º total de eventos Número de eventos.	`TotalEvents`	Contar	Suma (Total)	`Mode`, `RunId`	PT1M	Sí
Total de transacciones (en desuso) Número total de transacciones.	`TotalTransactions`	Contar	Suma (Total)	<ninguno>	PT1M	Sí
Segundos de la aplicación Translator Pro Número de segundos de uso de Translator Pro App.	`TranslatorProAppSeconds`	Segundos	Suma (Total)	`ApiName`, `FeatureName`, , `UsageChannel`, `Region`	PT1M	Sí

Dimensiones de métricas

Para obtener más información sobre las dimensiones de métricas, consulte Métricas multidimensionales.

Este servicio tiene las siguientes dimensiones asociadas a sus métricas.

ApiName
FeatureName (Nombre de la caracter
ModelDeploymentName
NombreDelModelo
ModelVersion
NombreDeOperación
Región
Código de estado
StreamType (Tipo de arroyo)
UsageChannel

Registros de recursos

En esta sección se enumeran los tipos de registros de recursos que se pueden recopilar para este servicio. La sección extrae de la lista de todos los tipos de categorías de registros admitidos en Azure Monitor.

Registros de recursos admitidos para Microsoft.CognitiveServices/accounts

Categoría	Nombre de categoría mostrado	Tabla de registro	Admite el plan de registro básico	Permite la transformación en el momento de la ingesta.	Costes de exportación
`Audit`	Registros de auditoría	AzureDiagnostics Registros procedentes de varios recursos de Azure.	No	No	No
`AzureOpenAIRequestUsage`	Uso de solicitudes openAI de Azure	AzureDiagnostics Registros procedentes de varios recursos de Azure.	No	No	Sí
`RequestResponse`	Registros de solicitud y respuesta	AzureDiagnostics Registros procedentes de varios recursos de Azure.	No	No	No
`Trace`	Registros de seguimiento	AzureDiagnostics Registros procedentes de varios recursos de Azure.	No	No	No

Tablas de registros de Azure Monitor

En esta sección, se enumeran todas las tablas de registros de Azure Monitor relacionadas con este servicio y que están disponibles para consulta mediante Log Analytics con consultas de Kusto. Las tablas contienen datos de registro de recursos y, posiblemente, más dependiendo de lo que se recopila y se enrutan a ellos.

Azure OpenAI microsoft.cognitiveservices/accounts

Registro de actividad

En la tabla vinculada se enumeran las operaciones que se pueden registrar en el registro de actividad de este servicio. Estas operaciones son un subconjunto de todas las posibles operaciones del proveedor de recursos en el registro de actividad.

Para obtener más información sobre el esquema de las entradas del registro de actividad, consulte Esquema del registro de actividad.

Operaciones del proveedor de recursos de INTELIGENCIA ARTIFICIAL y aprendizaje automático

Consulte Supervisión de Azure OpenAI para obtener una descripción de la supervisión de Azure OpenAI.
Consulte Supervisión de los recursos de Azure con Azure Monitor para obtener información sobre la supervisión de los recursos de Azure.