Compartir a través de


Referencia de datos de supervisión de Azure OpenAI

Este artículo contiene toda la información de referencia de supervisión de este servicio.

Consulte Supervisión de Azure OpenAI para más información sobre los datos que puede recopilar para Azure OpenAI en azure AI Foundry Models y cómo usarlo.

Métricas

En esta sección se indican todas las métricas de la plataforma recopiladas automáticamente para este servicio. Estas métricas también forman parte de la lista global de todas las métricas de plataforma admitidas en Azure Monitor.

Para obtener información sobre la retención de métricas, consulte Información general sobre las métricas de Azure Monitor.

Métricas admitidas para Microsoft.CognitiveServices/accounts

Estas son las métricas más importantes que creemos que debe supervisar para Azure OpenAI. Más adelante en este artículo se muestra una lista más larga de todas las métricas disponibles para este espacio de nombres que contiene más detalles sobre las métricas de esta lista más corta. Consulte la lista siguiente para obtener la información más actualizada. Estamos trabajando para actualizar las tablas en las secciones siguientes.

  • Solicitudes de Azure OpenAI
  • Tokens activos
  • Tokens de finalización generados
  • Horas de entrenamiento de FineTuned procesadas
  • Tokens de inferencia procesados
  • Tokens de solicitud procesados
  • Uso administrado aprovisionado V2
  • Solicitud de tasa de coincidencia de caché de tokens
  • Tiempo de respuesta
  • Tiempo entre tokens
  • Hora a último byte
  • Tiempo normalizado a primer byte
  • Tokens por segundo

También puede supervisar las métricas de seguridad de contenido que usan otros servicios relacionados.

  • Volumen bloqueado
  • Volumen dañino detectado
  • Recuento de usuarios potencialmente abusivos
  • Evento del sistema de seguridad
  • Total de volumen enviado para comprobación de seguridad

Nota:

La métrica Uso administrado aprovisionado está en desuso y ya no se recomienda. Esta métrica se reemplazó por la métrica Uso administrado aprovisionado V2. Los tokens por segundo, el tiempo de respuesta, el tiempo entre tokens no están disponibles actualmente para las implementaciones estándar.

Las métricas de Cognitive Services tienen la categoría Cognitive Services: solicitudes HTTP en la tabla siguiente. Estas métricas son métricas heredadas que son comunes a todos los recursos de este tipo. Microsoft ya no recomienda usar estas métricas con Azure OpenAI.

En la tabla siguiente se enumeran las métricas disponibles para el tipo de recurso Microsoft.CognitiveServices/accounts.

  • Es posible que todas las columnas no estén presentes en todas las tablas.
  • Es posible que algunas columnas estén fuera del área de visualización de la página. Seleccione Expandir tabla para ver todas las columnas disponibles.

Encabezados de tabla

  • Categoría: el grupo de métricas o la clasificación.
  • Métrica: el nombre de presentación de la métrica tal como aparece en el portal de Azure.
  • Nombre en la API REST: el nombre de la métrica por el que se conoce en la API REST.
  • Unidad: unidad de medida.
  • Agregación: el tipo de agregación predeterminado. Valores válidos: promedio (Avg), mínimo (Min), máximo (Max), total (Sum), recuento.
  • Dimensiones - : dimensiones disponibles para la métrica.
  • Intervalos de agregación - : intervalos en los que se obtiene una muestra de la métrica. Por ejemplo, PT1M indica que la métrica se muestrea cada minuto, PT30M cada 30 minutos, PT1H cada hora, etc.
  • Exportación de DS: indica si la métrica se puede exportar a los registros de Azure Monitor a través de la configuración de diagnóstico. Para obtener más información, consulte Creación de configuración de diagnóstico en Azure Monitor.

Categoría: Acciones

Métrica Nombre en la API de REST Unidad Agregación Dimensiones Granulos de tiempo Exportación de DS
Ocurrencias de acciones

Número de veces que aparece cada acción.
ActionIdOccurrences Contar Suma (Total) ActionId, , Mode, RunId PT1M
Acciones por evento

Número de acciones por evento.
ActionsPerEvent Contar Promedio Mode, RunId PT1M

Categoría: Azure OpenAI: solicitudes HTTP

Métrica Nombre en la API de REST Unidad Agregación Dimensiones Granulos de tiempo Exportación de DS
Azure OpenAI AvailabilityRate

Porcentaje de disponibilidad con el cálculo siguiente: (total de llamadas - errores del servidor) / total de llamadas. Los errores del servidor incluyen las respuestas HTTP >=500.
AzureOpenAIAvailabilityRate Porcentaje Mínimo, Máximo, Promedio ApiName, OperationName, Region, StreamType, ModelDeploymentName, , ModelNameModelVersion PT1M No
Solicitudes de Azure OpenAI

Número de llamadas realizadas a la API de Azure OpenAI durante un período de tiempo. Se aplica a las implementaciones PTU, administradas por PTU y de pago por uso. Para desglosar las solicitudes de API, puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName, ModelName, ModelVersion, StatusCode (correcto, clienterrors, errores de servidor), StreamType (solicitudes de streaming frente a solicitudes que no son de streaming) y operación.
AzureOpenAIRequests Contar Suma (Total) ApiName, OperationName, Region, StreamType, ModelDeploymentName, ModelName, , ModelVersionStatusCode PT1M

Categoría: Azure OpenAI- Latencia

Métrica Nombre en la API de REST Unidad Agregación Dimensiones Granulos de tiempo Exportación de DS
Tiempo entre token

Para las solicitudes de streaming; tasa de generación de tokens de modelo, medida en milisegundos. Se aplica a las implementaciones PTU, administradas por PTU y de pago por uso.
AzureOpenAINormalizedTBTInMS Milisegundos Máximo, mínimo, promedio Region, ModelDeploymentName, , ModelName, ModelVersion PT1M
Tiempo normalizado a primer byte

Para las solicitudes de streaming y no streaming, el tiempo que tarda en recibirse el primer byte de los datos de respuesta después de que el modelo realiza la solicitud, normalizado por token. Se aplica a las implementaciones PTU, administradas por PTU y de pago por uso.
AzureOpenAINormalizedTTFTInMS Milisegundos Máximo, mínimo, promedio Region, ModelDeploymentName, , ModelName, ModelVersion PT1M
Tiempo de respuesta

Tiempo de respuesta: medida de latencia recomendada (capacidad de respuesta) para las solicitudes de streaming. Se aplica a las implementaciones PTU, administradas por PTU y de pago por uso. Se calcula como el tiempo necesario para que la primera respuesta aparezca después de que un usuario envíe una solicitud, según lo mida la puerta de enlace de API. Este número aumenta a medida que aumenta el tamaño de la solicitud o se reduzca el tamaño de aciertos de caché. Para desglosar el tiempo de la métrica de respuesta, puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName, ModelName y ModelVersion.

Nota: Esta métrica es una aproximación, ya que la latencia medida depende en gran medida de varios factores, incluidas las llamadas simultáneas y el patrón general de carga de trabajo. Además, no tiene en cuenta ninguna latencia del lado cliente que pueda existir entre el cliente y el punto de conexión de API. Consulte su propio registro para obtener un seguimiento óptimo de la latencia.
AzureOpenAITimeToResponse Milisegundos Mínimo, Máximo, Promedio ApiName, OperationName, Region, StreamType, ModelDeploymentName, ModelName, , ModelVersionStatusCode PT1M
Tokens por segundo

Enumera la velocidad de generación de una respuesta de modelo de Azure OpenAI determinada. El número total de tokens generados se divide por el tiempo para generar los tokens, en segundos. Se aplica a las implementaciones PTU, administradas por PTU y de pago por uso.
AzureOpenAITokenPerSecond Contar Máximo, mínimo, promedio Region, ModelDeploymentName, , ModelName, ModelVersion PT1M
Tiempo hasta el último byte

Para las solicitudes de streaming y no streaming; tiempo que tarda el último byte de los datos de respuesta en recibirse después de que el modelo realice la solicitud. Se aplica a las implementaciones PTU, administradas por PTU y de pago por uso.
AzureOpenAITTLTInMS Milisegundos Máximo, mínimo, promedio Region, ModelDeploymentName, , ModelName, ModelVersion PT1M

Categoría: Azure OpenAI- Uso

Métrica Nombre en la API de REST Unidad Agregación Dimensiones Granulos de tiempo Exportación de DS
Tokens activos

Total de tokens menos los tokens almacenados en caché durante un período de tiempo. Se aplica a las PTU y a las implementaciones administradas por PTU. Utiliza esta métrica para comprender la utilización basada en TPS o TPM de las PTU y compáralo con tus puntos de referencia para el TPS o TPM objetivo en tus escenarios. Para desglosar las solicitudes de API, puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName, ModelName y ModelVersion.
ActiveTokens Contar Mínimo, Máximo, Promedio, Total (Suma) Region, ModelDeploymentName, , ModelName, ModelVersion PT1M
Indicadores de finalización de audio

Número de tokens de solicitud de audio generados (salida) en un modelo de OpenAI. Se aplica a las implementaciones gestionadas por PTU y al modelo de pago por uso.
AudioCompletionTokens Contar Suma (Total) ModelDeploymentName, ModelName, , ModelVersion, Region PT1M
Tokens de solicitud de audio

Número de tokens de solicitud de audio procesados (entrada) en un modelo de OpenAI. Se aplica a las implementaciones gestionadas por PTU y al modelo de pago por uso.
AudioPromptTokens Contar Suma (Total) ModelDeploymentName, ModelName, , ModelVersion, Region PT1M
Tasa de coincidencia de caché de tokens de solicitud

Porcentaje de tokens de solicitud que alcanzan la memoria caché. Se aplica a las PTU y a las implementaciones administradas por PTU.
AzureOpenAIContextTokensCacheMatchRate Porcentaje Mínimo, Máximo, Promedio Region, ModelDeploymentName, , ModelName, ModelVersion PT1M No
Uso administrado aprovisionado (en desuso)

Porcentaje de uso para una implementación administrada provisionada, se calcula como (PTUs consumidas / PTUs implementadas) x 100. Cuando el uso es mayor o igual que 100 %, se limitan las llamadas y se devuelve el código de error 429. Para desglosar esta métrica, puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName, ModelName, ModelVersion y StreamType (solicitudes de streaming frente a no streaming).
AzureOpenAIProvisionedManagedUtilization Porcentaje Mínimo, Máximo, Promedio Region, StreamType, ModelDeploymentName, , ModelName, ModelVersion PT1M No
Uso administrado aprovisionado V2

Porcentaje de uso para una implementación administrada provisionada, se calcula como (PTUs consumidas / PTUs implementadas) x 100. Cuando el uso es mayor o igual que 100 %, se limitan las llamadas y se devuelve el código de error 429. Para desglosar esta métrica, puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName, ModelName, ModelVersion y StreamType (solicitudes de streaming frente a no streaming).
AzureOpenAIProvisionedManagedUtilizationV2 Porcentaje Mínimo, Máximo, Promedio Region, StreamType, ModelDeploymentName, , ModelName, ModelVersion PT1M No
Horas de entrenamiento de FineTuned procesadas

Número de horas de entrenamiento procesadas en un modelo OpenAI FineTuned
FineTunedTrainingHours Contar Suma (Total) ApiName, ModelDeploymentName, FeatureName, , UsageChannel, Region PT1M
Tokens de finalización generados

Número de tokens generados (salida) a partir de un modelo de OpenAI. Se aplica a las implementaciones PTU, administradas por PTU y de pago por uso. Para desglosar esta métrica, puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName y ModelName.
GeneratedTokens Contar Suma (Total) ApiName, ModelDeploymentName, FeatureName, UsageChannel, , Region, ModelVersion PT1M
Tokens de solicitud procesados

Número de tokens de solicitud procesados (entrada) en un modelo de OpenAI. Se aplica a las implementaciones PTU, administradas por PTU y de pago por uso. Para desglosar esta métrica, puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName y ModelName.
ProcessedPromptTokens Contar Suma (Total) ApiName, ModelDeploymentName, FeatureName, UsageChannel, , Region, ModelVersion PT1M
Tokens de inferencia procesados

Número de tokens de inferencia procesados en un modelo de OpenAI. Se calcula como tokens de solicitud (entrada) más tokens generados (salida). Se aplica a las implementaciones PTU, administradas por PTU y de pago por uso. Para desglosar esta métrica, puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName y ModelName.
TokenTransaction Contar Suma (Total) ApiName, ModelDeploymentName, FeatureName, UsageChannel, , Region, ModelVersion PT1M

Categoría: Servicios Cognitivos - Solicitudes HTTP

Métrica Nombre en la API de REST Unidad Agregación Dimensiones Granulos de tiempo Exportación de DS
Llamadas bloqueadas

Número de llamadas que han superado la tasa o el límite de cuota. No use para Azure OpenAI Service.
BlockedCalls Contar Suma (Total) ApiName, OperationName, , Region, RatelimitKey PT1M
Errores de cliente

Número de llamadas con error interno del lado cliente (código de respuesta HTTP 4xx). No use para Azure OpenAI Service.
ClientErrors Contar Suma (Total) ApiName, OperationName, , Region, RatelimitKey PT1M
Entrada de datos

Tamaño de los datos de entrada en bytes. No use para Azure OpenAI Service.
DataIn Bytes (unidades de información digital) Suma (Total) ApiName, , OperationName, Region PT1M
Salida de datos

Tamaño de los datos de salida en bytes. No use para Azure OpenAI Service.
DataOut Bytes (unidades de información digital) Suma (Total) ApiName, , OperationName, Region PT1M
Latencia

Latencia en milisegundos. No use para Azure OpenAI Service.
Latency Milisegundos Promedio ApiName, OperationName, , Region, RatelimitKey PT1M
Ratelimit

El límite de frecuencia actual de la clave ratelimit. No use para Azure OpenAI Service.
Ratelimit Contar Suma (Total) Region, RatelimitKey PT1M
Errores del servidor

Número de llamadas con error interno del servicio (código de respuesta HTTP 5xx). No use para Azure OpenAI Service.
ServerErrors Contar Suma (Total) ApiName, OperationName, , Region, RatelimitKey PT1M
Llamadas exitosas

Número de llamadas exitosas. No use para Azure OpenAI Service.
SuccessfulCalls Contar Suma (Total) ApiName, OperationName, , Region, RatelimitKey PT1M
Total de llamadas

Número total de llamadas. No use para Azure OpenAI Service.
TotalCalls Contar Suma (Total) ApiName, OperationName, , Region, RatelimitKey PT1M
Total de errores

Número total de llamadas con respuesta de error (código de respuesta HTTP 4xx o 5xx). No use para Azure OpenAI Service.
TotalErrors Contar Suma (Total) ApiName, OperationName, , Region, RatelimitKey PT1M
Llamadas de token totales

Número total de llamadas de token.
TotalTokenCalls Contar Suma (Total) ApiName, , OperationName, Region PT1M

Categoría: Cognitive Services - SLI

Métrica Nombre en la API de REST Unidad Agregación Dimensiones Granulos de tiempo Exportación de DS
AvailabilityRate

Porcentaje de disponibilidad con el cálculo siguiente: (total de llamadas - errores del servidor) / total de llamadas. Los errores del servidor incluyen las respuestas HTTP >=500. No use para Azure OpenAI Service.
SuccessRate Porcentaje Mínimo, Máximo, Promedio ApiName, OperationName, , Region, RatelimitKey PT1M No

Categoría: ContentSafety - Riesgos y seguridad

Métrica Nombre en la API de REST Unidad Agregación Dimensiones Granulos de tiempo Exportación de DS
Recuento de usuarios potencialmente abusivos

Número de usuarios potencialmente abusivos que detectaron durante un período de tiempo. Puede agregar un filtro o aplicar la división mediante la siguiente dimensión: ModelDeploymentName.
RAIAbusiveUsersCount Contar Suma (Total) Region, ModelDeploymentName PT1M
Volumen dañino detectado

Número de llamadas realizadas a la API de Azure OpenAI y detectadas como perjudiciales (tanto el modelo de bloque como el modo de anotación) por filtro de contenido aplicado durante un período de tiempo. Puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName, ModelName y TextType.
RAIHarmfulRequests Contar Suma (Total) Region, ModelDeploymentName, ModelName, ModelVersion, ApiName, TextType, , CategorySeverity PT1M
Volumen bloqueado

Número de llamadas realizadas a la API de Azure OpenAI y rechazadas por el filtro de contenido aplicado durante un período de tiempo. Puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName, ModelName y TextType.
RAIRejectedRequests Contar Suma (Total) Region, ModelDeploymentName, ModelName, ModelVersion, ApiName, , TextTypeCategory PT1M
Evento del sistema de seguridad

Evento del sistema para riesgos y supervisión de seguridad. Puede agregar un filtro o aplicar la división mediante la siguiente dimensión: EventType.
RAISystemEvent Contar Promedio Region, EventType PT1M
Número total de volúmenes enviados para la comprobación de seguridad

Número de llamadas realizadas a la API de Azure OpenAI y detectadas por el filtro de contenido aplicado durante un período de tiempo. Puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName, ModelName.
RAITotalRequests Contar Suma (Total) Region, ModelDeploymentName, ModelName, , ModelVersion, ApiName PT1M

Categoría: Seguridad de Contenidos - Uso

Métrica Nombre en la API de REST Unidad Agregación Dimensiones Granulos de tiempo Exportación de DS
Recuento de llamadas para la moderación de imágenes

Número de llamadas para la moderación de imágenes.
ContentSafetyImageAnalyzeRequestCount Contar Suma (Total) ApiVersion PT1M
Recuento de llamadas para moderación de texto

Número de llamadas para la moderación de texto.
ContentSafetyTextAnalyzeRequestCount Contar Suma (Total) ApiVersion PT1M

Categoría: Estimaciones

Métrica Nombre en la API de REST Unidad Agregación Dimensiones Granulos de tiempo Exportación de DS
Recuento de eventos aleatorios de línea base

Estimación del número de eventos aleatorios de línea de base.
BaselineRandomEventCount Contar Suma (Total) Mode, RunId PT1M
Recompensa aleatoria base

Estimación de la recompensa aleatoria inicial.
BaselineRandomReward Contar Suma (Total) Mode, RunId PT1M
Recuento de eventos en línea

Estimación del recuento de eventos en línea.
OnlineEventCount Contar Suma (Total) Mode, RunId PT1M
Recompensa en línea

Estimación de la recompensa en línea.
OnlineReward Contar Suma (Total) Mode, RunId PT1M
Recuento de eventos de referencia de usuario

Estimación del número de eventos de línea de base definidos por el usuario.
UserBaselineEventCount Contar Suma (Total) Mode, RunId PT1M
Recompensa de referencia del usuario

Estimación de la recompensa de línea de base definida por el usuario.
UserBaselineReward Contar Suma (Total) Mode, RunId PT1M

Categoría: Ocurrencias de características

Métrica Nombre en la API de REST Unidad Agregación Dimensiones Granulos de tiempo Exportación de DS
Ocurrencias de característica de acción

Número de veces que aparece cada característica de acción.
ActionFeatureIdOccurrences Contar Suma (Total) FeatureId, , Mode, RunId PT1M
Apariciones de características del contexto

Número de veces que aparece cada característica de contexto.
ContextFeatureIdOccurrences Contar Suma (Total) FeatureId, , Mode, RunId PT1M
Ocurrencias de característica de ranura

Número de veces que aparece cada característica de ranura.
SlotFeatureIdOccurrences Contar Suma (Total) FeatureId, , Mode, RunId PT1M

Categoría: FeatureCardinality

Métrica Nombre en la API de REST Unidad Agregación Dimensiones Granulos de tiempo Exportación de DS
Cardinalidad de características por acción

Cardinalidad de las características basada en la acción.
FeatureCardinality_Action Contar Promedio FeatureId, , Mode, RunId PT1M
Cardinalidad de funciones por contexto

Cardinalidad de las funciones basada en el contexto.
FeatureCardinality_Context Contar Promedio FeatureId, , Mode, RunId PT1M
Cardinalidad de características por ranura

Cardinalidad de las características basada en la ranura.
FeatureCardinality_Slot Contar Promedio FeatureId, , Mode, RunId PT1M

Categoría: Características por evento

Métrica Nombre en la API de REST Unidad Agregación Dimensiones Granulos de tiempo Exportación de DS
Características de acción por evento

Número medio de características de acción por evento.
ActionFeaturesPerEvent Contar Promedio Mode, RunId PT1M
Características de contexto por evento

Número de características de contexto por evento.
ContextFeaturesPerEvent Contar Promedio Mode, RunId PT1M
Características de las Tragamonedas por Evento

Número promedio de características de ranura por evento.
SlotFeaturesPerEvent Contar Promedio Mode, RunId PT1M

Categoría: Idioma - Trabajos

Métrica Nombre en la API de REST Unidad Agregación Dimensiones Granulos de tiempo Exportación de DS
Duración del trabajo (versión preliminar)

Nota: este valor depende en gran medida del tamaño de entrada, el número de documentos y la complejidad de la tarea. Se trata de un valor agregado en todas las tareas de trabajo.
JobDuration Milisegundos Mínimo, Máximo, Promedio JobStatus, JobType PT1M

Categoría: Modelos: solicitudes HTTP

Métrica Nombre en la API de REST Unidad Agregación Dimensiones Granulos de tiempo Exportación de DS
Tasa de disponibilidad del modelo

Porcentaje de disponibilidad con el cálculo siguiente: (total de llamadas - errores del servidor) / total de llamadas. Los errores del servidor incluyen las respuestas HTTP >=500.
ModelAvailabilityRate Porcentaje Mínimo, Máximo, Promedio Region, ModelDeploymentName, , ModelName, ModelVersion PT1M No
Solicitudes de modelo

Número de llamadas realizadas a la API de modelo durante un período de tiempo. Se aplica a las implementaciones PTU, administradas por PTU y de pago por uso.
ModelRequests Contar Suma (Total) ApiName, OperationName, Region, StreamType, ModelDeploymentName, ModelName, , ModelVersionStatusCode PT1M

Categoría: Modelos - Latencia

Métrica Nombre en la API de REST Unidad Agregación Dimensiones Granulos de tiempo Exportación de DS
Tiempo entre tokens

Para las solicitudes de streaming; Tasa de generación de tokens de modelo, medida en milisegundos. Se aplica a las PTU y a las implementaciones administradas por PTU.
NormalizedTimeBetweenTokens Milisegundos Máximo, mínimo, promedio ApiName, OperationName, Region, StreamType, ModelDeploymentName, , ModelNameModelVersion PT1M
Tiempo normalizado a primer byte

Para las solicitudes de streaming y no streaming, el tiempo que tarda en recibirse el primer byte de los datos de respuesta después de que el modelo realiza la solicitud, normalizado por token. Se aplica a las implementaciones PTU, administradas por PTU y de pago por uso.
NormalizedTimeToFirstToken Milisegundos Máximo, mínimo, promedio ApiName, OperationName, Region, StreamType, ModelDeploymentName, , ModelNameModelVersion PT1M
Tiempo hasta el último byte

Para las solicitudes de streaming y no streaming; tiempo que tarda el último byte de los datos de respuesta en recibirse después de que el modelo realice la solicitud. Se aplica a las implementaciones PTU, administradas por PTU y de pago por uso.
TimeToLastByte Milisegundos Máximo, mínimo, promedio ApiName, OperationName, Region, StreamType, ModelDeploymentName, , ModelNameModelVersion PT1M
Tiempo de respuesta

Tiempo de respuesta: medida de latencia recomendada (capacidad de respuesta) para las solicitudes de streaming. Se aplica a las PTU y a las implementaciones administradas por PTU. Se calcula como el tiempo necesario para que la primera respuesta aparezca después de que un usuario envíe una solicitud, según lo mida la puerta de enlace de API. Este número aumenta a medida que aumenta el tamaño de la solicitud o se reduzca el tamaño de aciertos de caché. Para desglosar el tiempo de la métrica de respuesta, puede agregar un filtro o aplicar la división por las siguientes dimensiones: ModelDeploymentName, ModelName y ModelVersion.

Nota: Esta métrica es una aproximación, ya que la latencia medida depende en gran medida de varios factores, incluidas las llamadas simultáneas y el patrón general de carga de trabajo. Además, no tiene en cuenta ninguna latencia del lado cliente que pueda existir entre el cliente y el punto de conexión de API. Consulte su propio registro para obtener un seguimiento óptimo de la latencia.
TimeToResponse Milisegundos Mínimo, Máximo, Promedio ApiName, OperationName, Region, StreamType, ModelDeploymentName, ModelName, , ModelVersionStatusCode PT1M
Tokens por segundo

Enumera la velocidad de generación de una respuesta de modelo determinada. El número total de tokens generados se divide por el tiempo para generar los tokens, en segundos. Se aplica a las PTU y a las implementaciones administradas por PTU.
TokensPerSecond Contar Máximo, mínimo, promedio ApiName, OperationName, Region, StreamType, ModelDeploymentName, , ModelNameModelVersion PT1M

Categoría: Modelos- Uso

Métrica Nombre en la API de REST Unidad Agregación Dimensiones Granulos de tiempo Exportación de DS
Tokens de entrada

Número de tokens de solicitud procesados (entrada) en un modelo. Se aplica a las implementaciones PTU, administradas por PTU y de pago por uso.
InputTokens Contar Suma (Total) ApiName, Region, ModelDeploymentName, , ModelName, ModelVersion PT1M
Tokens de salida

Número de tokens generados (salida) a partir de un modelo de OpenAI. Se aplica a las implementaciones PTU, administradas por PTU y de pago por uso.
OutputTokens Contar Suma (Total) ApiName, Region, ModelDeploymentName, , ModelName, ModelVersion PT1M
Uso aprovisionado

Porcentaje de uso para una implementación administrada provisionada, se calcula como (PTUs consumidas / PTUs implementadas) x 100. Cuando el uso es mayor o igual que 100 %, se limitan las llamadas y se devuelve el código de error 429.
ProvisionedUtilization Porcentaje Mínimo, Máximo, Promedio Region, ModelDeploymentName, , ModelName, ModelVersion PT1M No
Total Tokens

Número de tokens de inferencia procesados en un modelo. Se calcula como tokens de solicitud (entrada) más tokens generados (salida). Se aplica a las implementaciones PTU, administradas por PTU y de pago por uso.
TotalTokens Contar Suma (Total) ApiName, Region, ModelDeploymentName, , ModelName, ModelVersion PT1M

Categoría: Espacios de nombres por evento

Métrica Nombre en la API de REST Unidad Agregación Dimensiones Granulos de tiempo Exportación de DS
Espacios de nombres de acción por eventos

Número promedio de espacios de nombres de acción por evento.
ActionNamespacesPerEvent Contar Promedio Mode, RunId PT1M
Espacios de nombres de contexto por eventos

Número de espacios de nombres de contexto por evento.
ContextNamespacesPerEvent Contar Promedio Mode, RunId PT1M
Espacios de nombres de ranura por eventos

Número promedio de espacios de nombres de ranura por evento.
SlotNamespacesPerEvent Contar Promedio Mode, RunId PT1M

Categoría: Recompensas

Métrica Nombre en la API de REST Unidad Agregación Dimensiones Granulos de tiempo Exportación de DS
Promedio de recompensas por evento

Recompensa media por evento.
Reward Contar Promedio BaselineAction, ChosenActionId, MatchesBaseline, NonDefaultReward, , Mode, RunId PT1M
Recompensa de tragamonedas

Recompensa por ranura.
SlotReward Contar Promedio BaselineActionId, ChosenActionId, MatchesBaseline, NonDefaultReward, SlotId, SlotIndex, , ModeRunId PT1M

Categoría: Tragamonedas

Métrica Nombre en la API de REST Unidad Agregación Dimensiones Granulos de tiempo Exportación de DS
Recompensa general del estimador de línea base

Recompensa general del estimador de línea de base.
BaselineEstimatorOverallReward Contar Promedio Mode, RunId PT1M
Recompensa de ranura de estimador de línea base

Recompensa del estimador de línea de base por ranura.
BaselineEstimatorSlotReward Contar Promedio SlotId, SlotIndex, , Mode, RunId PT1M
Recompensa general del estimador aleatorio de línea base

Recompensa general del estimador aleatorio de línea base.
BaselineRandomEstimatorOverallReward Contar Promedio Mode, RunId PT1M
Recompensa de ranura de estimador aleatorio de línea base

Recompensa del estimador aleatorio de línea base por ranura.
BaselineRandomEstimatorSlotReward Contar Promedio SlotId, SlotIndex, , Mode, RunId PT1M
Ranuras

Número de plazas por evento.
NumberOfSlots Contar Promedio Mode, RunId PT1M
Recompensa general del estimador en línea

Recompensa general del estimador en línea.
OnlineEstimatorOverallReward Contar Promedio Mode, RunId PT1M
Recompensa de ranura de estimador en línea

Recompensa del estimador en línea por ranura.
OnlineEstimatorSlotReward Contar Promedio SlotId, SlotIndex, , Mode, RunId PT1M
Ocurrencias de ranuras

Número de veces que aparece cada ranura.
SlotIdOccurrences Contar Suma (Total) SlotId, SlotIndex, , Mode, RunId PT1M

Categoría: SpeechServices - Uso

Métrica Nombre en la API de REST Unidad Agregación Dimensiones Granulos de tiempo Exportación de DS
Segundos de audio transcritos

Número de segundos transcritos.
AudioSecondsTranscribed Contar Suma (Total) ApiName, FeatureName, , UsageChannel, Region PT1M
Segundos de audio traducidos

Número de segundos traducidos.
AudioSecondsTranslated Contar Suma (Total) ApiName, FeatureName, , UsageChannel, Region PT1M
Segundos de hosting del modelo de avatar

Número de segundos.
AvatarModelHostingSeconds Contar Suma (Total) ApiName, FeatureName, , UsageChannel, Region PT1M
Segundos de entrenamiento del modelo de Avatar

Número de segundos.
AvatarModelTrainingSeconds Contar Suma (Total) ApiName, FeatureName, , UsageChannel, Region PT1M
Número de perfiles de hablante

Número de perfiles de hablante inscritos. Se prorratea cada hora.
NumberofSpeakerProfiles Contar Suma (Total) ApiName, FeatureName, , UsageChannel, Region PT1M
Transacciones de Reconocimiento de Voz

Número de transacciones de reconocimiento del hablante.
SpeakerRecognitionTransactions Contar Suma (Total) ApiName, FeatureName, , UsageChannel, Region PT1M
Horas de hospedaje del modelo de voz

Número de horas de hospedaje del modelo de voz.
SpeechModelHostingHours Contar Suma (Total) ApiName, FeatureName, , UsageChannel, Region PT1M
Caracteres sintetizados

Número de caracteres.
SynthesizedCharacters Contar Suma (Total) ApiName, FeatureName, , UsageChannel, Region PT1M
Segundos de vídeo sintetizados

Número de segundos sintetizados
VideoSecondsSynthesized Contar Suma (Total) ApiName, FeatureName, , UsageChannel, Region PT1M
Horas de alojamiento del modelo de voz

Número de horas.
VoiceModelHostingHours Contar Suma (Total) ApiName, FeatureName, , UsageChannel, Region PT1M
Minutos de entrenamiento del modelo de voz

Número de minutos.
VoiceModelTrainingMinutes Contar Suma (Total) ApiName, FeatureName, , UsageChannel, Region PT1M

Categoría: uso

Métrica Nombre en la API de REST Unidad Agregación Dimensiones Granulos de tiempo Exportación de DS
Recuento de inferencias

Recuento de inferencias del servicio Carnegie Frontdoor
CarnegieInferenceCount Contar Suma (Total) Region, Modality, Category, Language, , SeverityLevel, UseCustomList PT1M
Caracteres entrenados (en desuso)

Número total de caracteres entrenados.
CharactersTrained Contar Suma (Total) ApiName, , OperationName, Region PT1M
Caracteres traducidos (en desuso)

Número total de caracteres de la solicitud entrante de texto.
CharactersTranslated Contar Suma (Total) ApiName, , OperationName, Region PT1M
Transacciones de Computer Vision

Número de transacciones de Computer Vision.
ComputerVisionTransactions Contar Suma (Total) ApiName, FeatureName, , UsageChannel, Region PT1M
Tiempo de entrenamiento de Custom Vision

Tiempo de entrenamiento de Custom Vision.
CustomVisionTrainingTime Segundos Suma (Total) ApiName, FeatureName, , UsageChannel, Region PT1M
Transacciones de Custom Vision

Número de transacciones de predicción de Custom Vision.
CustomVisionTransactions Contar Suma (Total) ApiName, FeatureName, , UsageChannel, Region PT1M
Caracteres de documento traducidos

Número de caracteres en la solicitud de traducción de documentos.
DocumentCharactersTranslated Contar Suma (Total) ApiName, FeatureName, , UsageChannel, Region PT1M
Caracteres personalizados de documento traducidos

Número de caracteres en la solicitud de traducción de documentos personalizada.
DocumentCustomCharactersTranslated Contar Suma (Total) ApiName, FeatureName, , UsageChannel, Region PT1M
imágenes de caras entrenadas

Número de imágenes entrenadas. 1000 imágenes entrenadas por transacción.
FaceImagesTrained Contar Suma (Total) ApiName, FeatureName, , UsageChannel, Region PT1M
Caras almacenadas

Número de caras almacenadas, prorrateado diariamente. El número de caras almacenadas se notifica a diario.
FacesStored Contar Suma (Total) ApiName, FeatureName, , UsageChannel, Region PT1M
Transacciones faciales

Número de llamadas API realizadas al servicio Face.
FaceTransactions Contar Suma (Total) ApiName, FeatureName, , UsageChannel, Region PT1M
Imágenes almacenadas

Número de imágenes de Custom Vision almacenadas.
ImagesStored Contar Suma (Total) ApiName, FeatureName, , UsageChannel, Region PT1M
Eventos aprendidos

Número de eventos aprendidos.
LearnedEvents Contar Suma (Total) IsMatchBaseline, , Mode, RunId PT1M
Solicitudes de voz de LUIS

Número de solicitudes de conversión de voz en intención de LUIS.
LUISSpeechRequests Contar Suma (Total) ApiName, FeatureName, , UsageChannel, Region PT1M
Solicitudes de texto de LUIS

Número de solicitudes de texto de LUIS.
LUISTextRequests Contar Suma (Total) ApiName, FeatureName, , UsageChannel, Region PT1M
Recompensas coincidentes

Número de recompensas coincidentes.
MatchedRewards Contar Suma (Total) Mode, RunId PT1M
Eventos no activados

Número de eventos omitidos.
NonActivatedEvents Contar Suma (Total) Mode, RunId PT1M
Recompensas observadas

Número de recompensas observadas.
ObservedRewards Contar Suma (Total) Mode, RunId PT1M
Caracteres de sincronización de documentos traducidos

Número de caracteres en la solicitud de traducción de documentos (sincrónica).
OneDocumentCharactersTranslated Contar Suma (Total) ApiName, FeatureName, , UsageChannel, Region PT1M
Caracteres personalizados de sincronización de documentos traducidos

Número de caracteres en la solicitud de traducción de documentos personalizada (sincrónica).
OneDocumentCustomCharactersTranslated Contar Suma (Total) ApiName, FeatureName, , UsageChannel, Region PT1M
Caracteres procesados

Número de caracteres procesados por Immersive Reader.
ProcessedCharacters Contar Suma (Total) ApiName, FeatureName, , UsageChannel, Region PT1M
Registros de texto de estado procesados

Número de registros de texto de estado procesados
ProcessedHealthTextRecords Contar Suma (Total) ApiName, FeatureName, , UsageChannel, Region PT1M
Imágenes procesadas

Número de imágenes procesadas.
ProcessedImages Contar Suma (Total) ApiName, FeatureName, , UsageChannel, Region PT1M
Páginas procesadas

Número de páginas procesadas.
ProcessedPages Contar Suma (Total) ApiName, FeatureName, , UsageChannel, Region PT1M
Registros de texto procesados

Número de registros de texto.
ProcessedTextRecords Contar Suma (Total) ApiName, FeatureName, , UsageChannel, Region PT1M
Registros de texto de QA

Número de registros de texto procesados
QuestionAnsweringTextRecords Contar Suma (Total) ApiName, FeatureName, , UsageChannel, Region PT1M
Duración de la sesión de voz (en desuso)

Duración total de la sesión de voz en segundos.
SpeechSessionDuration Segundos Suma (Total) ApiName, , OperationName, Region PT1M
Caracteres de texto traducidos

Número de caracteres en la solicitud entrante de traducción de texto.
TextCharactersTranslated Contar Suma (Total) ApiName, FeatureName, , UsageChannel, Region PT1M
Caracteres personalizados de texto traducidos

Número de caracteres en la solicitud entrante personalizada de traducción de texto.
TextCustomCharactersTranslated Contar Suma (Total) ApiName, FeatureName, , UsageChannel, Region PT1M
Caracteres entrenados de texto

Número de caracteres entrenados mediante la traducción de texto.
TextTrainedCharacters Contar Suma (Total) ApiName, FeatureName, , UsageChannel, Region PT1M
N.º total de eventos

Número de eventos.
TotalEvents Contar Suma (Total) Mode, RunId PT1M
Total de transacciones (en desuso)

Número total de transacciones.
TotalTransactions Contar Suma (Total) <ninguno> PT1M
Segundos de la aplicación Translator Pro

Número de segundos de uso de Translator Pro App.
TranslatorProAppSeconds Segundos Suma (Total) ApiName, FeatureName, , UsageChannel, Region PT1M

Dimensiones de métricas

Para obtener más información sobre las dimensiones de métricas, consulte Métricas multidimensionales.

Este servicio tiene las siguientes dimensiones asociadas a sus métricas.

  • ApiName
  • FeatureName (Nombre de la caracter
  • ModelDeploymentName
  • NombreDelModelo
  • ModelVersion
  • NombreDeOperación
  • Región
  • Código de estado
  • StreamType (Tipo de arroyo)
  • UsageChannel

Registros de recursos

En esta sección se enumeran los tipos de registros de recursos que se pueden recopilar para este servicio. La sección extrae de la lista de todos los tipos de categorías de registros admitidos en Azure Monitor.

Registros de recursos admitidos para Microsoft.CognitiveServices/accounts

Categoría Nombre de categoría mostrado Tabla de registro Admite el plan de registro básico Permite la transformación en el momento de la ingesta. Consultas de ejemplo Costes de exportación
Audit Registros de auditoría AzureDiagnostics

Registros procedentes de varios recursos de Azure.

No No No
AzureOpenAIRequestUsage Uso de solicitudes openAI de Azure AzureDiagnostics

Registros procedentes de varios recursos de Azure.

No No
RequestResponse Registros de solicitud y respuesta AzureDiagnostics

Registros procedentes de varios recursos de Azure.

No No No
Trace Registros de seguimiento AzureDiagnostics

Registros procedentes de varios recursos de Azure.

No No No

Tablas de registros de Azure Monitor

En esta sección, se enumeran todas las tablas de registros de Azure Monitor relacionadas con este servicio y que están disponibles para consulta mediante Log Analytics con consultas de Kusto. Las tablas contienen datos de registro de recursos y, posiblemente, más dependiendo de lo que se recopila y se enrutan a ellos.

Azure OpenAI microsoft.cognitiveservices/accounts

Registro de actividad

En la tabla vinculada se enumeran las operaciones que se pueden registrar en el registro de actividad de este servicio. Estas operaciones son un subconjunto de todas las posibles operaciones del proveedor de recursos en el registro de actividad.

Para obtener más información sobre el esquema de las entradas del registro de actividad, consulte Esquema del registro de actividad.