Azure OpenAI monitoring data reference (classic)

A ver atualmente:Versão - portal Foundry (clássica)Mudar para a versão do novo portal da Foundry

Este artigo contém toda a informação de referência de monitorização para este serviço.

Consulte Monitor Azure OpenAI para detalhes sobre os dados que pode recolher para Azure OpenAI em Microsoft Foundry Models e como usá-los.

Metrics

Esta secção lista todas as métricas de plataforma recolhidas automaticamente para este serviço. Estas métricas fazem também parte da lista global de métricas all da plataforma suportadas em Azure Monitor.

Para informações sobre retenção de métricas, consulte Azure Monitor Visão geral das métricas.

Métricas suportadas para a Microsoft. CognitiveServices/contas

Aqui estão as métricas mais importantes que achamos que deve monitorizar para o Azure OpenAI. Mais adiante neste artigo há uma lista mais longa de todas as métricas disponíveis para este namespace, que contém mais detalhes sobre métricas nesta lista mais curta. Por favor, consulte a lista abaixo para informações mais atualizadas. Estamos a trabalhar na atualização das tabelas nas secções seguintes.

  • Azure OpenAI Requests
  • Active Tokens
  • Tokens de Conclusão Gerados
  • Horas de treino processadas FinAjustadas
  • Tokens de Inferência Processados
  • Tokens de Prompt Processados
  • Utilização gerida por provisões V2
  • Taxa de Correspondência do Cache do Token de Prompt
  • Tempo para a Resposta
  • Tempo Entre Fichas
  • Tempo para o Último Byte
  • Tempo Normalizado até ao Primeiro Byte
  • Tokens por Segundo

Também pode monitorizar métricas de Segurança de Conteúdo utilizadas por outros serviços relacionados.

  • Blocked Volume
  • Volume Nocivo Detetado
  • Potencial Número de Utilizadores Abusivos
  • Evento do Sistema de Segurança
  • Volume Total Enviado para Verificação de Segurança

Note

A métrica de Utilização Gerida por Provisões está agora obsoleta e já não é recomendada. Esta métrica foi substituída pela métrica Provisioned-managed Utilization V2 . Tokens por Segundo, Tempo até Resposta e Tempo Entre Tokens atualmente não estão disponíveis para implementações Standard.

As métricas de Serviços Cognitivos têm a categoria Serviços Cognitivos - Pedidos HTTP na tabela seguinte. Estas métricas são métricas legadas que são comuns a todos os recursos deste tipo. A Microsoft já não recomenda que utilize estas métricas com o Azure OpenAI.

A tabela seguinte lista as métricas disponíveis para a Microsoft. Serviços cognitivos/tipo de recurso de contas.

  • Todas as colunas podem não estar presentes em todas as tabelas.
  • Algumas colunas podem estar para além da área de visualização da página. Selecione Expandir tabela para ver todas as colunas disponíveis.

Table headings

  • Categoria - O grupo de métricas ou classificação.
  • Metric - O nome de visualização métrico tal como aparece no portal Azure.
  • Nome na API REST - O nome da métrica referido na API REST.
  • Unidade - Unidade de medida.
  • Agregação - O tipo padrão de agregação . Valores válidos: Média (Média), Mínimo (Mínimo), Máximo (Máximo), Total (Soma), Contagem.
  • Dimensões - Dimensões disponíveis para a métrica.
  • Grãos - do TempoIntervalos em que a métrica é amostrada. Por exemplo, PT1M indica que a métrica é amostrada a cada minuto, PT30M a cada 30 minutos, PT1H a cada hora, e assim sucessivamente.
  • DS Export- Se a métrica é exportável para Azure Monitor Logs através das definições de diagnóstico. Para informações sobre exportação de métricas, consulte Criar definições de diagnóstico em Azure Monitor.

Category: Actions

Metric Nome na API REST Unit Aggregation Dimensions Time Grains DS Export
Action Occurences

Número de vezes que cada ação aparece.
ActionIdOccurrences Count Total (Sum) ActionId, Mode, RunId PT1M Yes
Ações por Evento

Número de ações por evento.
ActionsPerEvent Count Average Mode, RunId PT1M Yes

Categoria: Azure OpenAI - Pedidos HTTP

Metric Nome na API REST Unit Aggregation Dimensions Time Grains DS Export
Azure OpenAI AvailabilityRate

Percentagem de disponibilidade com o seguinte cálculo: (Total de Chamadas - Erros de Servidor)/Total de Chamadas. Erros de servidor incluem quaisquer respostas >HTTP =500.
AzureOpenAIAvailabilityRate Percent Mínimo, Máximo, Médio ApiName, OperationName, Region, StreamType, ModelDeploymentName, ModelName, ModelVersion PT1M No
Azure Pedidos OpenAI

Número de chamadas feitas para a API OpenAI do Azure ao longo do tempo. Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go. Para detalhar os pedidos da API, pode adicionar um filtro ou aplicar divisão pelas seguintes dimensões: ModelDeploymentName, ModelName, ModelVersion, StatusCode (sucesso, clientes erros, erros do servidor), IsSpillover para informação de spillover, ServiceTier, StreamType (pedidos de streaming vs não-streaming) e operação.
AzureOpenAIRequests Count Total (Sum) ApiName, OperationName, StreamTypeRegion, , ModelDeploymentName, , ModelVersionStatusCodeIsSpilloverServiceTierRequestModelNameServiceTierResponse PT1M Yes

Categoria: Azure OpenAI - Latência

Metric Nome na API REST Unit Aggregation Dimensions Time Grains DS Export
Tempo Entre Fichas

Para pedidos de streaming; taxa de geração de tokens de modelo, medida em milissegundos. Aplica-se a implementações PTU, PTU-managed e Pay-as-you-go.
AzureOpenAINormalizedTBTInMS MilliSeconds Máximo, Mínimo, Médio Region, ModelDeploymentName, ModelName, ModelVersion PT1M Yes
Tempo Normalizado até ao Primeiro Byte

Para pedidos de streaming e não-streaming; O tempo que demora até o primeiro byte dos dados de resposta ser recebido após o pedido ser feito pelo modelo, normalizado pelo token. Aplica-se a implementações PTU, geridas por PTU e Pay-as-you-go.
AzureOpenAINormalizedTTFTInMS MilliSeconds Máximo, Mínimo, Médio Region, ModelDeploymentName, ModelName, ModelVersion PT1M Yes
Tempo para a Resposta

Medida recomendada de latência (responsividade) para pedidos de streaming. Aplica-se a implementações PTU, PTU-managed e Pay-as-you-go. Calculado como o tempo necessário para a primeira resposta aparecer após o utilizador enviar um prompt, medido pelo gateway da API. Este número aumenta à medida que o tamanho do prompt aumenta e/ou diminui o tamanho das visualizações do cache. Para analisar a métrica de tempo até resposta, pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName e ModelVersion.

Nota: esta métrica é uma aproximação, pois a latência medida depende fortemente de múltiplos fatores, incluindo chamadas simultâneas e o padrão global de carga de trabalho. Além disso, não tem em conta qualquer latência do lado do cliente que possa existir entre o seu cliente e o endpoint da API. Por favor, consulte o seu próprio registo para um rastreio de latência otimizado.
AzureOpenAITimeToResponse MilliSeconds Mínimo, Máximo, Médio ApiName, OperationName, RegionStreamType, , ModelDeploymentName, ModelName, ModelVersion,StatusCode PT1M Yes
Tokens por Segundo

Enumera a velocidade de geração para a resposta de um dado modelo Azure OpenAI. O total de tokens gerados é dividido pelo tempo para gerar os tokens, em segundos. Aplica-se a implementações PTU, PTU-managed e Pay-as-you-go.
AzureOpenAITokenPerSecond Count Máximo, Mínimo, Médio Region, ModelDeploymentName, ModelName, ModelVersion PT1M Yes
Tempo para o Último Byte

Para pedidos de streaming e não-streaming; O tempo que demora até o último byte dos dados de resposta ser recebido após o pedido ser feito pelo modelo. Aplica-se a implementações PTU, geridas por PTU e Pay-as-you-go.
AzureOpenAITTLTInMS MilliSeconds Máximo, Mínimo, Médio Region, ModelDeploymentName, ModelName, ModelVersion PT1M Yes

Categoria: Azure OpenAI - Utilização

Metric Nome na API REST Unit Aggregation Dimensions Time Grains DS Export
Active Tokens

Total de tokens menos tokens armazenados em cache ao longo de um período de tempo. Aplica-se a implantações PTU e geridas pela PTU. Use esta métrica para compreender a sua utilização baseada em TPS ou TPM para PTUs e compare com os seus benchmarks para TPS ou TPM alvo para os seus cenários. Para detalhar os pedidos da API, pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName e ModelVersion.
ActiveTokens Count Mínimo, Máximo, Médio, Total (Soma) Region, ModelDeploymentName, ModelName, ModelVersion PT1M Yes
Tokens de Conclusão de Áudio

Número de tokens de prompt de áudio gerados (output) num modelo OpenAI. Aplica-se a implementações gerenciadas por PTU e modelos Pay-as-you-go.
AudioCompletionTokens Count Total (Sum) ModelDeploymentName, ModelName, ModelVersion, Region PT1M Yes
Tokens de Prompt de Áudio

Número de tokens de prompt áudio processados (entrada) num modelo OpenAI. Aplica-se a implementações gerenciadas por PTU e modelos Pay-as-you-go.
AudioPromptTokens Count Total (Sum) ModelDeploymentName, ModelName, ModelVersion, Region PT1M Yes
Taxa de Correspondência do Cache do Token de Prompt

Percentagem de tokens de prompt que entram na cache. Aplica-se a implantações PTU e geridas pela PTU.
AzureOpenAIContextTokensCacheMatchRate Percent Mínimo, Máximo, Médio Region, ModelDeploymentName, ModelName, ModelVersion PT1M No
Utilização gerida por provisionamento (obsoleta)

Utilização % para uma implantação gerida provisionalmente, calculada como (PTUs consumidas / PTUs implantadas) x 100. Quando a utilização é maior ou igual a 100%, as chamadas são limitadas e o código de erro 429 é devolvido. Para detalhar esta métrica, pode adicionar um filtro ou aplicar divisão pelas seguintes dimensões: ModelDeploymentName, ModelName, ModelVersion e StreamType (Pedidos de streaming vs não-streaming)
AzureOpenAIProvisionedManagedUtilization Percent Mínimo, Máximo, Médio Region, StreamType, ModelDeploymentName, ModelName, ModelVersion PT1M No
Utilização gerida por provisões V2

Utilização % para uma implantação gerida provisionalmente, calculada como (PTUs consumidas / PTUs implantadas) x 100. Quando a utilização é maior ou igual a 100%, as chamadas são limitadas e o código de erro 429 é devolvido. Para detalhar esta métrica, pode adicionar um filtro ou aplicar divisão pelas seguintes dimensões: ModelDeploymentName, ModelName, ModelVersion e StreamType (Pedidos de streaming vs não-streaming)
AzureOpenAIProvisionedManagedUtilizationV2 Percent Mínimo, Máximo, Médio Region, StreamType, ModelDeploymentName, ModelName, ModelVersion PT1M No
Horas de treino processadas FinAjustadas

Número de horas de treino processadas num modelo OpenAI FineTuned
FineTunedTrainingHours Count Total (Sum) ApiName, ModelDeploymentName, FeatureName, UsageChannel, Region PT1M Yes
Tokens de Conclusão Gerados

Número de tokens gerados (output) a partir de um modelo OpenAI. Aplica-se a implementações PTU, PTU-managed e Pay-as-you-go. Para detalhar esta métrica, pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName e ModelName.
GeneratedTokens Count Total (Sum) ApiName, ModelDeploymentName, FeatureName, UsageChannel, Region, ModelVersion PT1M Yes
Tokens de Prompt Processados

Número de tokens de prompt processados (entrada) num modelo OpenAI. Aplica-se a implementações PTU, PTU-managed e Pay-as-you-go. Para detalhar esta métrica, pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName e ModelName.
ProcessedPromptTokens Count Total (Sum) ApiName, ModelDeploymentName, FeatureName, UsageChannel, Region, ModelVersion PT1M Yes
Segundos de API em tempo real utilizados

Número de segundos usados na RealtimeAPI
RealtimeUsageTime Count Total (Sum) Region, ModelDeploymentName PT1M Yes
Tokens de Inferência Processados

Número de tokens de inferência processados num modelo OpenAI. Calculado como tokens de prompt (entrada) mais tokens gerados (output). Aplica-se a implementações PTU, PTU-managed e Pay-as-you-go. Para detalhar esta métrica, pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName e ModelName.
TokenTransaction Count Total (Sum) ApiName, ModelDeploymentName, FeatureName, UsageChannel, Region, ModelVersion PT1M Yes

Categoria: Serviços Cognitivos - Pedidos HTTP

Metric Nome na API REST Unit Aggregation Dimensions Time Grains DS Export
Blocked Calls

Número de chamadas que excederam o limite de taxa ou quota. Não use para o serviço Azure OpenAI.
BlockedCalls Count Total (Sum) ApiName, OperationName, Region, RatelimitKey PT1M Yes
Client Errors

Número de chamadas com erro do lado do cliente (código de resposta HTTP 4xx). Não use para o serviço Azure OpenAI.
ClientErrors Count Total (Sum) ApiName, OperationName, Region, RatelimitKey PT1M Yes
Data In

Tamanho dos dados recebidos em bytes. Não use para o serviço Azure OpenAI.
DataIn Bytes Total (Sum) ApiName, OperationName, Region PT1M Yes
Data Out

Tamanho dos dados de saída em bytes. Não use para o serviço Azure OpenAI.
DataOut Bytes Total (Sum) ApiName, OperationName, Region PT1M Yes
Latency

Latência em milissegundos. Não use para o serviço Azure OpenAI.
Latency MilliSeconds Average ApiName, OperationName, Region, RatelimitKey PT1M Yes
Ratelimit

O limite de taxa atual da chave de limite. Não use para o serviço Azure OpenAI.
Ratelimit Count Total (Sum) Region, RatelimitKey PT1M Yes
Server Errors

Número de chamadas com erro interno do serviço (código de resposta HTTP 5xx). Não use para o serviço Azure OpenAI.
ServerErrors Count Total (Sum) ApiName, OperationName, Region, RatelimitKey PT1M Yes
Successful Calls

Número de chamadas bem-sucedidas. Não use para o serviço Azure OpenAI.
SuccessfulCalls Count Total (Sum) ApiName, OperationName, Region, RatelimitKey PT1M Yes
Total Calls

Número total de chamadas. Não use para o serviço Azure OpenAI.
TotalCalls Count Total (Sum) ApiName, OperationName, Region, RatelimitKey PT1M Yes
Total Errors

Número total de chamadas com resposta de erro (código de resposta HTTP 4xx ou 5xx). Não use para o serviço Azure OpenAI.
TotalErrors Count Total (Sum) ApiName, OperationName, Region, RatelimitKey PT1M Yes
Total de Chamadas de Token

Número total de chamadas de token.
TotalTokenCalls Count Total (Sum) ApiName, OperationName, Region PT1M Yes

Categoria: Serviços Cognitivos - SLI

Metric Nome na API REST Unit Aggregation Dimensions Time Grains DS Export
AvailabilityRate

Percentagem de disponibilidade com o seguinte cálculo: (Total de Chamadas - Erros de Servidor)/Total de Chamadas. Erros de servidor incluem quaisquer respostas >HTTP =500. Não use para o serviço Azure OpenAI.
SuccessRate Percent Mínimo, Máximo, Médio ApiName, OperationName, Region, RatelimitKey PT1M No

Categoria: Compreensão de Conteúdo - Utilização

Metric Nome na API REST Unit Aggregation Dimensions Time Grains DS Export
Face Transactions

Número de chamadas API feitas para o serviço Face
FaceApiTransactions Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Minutos de Áudio Processados

Minutos de áudio processados
ProcessedAudioMinutes Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Processed Pages

Número de páginas de documento processadas
ProcessedDocumentPages Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Processed Images

Número de imagens processadas
ProcessedImageCount Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Minutos de Vídeo Processados

Minutos de vídeo processados
ProcessedVideoMinutes Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Tokens

Número de tokens consumidos
Tokens Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes

Categoria: ConteúdoSegurança - Riscos e Segurança

Metric Nome na API REST Unit Aggregation Dimensions Time Grains DS Export
Número de Utilizadores Potencialmente Abusivos

Número de utilizadores potencialmente abusivos que foram detetados ao longo do tempo. Pode adicionar um filtro ou aplicar a divisão pela seguinte dimensão: ModelDeploymentName.
RAIAbusiveUsersCount Count Total (Sum) Region, ModelDeploymentName PT1M Yes
Volume Nocivo Detetado

Número de chamadas feitas para a API OpenAI do Azure e detetadas como prejudiciais (tanto modelo de bloco como modo de anotação) pelo filtro de conteúdo aplicado ao longo do tempo. Pode adicionar um filtro ou aplicar divisão pelas seguintes dimensões: ModelDeploymentName, ModelName e TextType.
RAIHarmfulRequests Count Total (Sum) Region, ModelDeploymentName, ModelNameModelVersion, , ApiName, TextType, Category,Severity PT1M Yes
Blocked Volume

Número de chamadas feitas para a API OpenAI do Azure e rejeitadas pelo filtro de conteúdo aplicado ao longo do tempo. Pode adicionar um filtro ou aplicar divisão pelas seguintes dimensões: ModelDeploymentName, ModelName e TextType.
RAIRejectedRequests Count Total (Sum) Region, ModelDeploymentName, ModelName, ModelVersion, ApiName, TextType, Category PT1M Yes
Evento do Sistema de Segurança

Evento do sistema para monitorização de riscos e segurança. Pode adicionar um filtro ou aplicar divisão pela seguinte dimensão: EventType.
RAISystemEvent Count Average Region, EventType PT1M Yes
Volume Total Enviado para Verificação de Segurança

Número de chamadas feitas para a API OpenAI do Azure e detetadas pelo filtro de conteúdo aplicado ao longo do tempo. Pode adicionar um filtro ou aplicar divisão pelas seguintes dimensões: ModelDeploymentName, ModelName.
RAITotalRequests Count Total (Sum) Region, ModelDeploymentName, ModelName, ModelVersion, ApiName PT1M Yes

Categoria: Conteúdo Segurança - Utilização

Metric Nome na API REST Unit Aggregation Dimensions Time Grains DS Export
Contagem de Chamadas para Moderação de Imagem

Número de pedidos de moderação de imagens.
ContentSafetyImageAnalyzeRequestCount Count Total (Sum) ApiVersion PT1M Yes
Contagem de Chamadas para Moderação de Mensagens

Número de chamadas para moderação de texto.
ContentSafetyTextAnalyzeRequestCount Count Total (Sum) ApiVersion PT1M Yes

Category: Estimations

Metric Nome na API REST Unit Aggregation Dimensions Time Grains DS Export
Contagem Base de Eventos Aleatórios

Estimativa para a contagem inicial de eventos aleatórios.
BaselineRandomEventCount Count Total (Sum) Mode, RunId PT1M Yes
Recompensa Aleatória Básica

Estimativa da recompensa aleatória base.
BaselineRandomReward Count Total (Sum) Mode, RunId PT1M Yes
Contagem de Eventos Online

Estimativa para o número de eventos online.
OnlineEventCount Count Total (Sum) Mode, RunId PT1M Yes
Online Reward

Estimativa para recompensa online.
OnlineReward Count Total (Sum) Mode, RunId PT1M Yes
Contagem de Eventos de Referência do Utilizador

Estimativa para a contagem de eventos de referência definida pelo utilizador.
UserBaselineEventCount Count Total (Sum) Mode, RunId PT1M Yes
Recompensa Base do Utilizador

Estimativa da recompensa base definida pelo utilizador.
UserBaselineReward Count Total (Sum) Mode, RunId PT1M Yes

Categoria: Ocorrências de Características

Metric Nome na API REST Unit Aggregation Dimensions Time Grains DS Export
Ocorrências de Características de Ação

Número de vezes que cada elemento de ação aparece.
ActionFeatureIdOccurrences Count Total (Sum) FeatureId, Mode, RunId PT1M Yes
Ocorrências de Características de Contexto

Número de vezes que cada característica de contexto aparece.
ContextFeatureIdOccurrences Count Total (Sum) FeatureId, Mode, RunId PT1M Yes
Ocorrências de Funcionalidades de Slot

Número de vezes que cada funcionalidade de slot aparece.
SlotFeatureIdOccurrences Count Total (Sum) FeatureId, Mode, RunId PT1M Yes

Category: FeatureCardinality

Metric Nome na API REST Unit Aggregation Dimensions Time Grains DS Export
Cardinalidade das Características por Ação

Cardinalidade da Característica com base na Ação.
FeatureCardinality_Action Count Average FeatureId, Mode, RunId PT1M Yes
Cardinalidade das características por contexto

Cardinalidade das características com base no contexto.
FeatureCardinality_Context Count Average FeatureId, Mode, RunId PT1M Yes
Cardinalidade da Característica por Slot

Cardinalidade da característica baseada no slot.
FeatureCardinality_Slot Count Average FeatureId, Mode, RunId PT1M Yes

Categoria: Características por Evento

Metric Nome na API REST Unit Aggregation Dimensions Time Grains DS Export
Características de Ação por Evento

Número médio de características de ação por evento.
ActionFeaturesPerEvent Count Average Mode, RunId PT1M Yes
Características de Contexto por Evento

Número de características contextuais por evento.
ContextFeaturesPerEvent Count Average Mode, RunId PT1M Yes
Funcionalidades de Slot por Evento

Número médio de funcionalidades de slot por evento.
SlotFeaturesPerEvent Count Average Mode, RunId PT1M Yes

Categoria: Língua - Empregos

Metric Nome na API REST Unit Aggregation Dimensions Time Grains DS Export
Duração do Trabalho (Pré-visualização)

Nota: este valor depende fortemente do tamanho da entrada, número de documentos e complexidade da tarefa. Este é um valor agregado em todas as tarefas do trabalho.
JobDuration MilliSeconds Mínimo, Máximo, Médio JobStatus, JobType PT1M Yes

Categoria: Modelos - Pedidos HTTP

Metric Nome na API REST Unit Aggregation Dimensions Time Grains DS Export
Taxa de Disponibilidade de Modelos

Percentagem de disponibilidade com o seguinte cálculo: (Total de Chamadas - Erros de Servidor)/Total de Chamadas. Erros de servidor incluem quaisquer respostas >HTTP =500.
ModelAvailabilityRate Percent Mínimo, Máximo, Médio Region, ModelDeploymentName, ModelName, ModelVersion PT1M No
Model Requests

Número de chamadas feitas para a API do modelo ao longo do tempo. Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go.
ModelRequests Count Total (Sum) ApiName, OperationName, StreamTypeRegion, , ModelDeploymentName, , ModelVersionStatusCodeIsSpilloverServiceTierRequestModelNameServiceTierResponse PT1M Yes

Categoria: Modelos - Latência

Metric Nome na API REST Unit Aggregation Dimensions Time Grains DS Export
Tempo Entre Fichas

Taxa de geração de tokens de modelo, medida em milissegundos. Aplica-se a implantações PTU e geridas pela PTU. Para pedidos não em streaming, este valor é uma estimativa.
NormalizedTimeBetweenTokens MilliSeconds Máximo, Mínimo, Médio ApiName, OperationName, Region, StreamType, ModelDeploymentName, ModelName, ModelVersion PT1M Yes
Tempo Normalizado até ao Primeiro Byte

Tempo que demora até o primeiro byte dos dados de resposta ser recebido após o pedido ser feito pelo modelo, normalizado pelo token. Aplica-se a implementações PTU, geridas por PTU e Pay-as-you-go. Para pedidos não em streaming, este valor é uma estimativa.
NormalizedTimeToFirstToken MilliSeconds Máximo, Mínimo, Médio ApiName, OperationName, Region, StreamType, ModelDeploymentName, ModelName, ModelVersion PT1M Yes
Tempo para o Último Byte

O tempo que demora até o último byte dos dados de resposta ser recebido após o pedido ser feito pelo modelo. Aplica-se a implementações PTU, geridas por PTU e Pay-as-you-go. Para pedidos não em streaming, este valor é uma estimativa.
TimeToLastByte MilliSeconds Máximo, Mínimo, Médio ApiName, OperationName, Region, StreamType, ModelDeploymentName, ModelName, ModelVersion PT1M Yes
Tempo para a Resposta

Medida recomendada de latência (responsividade). Aplica-se a implantações PTU e geridas pela PTU. Calculado como o tempo necessário para a primeira resposta aparecer após o utilizador enviar um prompt, medido pelo gateway da API. Este número aumenta à medida que o tamanho do prompt aumenta e/ou diminui o tamanho das visualizações do cache. Para analisar a métrica de tempo até resposta, pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName e ModelVersion.

Nota: esta métrica é uma aproximação, pois a latência medida depende fortemente de múltiplos fatores, incluindo chamadas simultâneas e o padrão global de carga de trabalho. Além disso, não tem em conta qualquer latência do lado do cliente que possa existir entre o seu cliente e o endpoint da API. Para pedidos não em streaming, este valor é uma estimativa. Por favor, consulte o seu próprio registo para um rastreio de latência otimizado.
TimeToResponse MilliSeconds Mínimo, Máximo, Médio ApiName, OperationName, RegionStreamType, , ModelDeploymentName, ModelName, ModelVersion,StatusCode PT1M Yes
Tokens por Segundo

Enumera a velocidade de geração para uma dada resposta do modelo. O total de tokens gerados é dividido pelo tempo para gerar os tokens, em segundos. Aplica-se a implantações PTU e geridas pela PTU. Para pedidos não em streaming, este valor é uma estimativa.
TokensPerSecond Count Máximo, Mínimo, Médio ApiName, OperationName, Region, StreamType, ModelDeploymentName, ModelName, ModelVersion PT1M Yes

Categoria: Modelos - Utilização

Metric Nome na API REST Unit Aggregation Dimensions Time Grains DS Export
Annotated Pages

Número total de páginas processadas com anotações. Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go.
AnnotatedPages Count Total (Sum) ApiName, Region, ModelDeploymentName, ModelName, ModelVersion PT1M Yes
Tokens de Entrada de Áudio

Número de tokens de prompt áudio processados (entrada) num modelo OpenAI. Aplica-se a implementações de modelos geridos por PTU.
AudioInputTokens Count Total (Sum) ModelDeploymentName, ModelName, ModelVersion, Region PT1M Yes
Tokens de Saída de Áudio

Número de tokens de prompt de áudio gerados (output) num modelo OpenAI. Aplica-se a implementações de modelos geridos por PTU.
AudioOutputTokens Count Total (Sum) ModelDeploymentName, ModelName, ModelVersion, Region PT1M Yes
Tokens de prompt lidos da cache

Número total de tokens lidos da cache. Aplica-se a implementações de modelos Anthropic. Surgiu na secção de utilização de resposta como cache_read_input_tokens
cacheReadInputTokens Count Total (Sum) ApiName, Region, ModelDeploymentName, ModelName, ModelVersion, ContextLength PT1M Yes
Tokens de prompt escritos para cache (TTL de 1 hora)

O número de tokens de prompt usados para criar a entrada de 1 hora. Aplica-se a implementações de modelos Anthropic. Surgiu na secção de utilização de resposta como cache_creation.ephemeral_1h_input_tokens
ephemeral1hInputTokens Count Total (Sum) ApiName, Region, ModelDeploymentName, ModelName, ModelVersion, ContextLength PT1M Yes
Tokens de prompt escritos para cache (TTL de 5 minutos)

O número de tokens de prompt usados para criar a entrada do cache de 5 minutos. Aplica-se a implementações de modelos Anthropic. Surgiu na secção de utilização de resposta como cache_creation.ephemeral_5m_input_tokens
ephemeral5mInputTokens Count Total (Sum) ApiName, Region, ModelDeploymentName, ModelName, ModelVersion, ContextLength PT1M Yes
Generated Images

Número total de imagens geradas. Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go.
GeneratedImages Count Total (Sum) ApiName, Region, ModelDeploymentName, ModelName, ModelVersion PT1M Yes
Input Tokens

Número de tokens de prompt processados (entrada) num modelo. Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go.
InputTokens Count Total (Sum) ApiName, Region, ModelDeploymentName, ModelName, ModelVersion PT1M Yes
Output Tokens

Número de tokens gerados (output) a partir de um modelo OpenAI. Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go.
OutputTokens Count Total (Sum) ApiName, Region, ModelDeploymentName, ModelName, ModelVersion PT1M Yes
Provisioned Utilization

Utilização % para uma implantação gerida provisionalmente, calculada como (PTUs consumidas / PTUs implantadas) x 100. Quando a utilização é maior ou igual a 100%, as chamadas são limitadas e o código de erro 429 é devolvido.
ProvisionedUtilization Percent Mínimo, Máximo, Médio Region, ModelDeploymentName, ModelName, ModelVersion PT1M No
Total Pages

Número total de páginas processadas. Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go.
TotalPages Count Total (Sum) ApiName, Region, ModelDeploymentName, ModelName, ModelVersion PT1M Yes
Total Tokens

Número de tokens de inferência processados num modelo. Calculado como tokens de prompt (entrada) mais tokens gerados (output). Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go.
TotalTokens Count Total (Sum) ApiName, Region, ModelDeploymentName, ModelName, ModelVersion PT1M Yes

Categoria: Espaços de Nomes por Evento

Metric Nome na API REST Unit Aggregation Dimensions Time Grains DS Export
Namespaces de Ações por Evento

Número médio de namespaces de ações por evento.
ActionNamespacesPerEvent Count Average Mode, RunId PT1M Yes
Espaços de Nomes de Contexto por Evento

Número de namespaces de contexto por evento.
ContextNamespacesPerEvent Count Average Mode, RunId PT1M Yes
Espaços de Nomes de Slots por Evento

Número médio de espaços de nomes de slot por evento.
SlotNamespacesPerEvent Count Average Mode, RunId PT1M Yes

Category: Rewards

Metric Nome na API REST Unit Aggregation Dimensions Time Grains DS Export
Recompensa Média por Evento

Recompensa média por evento.
Reward Count Average BaselineAction, ChosenActionId, MatchesBaseline, NonDefaultReward, Mode, RunId PT1M Yes
Slot Reward

Recompensa por slot.
SlotReward Count Average BaselineActionId, ChosenActionId, MatchesBaselineNonDefaultReward, , SlotId, SlotIndex, Mode,RunId PT1M Yes

Category: Slots

Metric Nome na API REST Unit Aggregation Dimensions Time Grains DS Export
Estimador de Referência Recompensa Global

Estimador Baseline Recompensa Global.
BaselineEstimatorOverallReward Count Average Mode, RunId PT1M Yes
Recompensa do Slot do Estimador de Referência

Estimador de referência Recompensa por slot.
BaselineEstimatorSlotReward Count Average SlotId, SlotIndex, Mode, RunId PT1M Yes
Recompensa Geral do Estimador Aleatório de Referência

Recompensa global do estimador aleatório de base.
BaselineRandomEstimatorOverallReward Count Average Mode, RunId PT1M Yes
Recompensa de Slot de Estimador Aleatório de Referência

Estimador Aleatório Base Recompensa por slot.
BaselineRandomEstimatorSlotReward Count Average SlotId, SlotIndex, Mode, RunId PT1M Yes
Slots

Número de vagas por evento.
NumberOfSlots Count Average Mode, RunId PT1M Yes
Estimador Online Recompensa Global

Estimador Online Recompensa Global.
OnlineEstimatorOverallReward Count Average Mode, RunId PT1M Yes
Bónus de Slot para Estimadores Online

Estimador Online Recompensa por slot.
OnlineEstimatorSlotReward Count Average SlotId, SlotIndex, Mode, RunId PT1M Yes
Slot Occurrences

Número de vezes que cada slot aparece.
SlotIdOccurrences Count Total (Sum) SlotId, SlotIndex, Mode, RunId PT1M Yes

Categoria: Serviços de Voz - Utilização

Metric Nome na API REST Unit Aggregation Dimensions Time Grains DS Export
Segundos de Áudio Transcritos em Lote

Número de segundos em lote transcritos
AudioSecondsBatchTranscribed Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Segundos de Áudio Sussurros em Batch Transcritos

Número de segundos do sussurro em lote transcrito
AudioSecondsBatchWhisperTranscribed Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Segundos de áudio transcritos rapidamente

Número rápido de segundos transcrito
AudioSecondsFastTranscribed Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Áudio Segundos Sussurros Rápidos Transcritos

Número de segundos transcrevidos em sussurros rápidos
AudioSecondsFastWhisperTranscribed Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Segundos de Áudio Transcritos

Número de segundos transcritos
AudioSecondsTranscribed Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Segundos de Áudio Traduzidos

Número de segundos traduzidos
AudioSecondsTranslated Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Modelos Avatar Hosting Seconds

Número de segundos.
AvatarModelHostingSeconds Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Segundos de Treino do Modelo Avatar

Número de segundos.
AvatarModelTrainingSeconds Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Número de Perfis de Oradores

Número de perfis de oradores inscritos. Prorated hourly.
NumberofSpeakerProfiles Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Transações de Reconhecimento de Oradores

Número de transações de reconhecimento de altifalantes
SpeakerRecognitionTransactions Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Horas de Apresentação do Modelo de Discurso

Número de horas de apresentação de modelos de fala
SpeechModelHostingHours Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Synthesized Characters

Número de personagens.
SynthesizedCharacters Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Segundos de Vídeo Sintetizados

Número de segundos sintetizados
VideoSecondsSynthesized Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Tokens de Entrada de Áudio ao Vivo por Voz

Número de tokens de entrada áudio, excluindo tokens em cache.
VoiceLiveAudioInputTokens Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Tokens de Saída de Áudio ao Vivo de Voz

Número de tokens de saída áudio.
VoiceLiveAudioOutputTokens Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Tokens de Entrada de Áudio em Cache de Voz ao Vivo

Número de tokens de entrada áudio em cache.
VoiceLiveCachedAudioInputTokens Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Tokens de Entrada de Texto em Cache Voice Live

Número de tokens de entrada de texto em cache.
VoiceLiveCachedTextInputTokens Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Tokens de Entrada de Texto ao Vivo por Voz

Número de tokens de entrada de texto, excluindo tokens em cache.
VoiceLiveTextInputTokens Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Tokens de Saída de Texto ao Vivo por Voz

Número de tokens de saída de texto.
VoiceLiveTextOutputTokens Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Horas de Apresentação de Modelos de Voz

Número de horas.
VoiceModelHostingHours Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Minutos de Treino de Modelos de Voz

Número de minutos.
VoiceModelTrainingMinutes Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes

Categoria: Serviços de Tradução - Utilização

Metric Nome na API REST Unit Aggregation Dimensions Time Grains DS Export
Personagens Treinados (Descontinuados)

Número total de personagens treinadas.
CharactersTrained Count Total (Sum) ApiName, OperationName, Region PT1M Yes
Personagens Traduzidas (Descontinuadas)

Número total de caracteres no pedido de texto recebido.
CharactersTranslated Count Total (Sum) ApiName, OperationName, Region PT1M Yes
Caracteres do Documento Traduzidos

Número de caracteres no pedido de tradução do documento.
DocumentCharactersTranslated Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Caracteres Personalizados do Documento Traduzidos

Número de caracteres no pedido de tradução de documentos personalizados.
DocumentCustomCharactersTranslated Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Caracteres de Sincronização de Documentos Traduzidos

Número de caracteres no pedido de tradução de documentos (síncrono).
OneDocumentCharactersTranslated Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Sincronização de Documentos Caracteres Personalizados Traduzidos

Número de caracteres no pedido de tradução personalizada de documentos (síncrono).
OneDocumentCustomCharactersTranslated Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Caracteres de Texto Traduzidos

Número de caracteres no pedido de tradução de texto recebido.
TextCharactersTranslated Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Caracteres Personalizados de Texto Traduzidos

Número de caracteres no pedido de tradução de texto personalizado recebido.
TextCustomCharactersTranslated Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Caracteres treinados por texto

Número de caracteres treinados usando tradução de texto.
TextTrainedCharacters Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Segundo da aplicação Translator Pro

Número de segundos de utilização da aplicação Translator Pro.
TranslatorProAppSeconds Seconds Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes

Category: Usage

Metric Nome na API REST Unit Aggregation Dimensions Time Grains DS Export
Inference Count

Contagem de Inferência do Serviço da Porta de Entrada da Carnegie
CarnegieInferenceCount Count Total (Sum) Region, Modality, Category, Language, SeverityLevel, UseCustomList PT1M Yes
Imagem Digitalizada Transações

Número de Transações de Imagem Digitalizada
ComputerVisionTransactions Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Tempo de Treino Personalizado de Visão

Tempo de treino Custom Vision
CustomVisionTrainingTime Seconds Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Transações de Visão Personalizadas

Número de transações de previsão do Custom Vision
CustomVisionTransactions Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Imagens Faciais Treinadas

Número de imagens treinadas. 1.000 imagens treinadas por transação.
FaceImagesTrained Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Faces Stored

Número de rostos armazenados, proporcional diariamente. O número de faces armazenadas é reportado diariamente.
FacesStored Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Face Transactions

Número de chamadas API feitas para o serviço Face
FaceTransactions Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Images Stored

Número de imagens Custom Vision armazenadas.
ImagesStored Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Learned Events

Número de Eventos Aprendidos.
LearnedEvents Count Total (Sum) IsMatchBaseline, Mode, RunId PT1M Yes
Pedidos de Discurso LUIS

Número de pedidos de compreensão de LUIS de fala para intenção
LUISSpeechRequests Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Pedidos de Texto LUIS

Número de pedidos de texto LUIS
LUISTextRequests Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Matched Rewards

Número de recompensas igualadas.
MatchedRewards Count Total (Sum) Mode, RunId PT1M Yes
Eventos Não Ativados

Número de eventos saltados.
NonActivatedEvents Count Total (Sum) Mode, RunId PT1M Yes
Observed Rewards

Número de recompensas observadas.
ObservedRewards Count Total (Sum) Mode, RunId PT1M Yes
Processed Characters

Número de caracteres processados pelo Leitura Avançada.
ProcessedCharacters Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Registos de Texto de Saúde Processados

Número de registos de texto de saúde processados
ProcessedHealthTextRecords Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Processed Images

Número de imagens processadas
ProcessedImages Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Processed Pages

Número de páginas processadas
ProcessedPages Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Registos de Texto Processados

Contagem de registos de texto.
ProcessedTextRecords Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Registos de Texto de QA

Número de registos de texto processados
QuestionAnsweringTextRecords Count Total (Sum) ApiName, FeatureName, UsageChannel, Region PT1M Yes
Duração da Sessão de Discurso (Descontinuado)

Duração total da sessão de discurso em segundos.
SpeechSessionDuration Seconds Total (Sum) ApiName, OperationName, Region PT1M Yes
Total Events

Número de eventos.
TotalEvents Count Total (Sum) Mode, RunId PT1M Yes
Transações Totais (Descontinuadas)

Número total de transações.
TotalTransactions Count Total (Sum) <nenhum> PT1M Yes

Metric dimensions

Para informações sobre o que são dimensões métricas, veja Métricas multidimensionais.

Este serviço tem as seguintes dimensões associadas às suas métricas.

  • ApiName
  • FeatureName
  • ModelDeploymentName
  • ModelName
  • ModelVersion
  • OperationName
  • Region
  • StatusCode
  • StreamType
  • UsageChannel

Resource logs

Esta secção lista os tipos de registos de recursos que pode recolher para este serviço. A secção retira da lista de tipos de categorias de registos todos os recursos suportados em Azure Monitor.

Registos de recursos suportados para a Microsoft. CognitiveServices/contas

Category Nome de exibição da categoria Log table Suporta o plano básico de registos Suporta a transformação do tempo de ingestão Example queries Custos de exportação
Audit Audit Logs AzureDiagnostics

Registos de múltiplos recursos do Azure.

No No No
AzureOpenAIRequestUsage Azure OpenAI Utilização de Pedidos AzureDiagnostics

Registos de múltiplos recursos do Azure.

No No Yes
RequestResponse Registos de Pedidos e Respostas AzureDiagnostics

Registos de múltiplos recursos do Azure.

No No No
Trace Trace Logs AzureDiagnostics

Registos de múltiplos recursos do Azure.

No No No

Azure Monitor Logs tables

Esta secção lista as tabelas Azure Monitor Logs relevantes para este serviço, que estão disponíveis para consulta pela Log Analytics usando consultas Kusto. As tabelas contêm dados de registo de recursos e possivelmente mais, dependendo do que é recolhido e encaminhado para elas.

Azure OpenAI microsoft.cognitiveservices/accounts

Activity log

A tabela ligada lista as operações que podem ser registadas no registo de atividades deste serviço. Estas operações são um subconjunto de todas as possíveis operações de fornecedores de recursos no registo de atividade.

Para mais informações sobre o esquema das entradas do registo de atividade, consulte Esquema do Registo de Atividades.