Referência de dados de monitorização Azure OpenAI

Este artigo contém todas as informações de referência de monitoramento para este serviço.

Consulte Monitor Azure OpenAI para detalhes sobre os dados que pode recolher para Azure OpenAI nos Microsoft Foundry Models e como os utilizar.

Métricas

Esta seção lista todas as métricas de plataforma coletadas automaticamente para este serviço. Estas métricas também fazem parte da lista global de métricas all da plataforma suportadas no Azure Monitor.

Para informações sobre retenção de métricas, consulte Azure Visão geral das Métricas de Monitorização.

Métricas suportadas para Microsoft.CognitiveServices/accounts

Aqui estão as métricas mais importantes que achamos que deve monitorizar para o Azure OpenAI. Mais adiante neste artigo é uma lista mais longa de todas as métricas disponíveis para este namespace que contém mais detalhes sobre métricas nesta lista mais curta. Por favor, veja a lista abaixo para obter as informações mais atualizadas. Estamos trabalhando para atualizar as tabelas nas seções a seguir.

Azure OpenAI Requests
Tokens ativos
Tokens de conclusão gerados
Horas de treinamento FineTuned processadas
Tokens de inferência processados
Tokens de prompt processados
Utilização gerenciada provisionada V2
Taxa de correspondência de cache de token de prompt
Tempo de resposta
Tempo entre tokens
Tempo até ao último byte
Tempo normalizado para o primeiro byte
Tokens por segundo

Você também pode monitorar as métricas de Segurança de Conteúdo usadas por outros serviços relacionados.

Volume bloqueado
Volume nocivo detetado
Potencial número de usuários abusivos
Evento do Sistema de Segurança
Volume total enviado para verificação de segurança

Observação

A métrica Utilização gerenciada por provisionamento agora foi preterida e não é mais recomendada. Essa métrica foi substituída pela métrica Utilização gerenciada provisionada V2 . Tokens por segundo, tempo de resposta e tempo entre tokens não estão disponíveis atualmente para implantações padrão.

As métricas de Serviços Cognitivos têm a categoria Serviços Cognitivos - Solicitações HTTP na tabela a seguir. Essas métricas são métricas legadas que são comuns a todos os recursos desse tipo. A Microsoft já não recomenda que utilize estas métricas com o Azure OpenAI.

A tabela a seguir lista as métricas disponíveis para o tipo de recurso Microsoft.CognitiveServices/accounts.

Nem todas as colunas podem estar presentes em todas as tabelas.
Algumas colunas podem estar além da área de visualização da página. Selecione Expandir tabela para visualizar todas as colunas disponíveis.

Cabeçalhos de tabela

Categoria - O grupo ou classificação de métricas.
Metric - O nome de visualização métrico tal como aparece na Azure portal.
Name na API REST - O nome da métrica referido na API REST.
Unidade - Unidade de medida.
Aggregation - O tipo padrão aggregation. Valores válidos: Média (Média), Mínima (Mín), Máxima (Máx), Total (Soma), Contagem.
Dimensões - Dimensões disponível para a métrica.
Grãos de Tempoc2 em que a métrica é amostrada. Por exemplo, PT1M indica que a métrica é amostrada a cada minuto, PT30M a cada 30 minutos, PT1H a cada hora e assim por diante.
DS Export- Se a métrica é exportável para Azure Registos de Monitorização através das definições de diagnóstico. Para informações sobre exportação de métricas, consulte Criar definições de diagnóstico no Azure Monitor.

Categoria: Ações

Métrico	Nome na API REST	Unidade	Agregação	Dimensões	Segmentos de tempo	DS Exportar
Ocorrências de Ação Número de vezes que cada ação é exibida.	`ActionIdOccurrences`	Contar	Total (Quantidade)	`ActionId`, `Mode`, `RunId`	PT1M	Yes
Ações por evento Número de ações por evento.	`ActionsPerEvent`	Contar	Average	`Mode`, `RunId`	PT1M	Yes

Categoria: Azure OpenAI - Pedidos HTTP

Métrico	Nome na API REST	Unidade	Agregação	Dimensões	Segmentos de tempo	DS Exportar
Azure OpenAI AvailabilityRate Percentagem de disponibilidade com o seguinte cálculo: (Total de Chamadas - Erros do Servidor)/Total de Chamadas. Os erros do servidor incluem quaisquer respostas de HTTP >=500.	`AzureOpenAIAvailabilityRate`	Percentagem	Mínimo, Máximo, Médio	`ApiName`, `OperationName`, `Region`, `StreamType`, `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	Não
Azure Pedidos OpenAI Número de chamadas feitas para a API OpenAI do Azure ao longo do tempo. Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go. Para detalhar os pedidos da API, pode adicionar um filtro ou aplicar divisão pelas seguintes dimensões: ModelDeploymentName, ModelName, ModelVersion, StatusCode (sucesso, clientes erros, erros do servidor), IsSpillover para informação de spillover, ServiceTier, StreamType (pedidos de streaming vs não-streaming) e operação.	`AzureOpenAIRequests`	Contar	Total (Quantidade)	`ApiName`, `OperationName`, `RegionStreamType`, , `ModelDeploymentName`, , `ModelNameModelVersionStatusCodeIsSpilloverServiceTierRequestServiceTierResponse`	PT1M	Yes

Categoria: Azure OpenAI - Latência

Métrico	Nome na API REST	Unidade	Agregação	Dimensões	Segmentos de tempo	DS Exportar
Tempo entre Token Para pedidos de streaming, medição da taxa de geração de tokens do modelo em milissegundos. Aplica-se a implantações PTU, gerenciadas por PTU e Pay-as-you-go.	`AzureOpenAINormalizedTBTInMS`	Milissegundos	Máximo, Mínimo, Médio	`Region`, `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	Yes
Tempo normalizado para o primeiro byte Para solicitações de streaming e não streaming; Tempo que leva para que o primeiro byte de dados de resposta seja recebido após a solicitação ser feita pelo modelo, normalizado por token. Aplica-se a implantações PTU, gerenciadas por PTU e Pay-as-you-go.	`AzureOpenAINormalizedTTFTInMS`	Milissegundos	Máximo, Mínimo, Médio	`Region`, `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	Yes
Tempo de resposta Medida de latência (capacidade de resposta) recomendada para solicitações de streaming. Aplica-se a implantações PTU, gerenciadas por PTU e Pay-as-you-go. Calculado como o tempo necessário para que a primeira resposta apareça depois que um usuário envia um prompt, conforme medido pelo gateway de API. Esse número aumenta à medida que o tamanho do prompt aumenta e/ou o tamanho dos acessos ao cache diminui. Para detalhar o tempo até a métrica de resposta, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName e ModelVersion. Nota: essa métrica é uma aproximação, pois a latência medida depende fortemente de vários fatores, incluindo chamadas simultâneas e padrão geral de carga de trabalho. Além disso, ele não leva em conta qualquer latência do lado do cliente que possa existir entre seu cliente e o ponto de extremidade da API. Consulte seu próprio registro para obter o rastreamento de latência ideal.	`AzureOpenAITimeToResponse`	Milissegundos	Mínimo, Máximo, Médio	`ApiName`, `OperationName`, `RegionStreamType`, , `ModelDeploymentName`, `ModelName`, `ModelVersion`,`StatusCode`	PT1M	Yes
Tokens por segundo Enumera a velocidade de geração para a resposta de um dado modelo Azure OpenAI. O total de tokens gerados é dividido pelo tempo para gerar os tokens, em segundos. Aplica-se a implantações PTU, gerenciadas por PTU e Pay-as-you-go.	`AzureOpenAITokenPerSecond`	Contar	Máximo, Mínimo, Médio	`Region`, `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	Yes
Tempo até ao último byte Para solicitações de streaming e não streaming; Tempo necessário para que o último byte de dados de resposta seja recebido após a solicitação ser feita pelo modelo. Aplica-se a implantações PTU, gerenciadas por PTU e Pay-as-you-go.	`AzureOpenAITTLTInMS`	Milissegundos	Máximo, Mínimo, Médio	`Region`, `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	Yes

Categoria: Azure OpenAI - Utilização

Métrico	Nome na API REST	Unidade	Agregação	Dimensões	Segmentos de tempo	DS Exportar
Tokens ativos Total de tokens menos tokens armazenados em cache durante um período de tempo. Aplica-se a implantações PTU e implantações geridas por PTU. Use essa métrica para entender sua utilização baseada em TPS ou TPM para PTUs e comparar com seus benchmarks para TPS ou TPM de destino para seus cenários. Para detalhar solicitações de API, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName e ModelVersion.	`ActiveTokens`	Contar	Mínimo, Máximo, Média, Total (Soma)	`Region`, `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	Yes
Tokens de conclusão de áudio Número de tokens de prompt de áudio gerados (saída) em um modelo OpenAI. Aplica-se a implantações de modelos gerenciados por PTU e Pay-as-you-go.	`AudioCompletionTokens`	Contar	Total (Quantidade)	`ModelDeploymentName`, `ModelName`, `ModelVersion`, `Region`	PT1M	Yes
Tokens de prompt de áudio Número de tokens de prompt de áudio processados (entrada) em um modelo OpenAI. Aplica-se a implantações de modelos gerenciados por PTU e Pay-as-you-go.	`AudioPromptTokens`	Contar	Total (Quantidade)	`ModelDeploymentName`, `ModelName`, `ModelVersion`, `Region`	PT1M	Yes
Taxa de correspondência de cache de token de prompt Porcentagem de tokens de prompt que atingem o cache. Aplica-se a implantações PTU e implantações geridas por PTU.	`AzureOpenAIContextTokensCacheMatchRate`	Percentagem	Mínimo, Máximo, Médio	`Region`, `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	Não
Utilização gerenciada provisionada (preterida) % de utilização para uma implantação gerenciada provisoriamente, calculada como (PTUs consumidas / PTUs implantadas) x 100. Quando a utilização é maior ou igual a 100%, as chamadas são limitadas e o código de erro 429 retornado. Para detalhar essa métrica, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName, ModelVersion e StreamType (Streaming vs solicitações não streaming)	`AzureOpenAIProvisionedManagedUtilization`	Percentagem	Mínimo, Máximo, Médio	`Region`, `StreamType`, `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	Não
Utilização gerenciada provisionada V2 % de utilização para uma implantação gerenciada provisoriamente, calculada como (PTUs consumidas / PTUs implantadas) x 100. Quando a utilização é maior ou igual a 100%, as chamadas são limitadas e o código de erro 429 retornado. Para detalhar essa métrica, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName, ModelVersion e StreamType (Streaming vs solicitações não streaming)	`AzureOpenAIProvisionedManagedUtilizationV2`	Percentagem	Mínimo, Máximo, Médio	`Region`, `StreamType`, `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	Não
Horas de treinamento FineTuned processadas Número de horas de treinamento processadas em um modelo OpenAI FineTuned	`FineTunedTrainingHours`	Contar	Total (Quantidade)	`ApiName`, `ModelDeploymentName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Tokens de conclusão gerados Número de tokens gerados (saída) a partir de um modelo OpenAI. Aplica-se a implantações PTU, gerenciadas por PTU e Pay-as-you-go. Para detalhar essa métrica, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName e ModelName.	`GeneratedTokens`	Contar	Total (Quantidade)	`ApiName`, `ModelDeploymentName`, `FeatureName`, `UsageChannel`, `Region`, `ModelVersion`	PT1M	Yes
Tokens de prompt processados Número de tokens de prompt processados (entrada) em um modelo OpenAI. Aplica-se a implantações PTU, gerenciadas por PTU e Pay-as-you-go. Para detalhar essa métrica, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName e ModelName.	`ProcessedPromptTokens`	Contar	Total (Quantidade)	`ApiName`, `ModelDeploymentName`, `FeatureName`, `UsageChannel`, `Region`, `ModelVersion`	PT1M	Yes
Segundos de API em tempo real utilizados Número de segundos usados na RealtimeAPI	`RealtimeUsageTime`	Contar	Total (Quantidade)	`Region`, `ModelDeploymentName`	PT1M	Yes
Tokens de inferência processados Número de tokens de inferência processados em um modelo OpenAI. Calculado como a soma dos tokens de prompt (entrada) e dos tokens gerados (saída). Aplica-se a implantações PTU, gerenciadas por PTU e Pay-as-you-go. Para detalhar essa métrica, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName e ModelName.	`TokenTransaction`	Contar	Total (Quantidade)	`ApiName`, `ModelDeploymentName`, `FeatureName`, `UsageChannel`, `Region`, `ModelVersion`	PT1M	Yes

Categoria: Serviços Cognitivos - Solicitações HTTP

Métrico	Nome na API REST	Unidade	Agregação	Dimensões	Segmentos de tempo	DS Exportar
Chamadas bloqueadas Número de chamadas que excederam o limite de tarifa ou quota. Não use para o Azure OpenAI service.	`BlockedCalls`	Contar	Total (Quantidade)	`ApiName`, `OperationName`, `Region`, `RatelimitKey`	PT1M	Yes
Erros do cliente Número de chamadas com erro do lado do cliente (código de resposta HTTP 4xx). Não use para o Azure OpenAI service.	`ClientErrors`	Contar	Total (Quantidade)	`ApiName`, `OperationName`, `Region`, `RatelimitKey`	PT1M	Yes
Dados de Entrada Tamanho dos dados recebidos em bytes. Não use para o Azure OpenAI service.	`DataIn`	Bytes	Total (Quantidade)	`ApiName`, `OperationName`, `Region`	PT1M	Yes
Saída de dados Tamanho dos dados de saída em bytes. Não use para o Azure OpenAI service.	`DataOut`	Bytes	Total (Quantidade)	`ApiName`, `OperationName`, `Region`	PT1M	Yes
Latency Latência em milissegundos. Não use para o Azure OpenAI service.	`Latency`	Milissegundos	Average	`ApiName`, `OperationName`, `Region`, `RatelimitKey`	PT1M	Yes
Limite de taxa O ratelimit atual da chave ratelimit. Não use para o Azure OpenAI service.	`Ratelimit`	Contar	Total (Quantidade)	`Region`, `RatelimitKey`	PT1M	Yes
Erros do servidor Número de chamadas com erro interno do serviço (código de resposta HTTP 5xx). Não use para o Azure OpenAI service.	`ServerErrors`	Contar	Total (Quantidade)	`ApiName`, `OperationName`, `Region`, `RatelimitKey`	PT1M	Yes
Chamadas bem-sucedidas Número de chamadas bem-sucedidas. Não use para o Azure OpenAI service.	`SuccessfulCalls`	Contar	Total (Quantidade)	`ApiName`, `OperationName`, `Region`, `RatelimitKey`	PT1M	Yes
Total de chamadas Número total de chamadas. Não use para o Azure OpenAI service.	`TotalCalls`	Contar	Total (Quantidade)	`ApiName`, `OperationName`, `Region`, `RatelimitKey`	PT1M	Yes
Total de erros Número total de chamadas com resposta de erro (código de resposta HTTP 4xx ou 5xx). Não use para o Azure OpenAI service.	`TotalErrors`	Contar	Total (Quantidade)	`ApiName`, `OperationName`, `Region`, `RatelimitKey`	PT1M	Yes
Total de chamadas de token Número total de chamadas de token.	`TotalTokenCalls`	Contar	Total (Quantidade)	`ApiName`, `OperationName`, `Region`	PT1M	Yes

Categoria: Serviços Cognitivos - SLI

Métrico	Nome na API REST	Unidade	Agregação	Dimensões	Segmentos de tempo	DS Exportar
DisponibilidadeTarifa Percentagem de disponibilidade com o seguinte cálculo: (Total de Chamadas - Erros do Servidor)/Total de Chamadas. Os erros do servidor incluem quaisquer respostas de HTTP >=500. Não use para o Azure OpenAI service.	`SuccessRate`	Percentagem	Mínimo, Máximo, Médio	`ApiName`, `OperationName`, `Region`, `RatelimitKey`	PT1M	Não

Categoria: ContentSafety - Riscos&Segurança

Métrico	Nome na API REST	Unidade	Agregação	Dimensões	Segmentos de tempo	DS Exportar
Contagem de usuários potencialmente abusiva Número de utilizadores potencialmente abusivos detetados ao longo de um período de tempo. Você pode adicionar um filtro ou aplicar a divisão pela seguinte dimensão: ModelDeploymentName.	`RAIAbusiveUsersCount`	Contar	Total (Quantidade)	`Region`, `ModelDeploymentName`	PT1M	Yes
Volume nocivo detetado Número de chamadas feitas para a API OpenAI do Azure e detetadas como prejudiciais (tanto modelo de bloco como modo de anotação) pelo filtro de conteúdo aplicado ao longo do tempo. Você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName e TextType.	`RAIHarmfulRequests`	Contar	Total (Quantidade)	`Region`, `ModelDeploymentName`, `ModelNameModelVersion`, , `ApiName`, `TextType`, `Category`,`Severity`	PT1M	Yes
Volume bloqueado Número de chamadas feitas para a API OpenAI do Azure e rejeitadas pelo filtro de conteúdo aplicado ao longo do tempo. Você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName e TextType.	`RAIRejectedRequests`	Contar	Total (Quantidade)	`Region`, `ModelDeploymentName`, `ModelName`, `ModelVersion`, `ApiName`, `TextType`, `Category`	PT1M	Yes
Evento do Sistema de Segurança Evento do sistema para riscos e monitoramento de segurança. Você pode adicionar um filtro ou aplicar a divisão pela seguinte dimensão: EventType.	`RAISystemEvent`	Contar	Average	`Region`, `EventType`	PT1M	Yes
Volume total enviado para verificação de segurança Número de chamadas feitas para a API OpenAI do Azure e detetadas pelo filtro de conteúdo aplicado ao longo do tempo. Você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName.	`RAITotalRequests`	Contar	Total (Quantidade)	`Region`, `ModelDeploymentName`, `ModelName`, `ModelVersion`, `ApiName`	PT1M	Yes

Categoria: ContentSafety - Utilização

Métrico	Nome na API REST	Unidade	Agregação	Dimensões	Segmentos de tempo	DS Exportar
Contagem de chamadas para moderação de imagem Número de chamadas para moderação de imagem.	`ContentSafetyImageAnalyzeRequestCount`	Contar	Total (Quantidade)	`ApiVersion`	PT1M	Yes
Contagem de chamadas para moderação de texto Número de apelos à moderação de texto.	`ContentSafetyTextAnalyzeRequestCount`	Contar	Total (Quantidade)	`ApiVersion`	PT1M	Yes

Categoria: Estimativas

Métrico	Nome na API REST	Unidade	Agregação	Dimensões	Segmentos de tempo	DS Exportar
Contagem de eventos aleatórios da linha de base Estimativa para a contagem de eventos aleatórios na linha de base.	`BaselineRandomEventCount`	Contar	Total (Quantidade)	`Mode`, `RunId`	PT1M	Yes
Recompensa aleatória da linha de base Estimativa da recompensa aleatória inicial.	`BaselineRandomReward`	Contar	Total (Quantidade)	`Mode`, `RunId`	PT1M	Yes
Contagem de Eventos Online Estimativa para contagem de eventos online.	`OnlineEventCount`	Contar	Total (Quantidade)	`Mode`, `RunId`	PT1M	Yes
Recompensa Online Estimativa para recompensa online.	`OnlineReward`	Contar	Total (Quantidade)	`Mode`, `RunId`	PT1M	Yes
Contagem de eventos da linha de base do usuário Estimativa para a contagem de eventos da linha de base definida pelo usuário.	`UserBaselineEventCount`	Contar	Total (Quantidade)	`Mode`, `RunId`	PT1M	Yes
Recompensa da linha de base do usuário Estimativa da recompensa de base definida pelo utilizador.	`UserBaselineReward`	Contar	Total (Quantidade)	`Mode`, `RunId`	PT1M	Yes

Categoria: Ocorrências de recursos

Métrico	Nome na API REST	Unidade	Agregação	Dimensões	Segmentos de tempo	DS Exportar
Ocorrências de recursos de ação Número de vezes que cada recurso de ação é exibido.	`ActionFeatureIdOccurrences`	Contar	Total (Quantidade)	`FeatureId`, `Mode`, `RunId`	PT1M	Yes
Ocorrências de recursos de contexto Número de vezes que cada recurso de contexto aparece.	`ContextFeatureIdOccurrences`	Contar	Total (Quantidade)	`FeatureId`, `Mode`, `RunId`	PT1M	Yes
Ocorrências de recursos de slot Número de vezes que cada recurso de slot aparece.	`SlotFeatureIdOccurrences`	Contar	Total (Quantidade)	`FeatureId`, `Mode`, `RunId`	PT1M	Yes

Categoria: FeatureCardinality

Métrico	Nome na API REST	Unidade	Agregação	Dimensões	Segmentos de tempo	DS Exportar
Funcionalidade Cardinalidade por Ação Característica: Cardinalidade baseada em Ação.	`FeatureCardinality_Action`	Contar	Average	`FeatureId`, `Mode`, `RunId`	PT1M	Yes
Cardinalidade do recurso por contexto Cardinalidade do recurso com base no contexto.	`FeatureCardinality_Context`	Contar	Average	`FeatureId`, `Mode`, `RunId`	PT1M	Yes
Cardinalidade do recurso por slot Característica: Cardinalidade baseada no Slot.	`FeatureCardinality_Slot`	Contar	Average	`FeatureId`, `Mode`, `RunId`	PT1M	Yes

Categoria: Características por evento

Métrico	Nome na API REST	Unidade	Agregação	Dimensões	Segmentos de tempo	DS Exportar
Recursos de ação por evento Número médio de recursos de ação por evento.	`ActionFeaturesPerEvent`	Contar	Average	`Mode`, `RunId`	PT1M	Yes
Recursos de contexto por evento Número de recursos de contexto por evento.	`ContextFeaturesPerEvent`	Contar	Average	`Mode`, `RunId`	PT1M	Yes
Características das ranhuras por evento Número médio de recursos de slots por evento.	`SlotFeaturesPerEvent`	Contar	Average	`Mode`, `RunId`	PT1M	Yes

Categoria: Língua - Empregos

Métrico	Nome na API REST	Unidade	Agregação	Dimensões	Segmentos de tempo	DS Exportar
Duração do trabalho (visualização) Nota: este valor depende muito do tamanho da entrada, do número de documentos e da complexidade da tarefa. Este é um valor agregado em todas as tarefas de trabalho.	`JobDuration`	Milissegundos	Mínimo, Máximo, Médio	`JobStatus`, `JobType`	PT1M	Yes

Categoria: Modelos - Solicitações HTTP

Métrico	Nome na API REST	Unidade	Agregação	Dimensões	Segmentos de tempo	DS Exportar
Taxa de disponibilidade do modelo Percentagem de disponibilidade com o seguinte cálculo: (Total de Chamadas - Erros do Servidor)/Total de Chamadas. Os erros do servidor incluem quaisquer respostas de HTTP >=500.	`ModelAvailabilityRate`	Percentagem	Mínimo, Máximo, Médio	`Region`, `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	Não
Solicitações de modelo Número de chamadas feitas para a API do modelo durante um período de tempo. Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go.	`ModelRequests`	Contar	Total (Quantidade)	`ApiName`, `OperationName`, `RegionStreamType`, , `ModelDeploymentName`, , `ModelNameModelVersionStatusCodeIsSpilloverServiceTierRequestServiceTierResponse`	PT1M	Yes

Categoria: Modelos - Latência

Métrico	Nome na API REST	Unidade	Agregação	Dimensões	Segmentos de tempo	DS Exportar
Tempo entre tokens Para pedidos de streaming; Taxa de geração de token do modelo, medida em milissegundos. Aplica-se a implantações PTU e implantações geridas por PTU.	`NormalizedTimeBetweenTokens`	Milissegundos	Máximo, Mínimo, Médio	`ApiName`, `OperationName`, `Region`, `StreamType`, `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	Yes
Tempo normalizado para o primeiro byte Para solicitações de streaming e não streaming; Tempo que leva para que o primeiro byte de dados de resposta seja recebido após a solicitação ser feita pelo modelo, normalizado por token. Aplica-se a implantações PTU, gerenciadas por PTU e Pay-as-you-go.	`NormalizedTimeToFirstToken`	Milissegundos	Máximo, Mínimo, Médio	`ApiName`, `OperationName`, `Region`, `StreamType`, `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	Yes
Tempo até ao último byte Para solicitações de streaming e não streaming; Tempo necessário para que o último byte de dados de resposta seja recebido após a solicitação ser feita pelo modelo. Aplica-se a implantações PTU, gerenciadas por PTU e Pay-as-you-go.	`TimeToLastByte`	Milissegundos	Máximo, Mínimo, Médio	`ApiName`, `OperationName`, `Region`, `StreamType`, `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	Yes
Tempo de resposta Medida de latência (capacidade de resposta) recomendada para solicitações de streaming. Aplica-se a implantações PTU e implantações geridas por PTU. Calculado como o tempo necessário para que a primeira resposta apareça depois que um usuário envia um prompt, conforme medido pelo gateway de API. Esse número aumenta à medida que o tamanho do prompt aumenta e/ou o tamanho dos acessos ao cache diminui. Para detalhar o tempo até a métrica de resposta, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName e ModelVersion. Nota: essa métrica é uma aproximação, pois a latência medida depende fortemente de vários fatores, incluindo chamadas simultâneas e padrão geral de carga de trabalho. Além disso, ele não leva em conta qualquer latência do lado do cliente que possa existir entre seu cliente e o ponto de extremidade da API. Consulte seu próprio registro para obter o rastreamento de latência ideal.	`TimeToResponse`	Milissegundos	Mínimo, Máximo, Médio	`ApiName`, `OperationName`, `RegionStreamType`, , `ModelDeploymentName`, `ModelName`, `ModelVersion`,`StatusCode`	PT1M	Yes
Tokens por segundo Enumera a velocidade de geração para uma determinada resposta do modelo. O total de tokens gerados é dividido pelo tempo para gerar os tokens, em segundos. Aplica-se a implantações PTU e implantações geridas por PTU.	`TokensPerSecond`	Contar	Máximo, Mínimo, Médio	`ApiName`, `OperationName`, `Region`, `StreamType`, `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	Yes

Categoria: Modelos - Utilização

Métrico	Nome na API REST	Unidade	Agregação	Dimensões	Segmentos de tempo	DS Exportar
Páginas Anotadas Número total de páginas processadas com anotações. Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go.	`AnnotatedPages`	Contar	Total (Quantidade)	`ApiName`, `Region`, `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	Yes
Tokens de entrada de áudio Número de tokens de prompt de áudio processados (entrada) em um modelo OpenAI. Aplica-se a implantações de modelo gerenciado por PTU.	`AudioInputTokens`	Contar	Total (Quantidade)	`ModelDeploymentName`, `ModelName`, `ModelVersion`, `Region`	PT1M	Yes
Tokens de saída de áudio Número de tokens de prompt de áudio gerados (saída) em um modelo OpenAI. Aplica-se a implantações de modelo gerenciado por PTU.	`AudioOutputTokens`	Contar	Total (Quantidade)	`ModelDeploymentName`, `ModelName`, `ModelVersion`, `Region`	PT1M	Yes
Tokens de prompt lidos da cache Número total de tokens lidos da cache. Aplica-se a implementações de modelos antrópicos. Surgiu na secção de utilização de resposta como `cache_read_input_tokens`	`cacheReadInputTokens`	Contar	Total (Quantidade)	`ApiName`, `Region`, `ModelDeploymentName`, `ModelName`, `ModelVersion`, `ContextLength`	PT1M	Yes
Tokens de prompt escritos para cache (TTL de 1 hora) O número de tokens de prompt usados para criar a entrada de 1 hora. Aplica-se a implementações de modelos antrópicos. Surgiu na secção de utilização de resposta como `cache_creation.ephemeral_1h_input_tokens`	`ephemeral1hInputTokens`	Contar	Total (Quantidade)	`ApiName`, `Region`, `ModelDeploymentName`, `ModelName`, `ModelVersion`, `ContextLength`	PT1M	Yes
Tokens de prompt escritos para cache (TTL de 5 minutos) O número de tokens de prompt usados para criar a entrada do cache de 5 minutos. Aplica-se a implementações de modelos antrópicos. Surgiu na secção de utilização de resposta como `cache_creation.ephemeral_5m_input_tokens`	`ephemeral5mInputTokens`	Contar	Total (Quantidade)	`ApiName`, `Region`, `ModelDeploymentName`, `ModelName`, `ModelVersion`, `ContextLength`	PT1M	Yes
Imagens Geradas Número total de imagens geradas. Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go.	`GeneratedImages`	Contar	Total (Quantidade)	`ApiName`, `Region`, `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	Yes
Tokens de entrada Número de tokens de prompt processados (entrada) num modelo. Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go.	`InputTokens`	Contar	Total (Quantidade)	`ApiName`, `Region`, `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	Yes
Tokens de saída Número de tokens gerados (saída) a partir de um modelo OpenAI. Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go.	`OutputTokens`	Contar	Total (Quantidade)	`ApiName`, `Region`, `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	Yes
Utilização provisionada % de utilização para uma implantação gerenciada provisoriamente, calculada como (PTUs consumidas / PTUs implantadas) x 100. Quando a utilização é maior ou igual a 100%, as chamadas são limitadas e o código de erro 429 retornado.	`ProvisionedUtilization`	Percentagem	Mínimo, Máximo, Médio	`Region`, `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	Não
Total de Páginas Número total de páginas processadas. Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go.	`TotalPages`	Contar	Total (Quantidade)	`ApiName`, `Region`, `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	Yes
Total Tokens Número de tokens de inferência processados em um modelo. Calculado como a soma dos tokens de prompt (entrada) e dos tokens gerados (saída). Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go.	`TotalTokens`	Contar	Total (Quantidade)	`ApiName`, `Region`, `ModelDeploymentName`, `ModelName`, `ModelVersion`	PT1M	Yes

Categoria: Namespaces por evento

Métrico	Nome na API REST	Unidade	Agregação	Dimensões	Segmentos de tempo	DS Exportar
Namespaces de ação por evento Número médio de namespaces de ação por evento.	`ActionNamespacesPerEvent`	Contar	Average	`Mode`, `RunId`	PT1M	Yes
Namespaces de contexto por evento Número de namespaces de contexto por evento.	`ContextNamespacesPerEvent`	Contar	Average	`Mode`, `RunId`	PT1M	Yes
Namespaces de slot por evento Número médio de namespaces de slot por evento.	`SlotNamespacesPerEvent`	Contar	Average	`Mode`, `RunId`	PT1M	Yes

Categoria: Recompensas

Métrico	Nome na API REST	Unidade	Agregação	Dimensões	Segmentos de tempo	DS Exportar
Recompensa média por evento Recompensa média por evento.	`Reward`	Contar	Average	`BaselineAction`, `ChosenActionId`, `MatchesBaseline`, `NonDefaultReward`, `Mode`, `RunId`	PT1M	Yes
Recompensa por Slots Recompensa por slot.	`SlotReward`	Contar	Average	`BaselineActionId`, `ChosenActionId`, `MatchesBaselineNonDefaultReward`, , `SlotId`, `SlotIndex`, `Mode`,`RunId`	PT1M	Yes

Categoria: Slots

Métrico	Nome na API REST	Unidade	Agregação	Dimensões	Segmentos de tempo	DS Exportar
Estimativa da linha de base: Recompensa global Estimador da linha de base Recompensa Global.	`BaselineEstimatorOverallReward`	Contar	Average	`Mode`, `RunId`	PT1M	Yes
Recompensa do Slot do Estimador de Linha de Base Recompensa do estimador de linha de base por slot.	`BaselineEstimatorSlotReward`	Contar	Average	`SlotId`, `SlotIndex`, `Mode`, `RunId`	PT1M	Yes
Estimador Aleatório da Linha de Base Recompensa Global Estimador Aleatório da Linha de Base Recompensa Global.	`BaselineRandomEstimatorOverallReward`	Contar	Average	`Mode`, `RunId`	PT1M	Yes
Recompensa de Slot do Estimador Aleatório da Linha de Base Estimador Aleatório de Linha de Base Recompensa por slot.	`BaselineRandomEstimatorSlotReward`	Contar	Average	`SlotId`, `SlotIndex`, `Mode`, `RunId`	PT1M	Yes
Faixas horárias Número de slots por evento.	`NumberOfSlots`	Contar	Average	`Mode`, `RunId`	PT1M	Yes
Estimador Online Recompensa Geral Estimador Online Recompensa Geral.	`OnlineEstimatorOverallReward`	Contar	Average	`Mode`, `RunId`	PT1M	Yes
Recompensa de Slot Estimador Online Estimador Online Recompensa por slot.	`OnlineEstimatorSlotReward`	Contar	Average	`SlotId`, `SlotIndex`, `Mode`, `RunId`	PT1M	Yes
Ocorrências de Slots Número de vezes que cada ranhura é apresentada.	`SlotIdOccurrences`	Contar	Total (Quantidade)	`SlotId`, `SlotIndex`, `Mode`, `RunId`	PT1M	Yes

Categoria: SpeechServices - Uso

Métrico	Nome na API REST	Unidade	Agregação	Dimensões	Segmentos de tempo	DS Exportar
Lote de segundos de áudio transcrito Número de segundos transcritos	`AudioSecondsBatchTranscribed`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Sussurro em lote de segundos de áudio transcrito Número de segundos transcritos	`AudioSecondsBatchWhisperTranscribed`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Segundos de áudio rapidamente transcritos Número rápido de segundos transcritos	`AudioSecondsFastTranscribed`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Sussurro rápido de segundos de áudio transcrito Sussurro rápido número de segundos transcritos	`AudioSecondsFastWhisperTranscribed`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Segundos de áudio transcritos Número de segundos transcritos	`AudioSecondsTranscribed`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Segundos de áudio traduzidos Número de segundos traduzidos	`AudioSecondsTranslated`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Segundos de Hospedagem do Modelo de Avatar Número de segundos.	`AvatarModelHostingSeconds`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Segundos de treinamento do modelo de avatar Número de segundos.	`AvatarModelTrainingSeconds`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Número de perfis de oradores Número de perfis de oradores inscritos. Rateado de hora em hora.	`NumberofSpeakerProfiles`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Transações de reconhecimento de alto-falante Número de transações de reconhecimento de alto-falante	`SpeakerRecognitionTransactions`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Horas de hospedagem do modelo de fala Número de horas de hospedagem do modelo de fala	`SpeechModelHostingHours`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Caracteres sintetizados Número de caracteres.	`SynthesizedCharacters`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Segundos de vídeo sintetizados Número de segundos sintetizados	`VideoSecondsSynthesized`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Tokens de Entrada de Áudio ao Vivo por Voz Número de tokens de entrada áudio, excluindo tokens em cache.	`VoiceLiveAudioInputTokens`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Tokens de Saída de Áudio ao Vivo de Voz Número de tokens de saída áudio.	`VoiceLiveAudioOutputTokens`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Tokens de Entrada de Áudio em Cache de Voz ao Vivo Número de tokens de entrada áudio em cache.	`VoiceLiveCachedAudioInputTokens`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Tokens de Entrada de Texto em Cache Voice Live Número de tokens de entrada de texto em cache.	`VoiceLiveCachedTextInputTokens`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Tokens de Entrada de Texto ao Vivo por Voz Número de tokens de entrada de texto, excluindo tokens em cache.	`VoiceLiveTextInputTokens`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Tokens de Saída de Texto ao Vivo por Voz Número de tokens de saída de texto.	`VoiceLiveTextOutputTokens`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Horas de hospedagem do modelo de voz Número de Horas.	`VoiceModelHostingHours`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Minutos de treinamento do modelo de voz Número de minutos.	`VoiceModelTrainingMinutes`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes

Categoria: Serviços de Translator - Utilização

Métrico	Nome na API REST	Unidade	Agregação	Dimensões	Segmentos de tempo	DS Exportar
Personagens treinados (preterido) Número total de caracteres treinados.	`CharactersTrained`	Contar	Total (Quantidade)	`ApiName`, `OperationName`, `Region`	PT1M	Yes
Caracteres traduzidos (preteridos) Número total de caracteres na solicitação de texto de entrada.	`CharactersTranslated`	Contar	Total (Quantidade)	`ApiName`, `OperationName`, `Region`	PT1M	Yes
Caracteres do documento traduzidos Número de caracteres no pedido de tradução de documentos.	`DocumentCharactersTranslated`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Caracteres personalizados do documento traduzidos Número de caracteres na solicitação de tradução de documentos personalizados.	`DocumentCustomCharactersTranslated`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Caracteres de sincronização de documentos traduzidos Número de caracteres na solicitação de tradução de documentos (síncrona).	`OneDocumentCharactersTranslated`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Sincronização de documentos Caracteres personalizados traduzidos Número de caracteres na solicitação de conversão de documento personalizada (síncrona).	`OneDocumentCustomCharactersTranslated`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Caracteres de texto traduzidos Número de caracteres na solicitação de tradução de texto recebida.	`TextCharactersTranslated`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Caracteres personalizados de texto traduzidos Número de caracteres na solicitação de tradução de texto personalizado recebida.	`TextCustomCharactersTranslated`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Caracteres treinados em texto Número de caracteres treinados usando tradução de texto.	`TextTrainedCharacters`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Translator Pro App Segundos Número de segundos de utilização da aplicação Translator Pro.	`TranslatorProAppSeconds`	Segundos	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes

Categoria: Uso

Métrico	Nome na API REST	Unidade	Agregação	Dimensões	Segmentos de tempo	DS Exportar
Contagem de inferência Serviço de Inferência Conde de Carnegie Frontdoor	`CarnegieInferenceCount`	Contar	Total (Quantidade)	`Region`, `Modality`, `Category`, `Language`, `SeverityLevel`, `UseCustomList`	PT1M	Yes
Computer Vision Transações Número de Transações de Computer Vision	`ComputerVisionTransactions`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Custom Vision Tempo de Treino Tempo de treino Custom Vision	`CustomVisionTrainingTime`	Segundos	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Custom Vision Transações Número de transações de previsão do Custom Vision	`CustomVisionTransactions`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Imagens de rosto treinadas Número de imagens treinadas. 1.000 imagens treinadas por transação.	`FaceImagesTrained`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Rostos armazenados Número de rostos armazenados, rateados diariamente. O número de faces armazenadas é relatado diariamente.	`FacesStored`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Transações faciais Número de chamadas de API feitas para o serviço Face	`FaceTransactions`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Imagens armazenadas Número de imagens Custom Vision armazenadas.	`ImagesStored`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Eventos aprendidos Número de Eventos Aprendidos.	`LearnedEvents`	Contar	Total (Quantidade)	`IsMatchBaseline`, `Mode`, `RunId`	PT1M	Yes
Pedidos de Fala LUIS Número de solicitações de compreensão de fala para intenção do LUIS	`LUISSpeechRequests`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Pedidos de texto LUIS Número de pedidos de texto LUIS	`LUISTextRequests`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Recompensas Correspondentes Número de recompensas correspondentes.	`MatchedRewards`	Contar	Total (Quantidade)	`Mode`, `RunId`	PT1M	Yes
Eventos não ativados Número de eventos ignorados.	`NonActivatedEvents`	Contar	Total (Quantidade)	`Mode`, `RunId`	PT1M	Yes
Recompensas Observadas Número de recompensas observadas.	`ObservedRewards`	Contar	Total (Quantidade)	`Mode`, `RunId`	PT1M	Yes
Caracteres processados Número de caracteres processados pelo Immersive Reader.	`ProcessedCharacters`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Registros de texto de integridade processados Número de registos de texto de saúde processados	`ProcessedHealthTextRecords`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Imagens processadas Número de imagens processadas	`ProcessedImages`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Páginas processadas Número de páginas processadas	`ProcessedPages`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Registros de texto processados Contagem de registros de texto.	`ProcessedTextRecords`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Registros de texto de controle de qualidade Número de registos de texto processados	`QuestionAnsweringTextRecords`	Contar	Total (Quantidade)	`ApiName`, `FeatureName`, `UsageChannel`, `Region`	PT1M	Yes
Duração da sessão de fala (preterido) Duração total da sessão de fala em segundos.	`SpeechSessionDuration`	Segundos	Total (Quantidade)	`ApiName`, `OperationName`, `Region`	PT1M	Yes
Total de Eventos Número de eventos.	`TotalEvents`	Contar	Total (Quantidade)	`Mode`, `RunId`	PT1M	Yes
Total de transações (preterido) Número total de transações.	`TotalTransactions`	Contar	Total (Quantidade)	<nenhum>	PT1M	Yes

Dimensões métricas

Para informações sobre o que são dimensões métricas, veja Métricas multidimensionais.

Este serviço tem as seguintes dimensões associadas às suas métricas.

ApiName
Nome da Funcionalidade
ModelDeploymentName
Nome do modelo
Versão do Modelo
Nome da operação
Região
Código de estado
Tipo de fluxo
UsageChannel

Registos de recursos

Esta seção lista os tipos de logs de recursos que você pode coletar para este serviço. A secção extrai da lista de tipos de categorias de registos todos os recursos suportados no Azure Monitor.

Logs de recursos suportados para Microsoft.CognitiveServices/accounts

Categoria	Nome de exibição da categoria	Tabela de logs	Suporta plano básico de registo	Suporta a transformação do tempo de ingestão	Custos de exportação
`Audit`	Registos de Auditoria	AzureDiagnostics Registos de múltiplos recursos do Azure.	Não	Não	Não
`AzureOpenAIRequestUsage`	Azure OpenAI Utilização de Pedidos	AzureDiagnostics Registos de múltiplos recursos do Azure.	Não	Não	Yes
`RequestResponse`	Registos de Pedidos e Respostas	AzureDiagnostics Registos de múltiplos recursos do Azure.	Não	Não	Não
`Trace`	Registos de rastreamento	AzureDiagnostics Registos de múltiplos recursos do Azure.	Não	Não	Não

Azure Monitor Logs tabelas

Esta secção lista as tabelas de Logs do Azure Monitor relevantes para este serviço, que estão disponíveis para consulta pelo Log Analytics através de consultas Kusto. As tabelas contêm dados de log de recursos e possivelmente mais, dependendo do que é coletado e roteado para elas.

Azure OpenAI microsoft.cognitiveservices/accounts

Registo de atividades

A tabela vinculada lista as operações que podem ser registradas no log de atividades desse serviço. Estas operações são um subconjunto de todas as operações possíveis do fornecedor de recursos no registo de atividade.

Para mais informações sobre o esquema das entradas do registo de atividade, consulte Esquema do Registo de Atividade.

AI + machine learning operações do fornecedor de recursos

Consulte Monitor Azure OpenAI para uma descrição da monitorização Azure OpenAI.
Consulte Monitor Azure recursos com Azure Monitor para detalhes sobre a monitorização Azure recursos.

Comentários

Esta página foi útil?

Last updated on 2026-02-28