Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Este artigo contém todas as informações de referência de monitoramento para este serviço.
Consulte Monitor Azure OpenAI para detalhes sobre os dados que pode recolher para Azure OpenAI nos Microsoft Foundry Models e como os utilizar.
Métricas
Esta seção lista todas as métricas de plataforma coletadas automaticamente para este serviço. Estas métricas também fazem parte da lista global de métricas all da plataforma suportadas no Azure Monitor.
Para informações sobre retenção de métricas, consulte Azure Visão geral das Métricas de Monitorização.
Métricas suportadas para Microsoft.CognitiveServices/accounts
Aqui estão as métricas mais importantes que achamos que deve monitorizar para o Azure OpenAI. Mais adiante neste artigo é uma lista mais longa de todas as métricas disponíveis para este namespace que contém mais detalhes sobre métricas nesta lista mais curta. Por favor, veja a lista abaixo para obter as informações mais atualizadas. Estamos trabalhando para atualizar as tabelas nas seções a seguir.
- Azure OpenAI Requests
- Tokens ativos
- Tokens de conclusão gerados
- Horas de treinamento FineTuned processadas
- Tokens de inferência processados
- Tokens de prompt processados
- Utilização gerenciada provisionada V2
- Taxa de correspondência de cache de token de prompt
- Tempo de resposta
- Tempo entre tokens
- Tempo até ao último byte
- Tempo normalizado para o primeiro byte
- Tokens por segundo
Você também pode monitorar as métricas de Segurança de Conteúdo usadas por outros serviços relacionados.
- Volume bloqueado
- Volume nocivo detetado
- Potencial número de usuários abusivos
- Evento do Sistema de Segurança
- Volume total enviado para verificação de segurança
Observação
A métrica Utilização gerenciada por provisionamento agora foi preterida e não é mais recomendada. Essa métrica foi substituída pela métrica Utilização gerenciada provisionada V2 . Tokens por segundo, tempo de resposta e tempo entre tokens não estão disponíveis atualmente para implantações padrão.
As métricas de Serviços Cognitivos têm a categoria Serviços Cognitivos - Solicitações HTTP na tabela a seguir. Essas métricas são métricas legadas que são comuns a todos os recursos desse tipo. A Microsoft já não recomenda que utilize estas métricas com o Azure OpenAI.
A tabela a seguir lista as métricas disponíveis para o tipo de recurso Microsoft.CognitiveServices/accounts.
- Nem todas as colunas podem estar presentes em todas as tabelas.
- Algumas colunas podem estar além da área de visualização da página. Selecione Expandir tabela para visualizar todas as colunas disponíveis.
Cabeçalhos de tabela
- Categoria - O grupo ou classificação de métricas.
- Metric - O nome de visualização métrico tal como aparece na Azure portal.
- Name na API REST - O nome da métrica referido na API REST.
- Unidade - Unidade de medida.
- Aggregation - O tipo padrão aggregation. Valores válidos: Média (Média), Mínima (Mín), Máxima (Máx), Total (Soma), Contagem.
- Dimensões - Dimensões disponível para a métrica.
Grãos de Tempo c2 em que a métrica é amostrada. Por exemplo, PT1Mindica que a métrica é amostrada a cada minuto,PT30Ma cada 30 minutos,PT1Ha cada hora e assim por diante.- DS Export- Se a métrica é exportável para Azure Registos de Monitorização através das definições de diagnóstico. Para informações sobre exportação de métricas, consulte Criar definições de diagnóstico no Azure Monitor.
Categoria: Ações
| Métrico | Nome na API REST | Unidade | Agregação | Dimensões | Segmentos de tempo | DS Exportar |
|---|---|---|---|---|---|---|
|
Ocorrências de Ação Número de vezes que cada ação é exibida. |
ActionIdOccurrences |
Contar | Total (Quantidade) |
ActionId, Mode, RunId |
PT1M | Yes |
|
Ações por evento Número de ações por evento. |
ActionsPerEvent |
Contar | Average |
Mode, RunId |
PT1M | Yes |
Categoria: Azure OpenAI - Pedidos HTTP
| Métrico | Nome na API REST | Unidade | Agregação | Dimensões | Segmentos de tempo | DS Exportar |
|---|---|---|---|---|---|---|
|
Azure OpenAI AvailabilityRate Percentagem de disponibilidade com o seguinte cálculo: (Total de Chamadas - Erros do Servidor)/Total de Chamadas. Os erros do servidor incluem quaisquer respostas de HTTP >=500. |
AzureOpenAIAvailabilityRate |
Percentagem | Mínimo, Máximo, Médio |
ApiName, OperationName, Region, StreamType, ModelDeploymentName, ModelName, ModelVersion |
PT1M | Não |
|
Azure Pedidos OpenAI Número de chamadas feitas para a API OpenAI do Azure ao longo do tempo. Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go. Para detalhar os pedidos da API, pode adicionar um filtro ou aplicar divisão pelas seguintes dimensões: ModelDeploymentName, ModelName, ModelVersion, StatusCode (sucesso, clientes erros, erros do servidor), IsSpillover para informação de spillover, ServiceTier, StreamType (pedidos de streaming vs não-streaming) e operação. |
AzureOpenAIRequests |
Contar | Total (Quantidade) |
ApiName, OperationName, RegionStreamType, , ModelDeploymentName, , ModelNameModelVersionStatusCodeIsSpilloverServiceTierRequestServiceTierResponse |
PT1M | Yes |
Categoria: Azure OpenAI - Latência
| Métrico | Nome na API REST | Unidade | Agregação | Dimensões | Segmentos de tempo | DS Exportar |
|---|---|---|---|---|---|---|
|
Tempo entre Token Para pedidos de streaming, medição da taxa de geração de tokens do modelo em milissegundos. Aplica-se a implantações PTU, gerenciadas por PTU e Pay-as-you-go. |
AzureOpenAINormalizedTBTInMS |
Milissegundos | Máximo, Mínimo, Médio |
Region, ModelDeploymentName, ModelName, ModelVersion |
PT1M | Yes |
|
Tempo normalizado para o primeiro byte Para solicitações de streaming e não streaming; Tempo que leva para que o primeiro byte de dados de resposta seja recebido após a solicitação ser feita pelo modelo, normalizado por token. Aplica-se a implantações PTU, gerenciadas por PTU e Pay-as-you-go. |
AzureOpenAINormalizedTTFTInMS |
Milissegundos | Máximo, Mínimo, Médio |
Region, ModelDeploymentName, ModelName, ModelVersion |
PT1M | Yes |
|
Tempo de resposta Medida de latência (capacidade de resposta) recomendada para solicitações de streaming. Aplica-se a implantações PTU, gerenciadas por PTU e Pay-as-you-go. Calculado como o tempo necessário para que a primeira resposta apareça depois que um usuário envia um prompt, conforme medido pelo gateway de API. Esse número aumenta à medida que o tamanho do prompt aumenta e/ou o tamanho dos acessos ao cache diminui. Para detalhar o tempo até a métrica de resposta, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName e ModelVersion. Nota: essa métrica é uma aproximação, pois a latência medida depende fortemente de vários fatores, incluindo chamadas simultâneas e padrão geral de carga de trabalho. Além disso, ele não leva em conta qualquer latência do lado do cliente que possa existir entre seu cliente e o ponto de extremidade da API. Consulte seu próprio registro para obter o rastreamento de latência ideal. |
AzureOpenAITimeToResponse |
Milissegundos | Mínimo, Máximo, Médio |
ApiName, OperationName, RegionStreamType, , ModelDeploymentName, ModelName, ModelVersion,StatusCode |
PT1M | Yes |
|
Tokens por segundo Enumera a velocidade de geração para a resposta de um dado modelo Azure OpenAI. O total de tokens gerados é dividido pelo tempo para gerar os tokens, em segundos. Aplica-se a implantações PTU, gerenciadas por PTU e Pay-as-you-go. |
AzureOpenAITokenPerSecond |
Contar | Máximo, Mínimo, Médio |
Region, ModelDeploymentName, ModelName, ModelVersion |
PT1M | Yes |
|
Tempo até ao último byte Para solicitações de streaming e não streaming; Tempo necessário para que o último byte de dados de resposta seja recebido após a solicitação ser feita pelo modelo. Aplica-se a implantações PTU, gerenciadas por PTU e Pay-as-you-go. |
AzureOpenAITTLTInMS |
Milissegundos | Máximo, Mínimo, Médio |
Region, ModelDeploymentName, ModelName, ModelVersion |
PT1M | Yes |
Categoria: Azure OpenAI - Utilização
| Métrico | Nome na API REST | Unidade | Agregação | Dimensões | Segmentos de tempo | DS Exportar |
|---|---|---|---|---|---|---|
|
Tokens ativos Total de tokens menos tokens armazenados em cache durante um período de tempo. Aplica-se a implantações PTU e implantações geridas por PTU. Use essa métrica para entender sua utilização baseada em TPS ou TPM para PTUs e comparar com seus benchmarks para TPS ou TPM de destino para seus cenários. Para detalhar solicitações de API, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName e ModelVersion. |
ActiveTokens |
Contar | Mínimo, Máximo, Média, Total (Soma) |
Region, ModelDeploymentName, ModelName, ModelVersion |
PT1M | Yes |
|
Tokens de conclusão de áudio Número de tokens de prompt de áudio gerados (saída) em um modelo OpenAI. Aplica-se a implantações de modelos gerenciados por PTU e Pay-as-you-go. |
AudioCompletionTokens |
Contar | Total (Quantidade) |
ModelDeploymentName, ModelName, ModelVersion, Region |
PT1M | Yes |
|
Tokens de prompt de áudio Número de tokens de prompt de áudio processados (entrada) em um modelo OpenAI. Aplica-se a implantações de modelos gerenciados por PTU e Pay-as-you-go. |
AudioPromptTokens |
Contar | Total (Quantidade) |
ModelDeploymentName, ModelName, ModelVersion, Region |
PT1M | Yes |
|
Taxa de correspondência de cache de token de prompt Porcentagem de tokens de prompt que atingem o cache. Aplica-se a implantações PTU e implantações geridas por PTU. |
AzureOpenAIContextTokensCacheMatchRate |
Percentagem | Mínimo, Máximo, Médio |
Region, ModelDeploymentName, ModelName, ModelVersion |
PT1M | Não |
|
Utilização gerenciada provisionada (preterida) % de utilização para uma implantação gerenciada provisoriamente, calculada como (PTUs consumidas / PTUs implantadas) x 100. Quando a utilização é maior ou igual a 100%, as chamadas são limitadas e o código de erro 429 retornado. Para detalhar essa métrica, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName, ModelVersion e StreamType (Streaming vs solicitações não streaming) |
AzureOpenAIProvisionedManagedUtilization |
Percentagem | Mínimo, Máximo, Médio |
Region, StreamType, ModelDeploymentName, ModelName, ModelVersion |
PT1M | Não |
|
Utilização gerenciada provisionada V2 % de utilização para uma implantação gerenciada provisoriamente, calculada como (PTUs consumidas / PTUs implantadas) x 100. Quando a utilização é maior ou igual a 100%, as chamadas são limitadas e o código de erro 429 retornado. Para detalhar essa métrica, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName, ModelVersion e StreamType (Streaming vs solicitações não streaming) |
AzureOpenAIProvisionedManagedUtilizationV2 |
Percentagem | Mínimo, Máximo, Médio |
Region, StreamType, ModelDeploymentName, ModelName, ModelVersion |
PT1M | Não |
|
Horas de treinamento FineTuned processadas Número de horas de treinamento processadas em um modelo OpenAI FineTuned |
FineTunedTrainingHours |
Contar | Total (Quantidade) |
ApiName, ModelDeploymentName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Tokens de conclusão gerados Número de tokens gerados (saída) a partir de um modelo OpenAI. Aplica-se a implantações PTU, gerenciadas por PTU e Pay-as-you-go. Para detalhar essa métrica, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName e ModelName. |
GeneratedTokens |
Contar | Total (Quantidade) |
ApiName, ModelDeploymentName, FeatureName, UsageChannel, Region, ModelVersion |
PT1M | Yes |
|
Tokens de prompt processados Número de tokens de prompt processados (entrada) em um modelo OpenAI. Aplica-se a implantações PTU, gerenciadas por PTU e Pay-as-you-go. Para detalhar essa métrica, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName e ModelName. |
ProcessedPromptTokens |
Contar | Total (Quantidade) |
ApiName, ModelDeploymentName, FeatureName, UsageChannel, Region, ModelVersion |
PT1M | Yes |
|
Segundos de API em tempo real utilizados Número de segundos usados na RealtimeAPI |
RealtimeUsageTime |
Contar | Total (Quantidade) |
Region, ModelDeploymentName |
PT1M | Yes |
|
Tokens de inferência processados Número de tokens de inferência processados em um modelo OpenAI. Calculado como a soma dos tokens de prompt (entrada) e dos tokens gerados (saída). Aplica-se a implantações PTU, gerenciadas por PTU e Pay-as-you-go. Para detalhar essa métrica, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName e ModelName. |
TokenTransaction |
Contar | Total (Quantidade) |
ApiName, ModelDeploymentName, FeatureName, UsageChannel, Region, ModelVersion |
PT1M | Yes |
Categoria: Serviços Cognitivos - Solicitações HTTP
| Métrico | Nome na API REST | Unidade | Agregação | Dimensões | Segmentos de tempo | DS Exportar |
|---|---|---|---|---|---|---|
|
Chamadas bloqueadas Número de chamadas que excederam o limite de tarifa ou quota. Não use para o Azure OpenAI service. |
BlockedCalls |
Contar | Total (Quantidade) |
ApiName, OperationName, Region, RatelimitKey |
PT1M | Yes |
|
Erros do cliente Número de chamadas com erro do lado do cliente (código de resposta HTTP 4xx). Não use para o Azure OpenAI service. |
ClientErrors |
Contar | Total (Quantidade) |
ApiName, OperationName, Region, RatelimitKey |
PT1M | Yes |
|
Dados de Entrada Tamanho dos dados recebidos em bytes. Não use para o Azure OpenAI service. |
DataIn |
Bytes | Total (Quantidade) |
ApiName, OperationName, Region |
PT1M | Yes |
|
Saída de dados Tamanho dos dados de saída em bytes. Não use para o Azure OpenAI service. |
DataOut |
Bytes | Total (Quantidade) |
ApiName, OperationName, Region |
PT1M | Yes |
|
Latency Latência em milissegundos. Não use para o Azure OpenAI service. |
Latency |
Milissegundos | Average |
ApiName, OperationName, Region, RatelimitKey |
PT1M | Yes |
|
Limite de taxa O ratelimit atual da chave ratelimit. Não use para o Azure OpenAI service. |
Ratelimit |
Contar | Total (Quantidade) |
Region, RatelimitKey |
PT1M | Yes |
|
Erros do servidor Número de chamadas com erro interno do serviço (código de resposta HTTP 5xx). Não use para o Azure OpenAI service. |
ServerErrors |
Contar | Total (Quantidade) |
ApiName, OperationName, Region, RatelimitKey |
PT1M | Yes |
|
Chamadas bem-sucedidas Número de chamadas bem-sucedidas. Não use para o Azure OpenAI service. |
SuccessfulCalls |
Contar | Total (Quantidade) |
ApiName, OperationName, Region, RatelimitKey |
PT1M | Yes |
|
Total de chamadas Número total de chamadas. Não use para o Azure OpenAI service. |
TotalCalls |
Contar | Total (Quantidade) |
ApiName, OperationName, Region, RatelimitKey |
PT1M | Yes |
|
Total de erros Número total de chamadas com resposta de erro (código de resposta HTTP 4xx ou 5xx). Não use para o Azure OpenAI service. |
TotalErrors |
Contar | Total (Quantidade) |
ApiName, OperationName, Region, RatelimitKey |
PT1M | Yes |
|
Total de chamadas de token Número total de chamadas de token. |
TotalTokenCalls |
Contar | Total (Quantidade) |
ApiName, OperationName, Region |
PT1M | Yes |
Categoria: Serviços Cognitivos - SLI
| Métrico | Nome na API REST | Unidade | Agregação | Dimensões | Segmentos de tempo | DS Exportar |
|---|---|---|---|---|---|---|
|
DisponibilidadeTarifa Percentagem de disponibilidade com o seguinte cálculo: (Total de Chamadas - Erros do Servidor)/Total de Chamadas. Os erros do servidor incluem quaisquer respostas de HTTP >=500. Não use para o Azure OpenAI service. |
SuccessRate |
Percentagem | Mínimo, Máximo, Médio |
ApiName, OperationName, Region, RatelimitKey |
PT1M | Não |
Categoria: ContentSafety - Riscos&Segurança
| Métrico | Nome na API REST | Unidade | Agregação | Dimensões | Segmentos de tempo | DS Exportar |
|---|---|---|---|---|---|---|
|
Contagem de usuários potencialmente abusiva Número de utilizadores potencialmente abusivos detetados ao longo de um período de tempo. Você pode adicionar um filtro ou aplicar a divisão pela seguinte dimensão: ModelDeploymentName. |
RAIAbusiveUsersCount |
Contar | Total (Quantidade) |
Region, ModelDeploymentName |
PT1M | Yes |
|
Volume nocivo detetado Número de chamadas feitas para a API OpenAI do Azure e detetadas como prejudiciais (tanto modelo de bloco como modo de anotação) pelo filtro de conteúdo aplicado ao longo do tempo. Você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName e TextType. |
RAIHarmfulRequests |
Contar | Total (Quantidade) |
Region, ModelDeploymentName, ModelNameModelVersion, , ApiName, TextType, Category,Severity |
PT1M | Yes |
|
Volume bloqueado Número de chamadas feitas para a API OpenAI do Azure e rejeitadas pelo filtro de conteúdo aplicado ao longo do tempo. Você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName e TextType. |
RAIRejectedRequests |
Contar | Total (Quantidade) |
Region, ModelDeploymentName, ModelName, ModelVersion, ApiName, TextType, Category |
PT1M | Yes |
|
Evento do Sistema de Segurança Evento do sistema para riscos e monitoramento de segurança. Você pode adicionar um filtro ou aplicar a divisão pela seguinte dimensão: EventType. |
RAISystemEvent |
Contar | Average |
Region, EventType |
PT1M | Yes |
|
Volume total enviado para verificação de segurança Número de chamadas feitas para a API OpenAI do Azure e detetadas pelo filtro de conteúdo aplicado ao longo do tempo. Você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName. |
RAITotalRequests |
Contar | Total (Quantidade) |
Region, ModelDeploymentName, ModelName, ModelVersion, ApiName |
PT1M | Yes |
Categoria: ContentSafety - Utilização
| Métrico | Nome na API REST | Unidade | Agregação | Dimensões | Segmentos de tempo | DS Exportar |
|---|---|---|---|---|---|---|
|
Contagem de chamadas para moderação de imagem Número de chamadas para moderação de imagem. |
ContentSafetyImageAnalyzeRequestCount |
Contar | Total (Quantidade) | ApiVersion |
PT1M | Yes |
|
Contagem de chamadas para moderação de texto Número de apelos à moderação de texto. |
ContentSafetyTextAnalyzeRequestCount |
Contar | Total (Quantidade) | ApiVersion |
PT1M | Yes |
Categoria: Estimativas
| Métrico | Nome na API REST | Unidade | Agregação | Dimensões | Segmentos de tempo | DS Exportar |
|---|---|---|---|---|---|---|
|
Contagem de eventos aleatórios da linha de base Estimativa para a contagem de eventos aleatórios na linha de base. |
BaselineRandomEventCount |
Contar | Total (Quantidade) |
Mode, RunId |
PT1M | Yes |
|
Recompensa aleatória da linha de base Estimativa da recompensa aleatória inicial. |
BaselineRandomReward |
Contar | Total (Quantidade) |
Mode, RunId |
PT1M | Yes |
|
Contagem de Eventos Online Estimativa para contagem de eventos online. |
OnlineEventCount |
Contar | Total (Quantidade) |
Mode, RunId |
PT1M | Yes |
|
Recompensa Online Estimativa para recompensa online. |
OnlineReward |
Contar | Total (Quantidade) |
Mode, RunId |
PT1M | Yes |
|
Contagem de eventos da linha de base do usuário Estimativa para a contagem de eventos da linha de base definida pelo usuário. |
UserBaselineEventCount |
Contar | Total (Quantidade) |
Mode, RunId |
PT1M | Yes |
|
Recompensa da linha de base do usuário Estimativa da recompensa de base definida pelo utilizador. |
UserBaselineReward |
Contar | Total (Quantidade) |
Mode, RunId |
PT1M | Yes |
Categoria: Ocorrências de recursos
| Métrico | Nome na API REST | Unidade | Agregação | Dimensões | Segmentos de tempo | DS Exportar |
|---|---|---|---|---|---|---|
|
Ocorrências de recursos de ação Número de vezes que cada recurso de ação é exibido. |
ActionFeatureIdOccurrences |
Contar | Total (Quantidade) |
FeatureId, Mode, RunId |
PT1M | Yes |
|
Ocorrências de recursos de contexto Número de vezes que cada recurso de contexto aparece. |
ContextFeatureIdOccurrences |
Contar | Total (Quantidade) |
FeatureId, Mode, RunId |
PT1M | Yes |
|
Ocorrências de recursos de slot Número de vezes que cada recurso de slot aparece. |
SlotFeatureIdOccurrences |
Contar | Total (Quantidade) |
FeatureId, Mode, RunId |
PT1M | Yes |
Categoria: FeatureCardinality
| Métrico | Nome na API REST | Unidade | Agregação | Dimensões | Segmentos de tempo | DS Exportar |
|---|---|---|---|---|---|---|
|
Funcionalidade Cardinalidade por Ação Característica: Cardinalidade baseada em Ação. |
FeatureCardinality_Action |
Contar | Average |
FeatureId, Mode, RunId |
PT1M | Yes |
|
Cardinalidade do recurso por contexto Cardinalidade do recurso com base no contexto. |
FeatureCardinality_Context |
Contar | Average |
FeatureId, Mode, RunId |
PT1M | Yes |
|
Cardinalidade do recurso por slot Característica: Cardinalidade baseada no Slot. |
FeatureCardinality_Slot |
Contar | Average |
FeatureId, Mode, RunId |
PT1M | Yes |
Categoria: Características por evento
| Métrico | Nome na API REST | Unidade | Agregação | Dimensões | Segmentos de tempo | DS Exportar |
|---|---|---|---|---|---|---|
|
Recursos de ação por evento Número médio de recursos de ação por evento. |
ActionFeaturesPerEvent |
Contar | Average |
Mode, RunId |
PT1M | Yes |
|
Recursos de contexto por evento Número de recursos de contexto por evento. |
ContextFeaturesPerEvent |
Contar | Average |
Mode, RunId |
PT1M | Yes |
|
Características das ranhuras por evento Número médio de recursos de slots por evento. |
SlotFeaturesPerEvent |
Contar | Average |
Mode, RunId |
PT1M | Yes |
Categoria: Língua - Empregos
| Métrico | Nome na API REST | Unidade | Agregação | Dimensões | Segmentos de tempo | DS Exportar |
|---|---|---|---|---|---|---|
|
Duração do trabalho (visualização) Nota: este valor depende muito do tamanho da entrada, do número de documentos e da complexidade da tarefa. Este é um valor agregado em todas as tarefas de trabalho. |
JobDuration |
Milissegundos | Mínimo, Máximo, Médio |
JobStatus, JobType |
PT1M | Yes |
Categoria: Modelos - Solicitações HTTP
| Métrico | Nome na API REST | Unidade | Agregação | Dimensões | Segmentos de tempo | DS Exportar |
|---|---|---|---|---|---|---|
|
Taxa de disponibilidade do modelo Percentagem de disponibilidade com o seguinte cálculo: (Total de Chamadas - Erros do Servidor)/Total de Chamadas. Os erros do servidor incluem quaisquer respostas de HTTP >=500. |
ModelAvailabilityRate |
Percentagem | Mínimo, Máximo, Médio |
Region, ModelDeploymentName, ModelName, ModelVersion |
PT1M | Não |
|
Solicitações de modelo Número de chamadas feitas para a API do modelo durante um período de tempo. Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go. |
ModelRequests |
Contar | Total (Quantidade) |
ApiName, OperationName, RegionStreamType, , ModelDeploymentName, , ModelNameModelVersionStatusCodeIsSpilloverServiceTierRequestServiceTierResponse |
PT1M | Yes |
Categoria: Modelos - Latência
| Métrico | Nome na API REST | Unidade | Agregação | Dimensões | Segmentos de tempo | DS Exportar |
|---|---|---|---|---|---|---|
|
Tempo entre tokens Para pedidos de streaming; Taxa de geração de token do modelo, medida em milissegundos. Aplica-se a implantações PTU e implantações geridas por PTU. |
NormalizedTimeBetweenTokens |
Milissegundos | Máximo, Mínimo, Médio |
ApiName, OperationName, Region, StreamType, ModelDeploymentName, ModelName, ModelVersion |
PT1M | Yes |
|
Tempo normalizado para o primeiro byte Para solicitações de streaming e não streaming; Tempo que leva para que o primeiro byte de dados de resposta seja recebido após a solicitação ser feita pelo modelo, normalizado por token. Aplica-se a implantações PTU, gerenciadas por PTU e Pay-as-you-go. |
NormalizedTimeToFirstToken |
Milissegundos | Máximo, Mínimo, Médio |
ApiName, OperationName, Region, StreamType, ModelDeploymentName, ModelName, ModelVersion |
PT1M | Yes |
|
Tempo até ao último byte Para solicitações de streaming e não streaming; Tempo necessário para que o último byte de dados de resposta seja recebido após a solicitação ser feita pelo modelo. Aplica-se a implantações PTU, gerenciadas por PTU e Pay-as-you-go. |
TimeToLastByte |
Milissegundos | Máximo, Mínimo, Médio |
ApiName, OperationName, Region, StreamType, ModelDeploymentName, ModelName, ModelVersion |
PT1M | Yes |
|
Tempo de resposta Medida de latência (capacidade de resposta) recomendada para solicitações de streaming. Aplica-se a implantações PTU e implantações geridas por PTU. Calculado como o tempo necessário para que a primeira resposta apareça depois que um usuário envia um prompt, conforme medido pelo gateway de API. Esse número aumenta à medida que o tamanho do prompt aumenta e/ou o tamanho dos acessos ao cache diminui. Para detalhar o tempo até a métrica de resposta, você pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName e ModelVersion. Nota: essa métrica é uma aproximação, pois a latência medida depende fortemente de vários fatores, incluindo chamadas simultâneas e padrão geral de carga de trabalho. Além disso, ele não leva em conta qualquer latência do lado do cliente que possa existir entre seu cliente e o ponto de extremidade da API. Consulte seu próprio registro para obter o rastreamento de latência ideal. |
TimeToResponse |
Milissegundos | Mínimo, Máximo, Médio |
ApiName, OperationName, RegionStreamType, , ModelDeploymentName, ModelName, ModelVersion,StatusCode |
PT1M | Yes |
|
Tokens por segundo Enumera a velocidade de geração para uma determinada resposta do modelo. O total de tokens gerados é dividido pelo tempo para gerar os tokens, em segundos. Aplica-se a implantações PTU e implantações geridas por PTU. |
TokensPerSecond |
Contar | Máximo, Mínimo, Médio |
ApiName, OperationName, Region, StreamType, ModelDeploymentName, ModelName, ModelVersion |
PT1M | Yes |
Categoria: Modelos - Utilização
| Métrico | Nome na API REST | Unidade | Agregação | Dimensões | Segmentos de tempo | DS Exportar |
|---|---|---|---|---|---|---|
|
Páginas Anotadas Número total de páginas processadas com anotações. Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go. |
AnnotatedPages |
Contar | Total (Quantidade) |
ApiName, Region, ModelDeploymentName, ModelName, ModelVersion |
PT1M | Yes |
|
Tokens de entrada de áudio Número de tokens de prompt de áudio processados (entrada) em um modelo OpenAI. Aplica-se a implantações de modelo gerenciado por PTU. |
AudioInputTokens |
Contar | Total (Quantidade) |
ModelDeploymentName, ModelName, ModelVersion, Region |
PT1M | Yes |
|
Tokens de saída de áudio Número de tokens de prompt de áudio gerados (saída) em um modelo OpenAI. Aplica-se a implantações de modelo gerenciado por PTU. |
AudioOutputTokens |
Contar | Total (Quantidade) |
ModelDeploymentName, ModelName, ModelVersion, Region |
PT1M | Yes |
|
Tokens de prompt lidos da cache Número total de tokens lidos da cache. Aplica-se a implementações de modelos antrópicos. Surgiu na secção de utilização de resposta como cache_read_input_tokens |
cacheReadInputTokens |
Contar | Total (Quantidade) |
ApiName, Region, ModelDeploymentName, ModelName, ModelVersion, ContextLength |
PT1M | Yes |
|
Tokens de prompt escritos para cache (TTL de 1 hora) O número de tokens de prompt usados para criar a entrada de 1 hora. Aplica-se a implementações de modelos antrópicos. Surgiu na secção de utilização de resposta como cache_creation.ephemeral_1h_input_tokens |
ephemeral1hInputTokens |
Contar | Total (Quantidade) |
ApiName, Region, ModelDeploymentName, ModelName, ModelVersion, ContextLength |
PT1M | Yes |
|
Tokens de prompt escritos para cache (TTL de 5 minutos) O número de tokens de prompt usados para criar a entrada do cache de 5 minutos. Aplica-se a implementações de modelos antrópicos. Surgiu na secção de utilização de resposta como cache_creation.ephemeral_5m_input_tokens |
ephemeral5mInputTokens |
Contar | Total (Quantidade) |
ApiName, Region, ModelDeploymentName, ModelName, ModelVersion, ContextLength |
PT1M | Yes |
|
Imagens Geradas Número total de imagens geradas. Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go. |
GeneratedImages |
Contar | Total (Quantidade) |
ApiName, Region, ModelDeploymentName, ModelName, ModelVersion |
PT1M | Yes |
|
Tokens de entrada Número de tokens de prompt processados (entrada) num modelo. Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go. |
InputTokens |
Contar | Total (Quantidade) |
ApiName, Region, ModelDeploymentName, ModelName, ModelVersion |
PT1M | Yes |
|
Tokens de saída Número de tokens gerados (saída) a partir de um modelo OpenAI. Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go. |
OutputTokens |
Contar | Total (Quantidade) |
ApiName, Region, ModelDeploymentName, ModelName, ModelVersion |
PT1M | Yes |
|
Utilização provisionada % de utilização para uma implantação gerenciada provisoriamente, calculada como (PTUs consumidas / PTUs implantadas) x 100. Quando a utilização é maior ou igual a 100%, as chamadas são limitadas e o código de erro 429 retornado. |
ProvisionedUtilization |
Percentagem | Mínimo, Máximo, Médio |
Region, ModelDeploymentName, ModelName, ModelVersion |
PT1M | Não |
|
Total de Páginas Número total de páginas processadas. Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go. |
TotalPages |
Contar | Total (Quantidade) |
ApiName, Region, ModelDeploymentName, ModelName, ModelVersion |
PT1M | Yes |
|
Total Tokens Número de tokens de inferência processados em um modelo. Calculado como a soma dos tokens de prompt (entrada) e dos tokens gerados (saída). Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go. |
TotalTokens |
Contar | Total (Quantidade) |
ApiName, Region, ModelDeploymentName, ModelName, ModelVersion |
PT1M | Yes |
Categoria: Namespaces por evento
| Métrico | Nome na API REST | Unidade | Agregação | Dimensões | Segmentos de tempo | DS Exportar |
|---|---|---|---|---|---|---|
|
Namespaces de ação por evento Número médio de namespaces de ação por evento. |
ActionNamespacesPerEvent |
Contar | Average |
Mode, RunId |
PT1M | Yes |
|
Namespaces de contexto por evento Número de namespaces de contexto por evento. |
ContextNamespacesPerEvent |
Contar | Average |
Mode, RunId |
PT1M | Yes |
|
Namespaces de slot por evento Número médio de namespaces de slot por evento. |
SlotNamespacesPerEvent |
Contar | Average |
Mode, RunId |
PT1M | Yes |
Categoria: Recompensas
| Métrico | Nome na API REST | Unidade | Agregação | Dimensões | Segmentos de tempo | DS Exportar |
|---|---|---|---|---|---|---|
|
Recompensa média por evento Recompensa média por evento. |
Reward |
Contar | Average |
BaselineAction, ChosenActionId, MatchesBaseline, NonDefaultReward, Mode, RunId |
PT1M | Yes |
|
Recompensa por Slots Recompensa por slot. |
SlotReward |
Contar | Average |
BaselineActionId, ChosenActionId, MatchesBaselineNonDefaultReward, , SlotId, SlotIndex, Mode,RunId |
PT1M | Yes |
Categoria: Slots
| Métrico | Nome na API REST | Unidade | Agregação | Dimensões | Segmentos de tempo | DS Exportar |
|---|---|---|---|---|---|---|
|
Estimativa da linha de base: Recompensa global Estimador da linha de base Recompensa Global. |
BaselineEstimatorOverallReward |
Contar | Average |
Mode, RunId |
PT1M | Yes |
|
Recompensa do Slot do Estimador de Linha de Base Recompensa do estimador de linha de base por slot. |
BaselineEstimatorSlotReward |
Contar | Average |
SlotId, SlotIndex, Mode, RunId |
PT1M | Yes |
|
Estimador Aleatório da Linha de Base Recompensa Global Estimador Aleatório da Linha de Base Recompensa Global. |
BaselineRandomEstimatorOverallReward |
Contar | Average |
Mode, RunId |
PT1M | Yes |
|
Recompensa de Slot do Estimador Aleatório da Linha de Base Estimador Aleatório de Linha de Base Recompensa por slot. |
BaselineRandomEstimatorSlotReward |
Contar | Average |
SlotId, SlotIndex, Mode, RunId |
PT1M | Yes |
|
Faixas horárias Número de slots por evento. |
NumberOfSlots |
Contar | Average |
Mode, RunId |
PT1M | Yes |
|
Estimador Online Recompensa Geral Estimador Online Recompensa Geral. |
OnlineEstimatorOverallReward |
Contar | Average |
Mode, RunId |
PT1M | Yes |
|
Recompensa de Slot Estimador Online Estimador Online Recompensa por slot. |
OnlineEstimatorSlotReward |
Contar | Average |
SlotId, SlotIndex, Mode, RunId |
PT1M | Yes |
|
Ocorrências de Slots Número de vezes que cada ranhura é apresentada. |
SlotIdOccurrences |
Contar | Total (Quantidade) |
SlotId, SlotIndex, Mode, RunId |
PT1M | Yes |
Categoria: SpeechServices - Uso
| Métrico | Nome na API REST | Unidade | Agregação | Dimensões | Segmentos de tempo | DS Exportar |
|---|---|---|---|---|---|---|
|
Lote de segundos de áudio transcrito Número de segundos transcritos |
AudioSecondsBatchTranscribed |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Sussurro em lote de segundos de áudio transcrito Número de segundos transcritos |
AudioSecondsBatchWhisperTranscribed |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Segundos de áudio rapidamente transcritos Número rápido de segundos transcritos |
AudioSecondsFastTranscribed |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Sussurro rápido de segundos de áudio transcrito Sussurro rápido número de segundos transcritos |
AudioSecondsFastWhisperTranscribed |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Segundos de áudio transcritos Número de segundos transcritos |
AudioSecondsTranscribed |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Segundos de áudio traduzidos Número de segundos traduzidos |
AudioSecondsTranslated |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Segundos de Hospedagem do Modelo de Avatar Número de segundos. |
AvatarModelHostingSeconds |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Segundos de treinamento do modelo de avatar Número de segundos. |
AvatarModelTrainingSeconds |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Número de perfis de oradores Número de perfis de oradores inscritos. Rateado de hora em hora. |
NumberofSpeakerProfiles |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Transações de reconhecimento de alto-falante Número de transações de reconhecimento de alto-falante |
SpeakerRecognitionTransactions |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Horas de hospedagem do modelo de fala Número de horas de hospedagem do modelo de fala |
SpeechModelHostingHours |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Caracteres sintetizados Número de caracteres. |
SynthesizedCharacters |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Segundos de vídeo sintetizados Número de segundos sintetizados |
VideoSecondsSynthesized |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Tokens de Entrada de Áudio ao Vivo por Voz Número de tokens de entrada áudio, excluindo tokens em cache. |
VoiceLiveAudioInputTokens |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Tokens de Saída de Áudio ao Vivo de Voz Número de tokens de saída áudio. |
VoiceLiveAudioOutputTokens |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Tokens de Entrada de Áudio em Cache de Voz ao Vivo Número de tokens de entrada áudio em cache. |
VoiceLiveCachedAudioInputTokens |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Tokens de Entrada de Texto em Cache Voice Live Número de tokens de entrada de texto em cache. |
VoiceLiveCachedTextInputTokens |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Tokens de Entrada de Texto ao Vivo por Voz Número de tokens de entrada de texto, excluindo tokens em cache. |
VoiceLiveTextInputTokens |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Tokens de Saída de Texto ao Vivo por Voz Número de tokens de saída de texto. |
VoiceLiveTextOutputTokens |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Horas de hospedagem do modelo de voz Número de Horas. |
VoiceModelHostingHours |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Minutos de treinamento do modelo de voz Número de minutos. |
VoiceModelTrainingMinutes |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
Categoria: Serviços de Translator - Utilização
| Métrico | Nome na API REST | Unidade | Agregação | Dimensões | Segmentos de tempo | DS Exportar |
|---|---|---|---|---|---|---|
|
Personagens treinados (preterido) Número total de caracteres treinados. |
CharactersTrained |
Contar | Total (Quantidade) |
ApiName, OperationName, Region |
PT1M | Yes |
|
Caracteres traduzidos (preteridos) Número total de caracteres na solicitação de texto de entrada. |
CharactersTranslated |
Contar | Total (Quantidade) |
ApiName, OperationName, Region |
PT1M | Yes |
|
Caracteres do documento traduzidos Número de caracteres no pedido de tradução de documentos. |
DocumentCharactersTranslated |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Caracteres personalizados do documento traduzidos Número de caracteres na solicitação de tradução de documentos personalizados. |
DocumentCustomCharactersTranslated |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Caracteres de sincronização de documentos traduzidos Número de caracteres na solicitação de tradução de documentos (síncrona). |
OneDocumentCharactersTranslated |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Sincronização de documentos Caracteres personalizados traduzidos Número de caracteres na solicitação de conversão de documento personalizada (síncrona). |
OneDocumentCustomCharactersTranslated |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Caracteres de texto traduzidos Número de caracteres na solicitação de tradução de texto recebida. |
TextCharactersTranslated |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Caracteres personalizados de texto traduzidos Número de caracteres na solicitação de tradução de texto personalizado recebida. |
TextCustomCharactersTranslated |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Caracteres treinados em texto Número de caracteres treinados usando tradução de texto. |
TextTrainedCharacters |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Translator Pro App Segundos Número de segundos de utilização da aplicação Translator Pro. |
TranslatorProAppSeconds |
Segundos | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
Categoria: Uso
| Métrico | Nome na API REST | Unidade | Agregação | Dimensões | Segmentos de tempo | DS Exportar |
|---|---|---|---|---|---|---|
|
Contagem de inferência Serviço de Inferência Conde de Carnegie Frontdoor |
CarnegieInferenceCount |
Contar | Total (Quantidade) |
Region, Modality, Category, Language, SeverityLevel, UseCustomList |
PT1M | Yes |
|
Computer Vision Transações Número de Transações de Computer Vision |
ComputerVisionTransactions |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Custom Vision Tempo de Treino Tempo de treino Custom Vision |
CustomVisionTrainingTime |
Segundos | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Custom Vision Transações Número de transações de previsão do Custom Vision |
CustomVisionTransactions |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Imagens de rosto treinadas Número de imagens treinadas. 1.000 imagens treinadas por transação. |
FaceImagesTrained |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Rostos armazenados Número de rostos armazenados, rateados diariamente. O número de faces armazenadas é relatado diariamente. |
FacesStored |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Transações faciais Número de chamadas de API feitas para o serviço Face |
FaceTransactions |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Imagens armazenadas Número de imagens Custom Vision armazenadas. |
ImagesStored |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Eventos aprendidos Número de Eventos Aprendidos. |
LearnedEvents |
Contar | Total (Quantidade) |
IsMatchBaseline, Mode, RunId |
PT1M | Yes |
|
Pedidos de Fala LUIS Número de solicitações de compreensão de fala para intenção do LUIS |
LUISSpeechRequests |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Pedidos de texto LUIS Número de pedidos de texto LUIS |
LUISTextRequests |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Recompensas Correspondentes Número de recompensas correspondentes. |
MatchedRewards |
Contar | Total (Quantidade) |
Mode, RunId |
PT1M | Yes |
|
Eventos não ativados Número de eventos ignorados. |
NonActivatedEvents |
Contar | Total (Quantidade) |
Mode, RunId |
PT1M | Yes |
|
Recompensas Observadas Número de recompensas observadas. |
ObservedRewards |
Contar | Total (Quantidade) |
Mode, RunId |
PT1M | Yes |
|
Caracteres processados Número de caracteres processados pelo Immersive Reader. |
ProcessedCharacters |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Registros de texto de integridade processados Número de registos de texto de saúde processados |
ProcessedHealthTextRecords |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Imagens processadas Número de imagens processadas |
ProcessedImages |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Páginas processadas Número de páginas processadas |
ProcessedPages |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Registros de texto processados Contagem de registros de texto. |
ProcessedTextRecords |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Registros de texto de controle de qualidade Número de registos de texto processados |
QuestionAnsweringTextRecords |
Contar | Total (Quantidade) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Duração da sessão de fala (preterido) Duração total da sessão de fala em segundos. |
SpeechSessionDuration |
Segundos | Total (Quantidade) |
ApiName, OperationName, Region |
PT1M | Yes |
|
Total de Eventos Número de eventos. |
TotalEvents |
Contar | Total (Quantidade) |
Mode, RunId |
PT1M | Yes |
|
Total de transações (preterido) Número total de transações. |
TotalTransactions |
Contar | Total (Quantidade) | <nenhum> | PT1M | Yes |
Dimensões métricas
Para informações sobre o que são dimensões métricas, veja Métricas multidimensionais.
Este serviço tem as seguintes dimensões associadas às suas métricas.
- ApiName
- Nome da Funcionalidade
- ModelDeploymentName
- Nome do modelo
- Versão do Modelo
- Nome da operação
- Região
- Código de estado
- Tipo de fluxo
- UsageChannel
Registos de recursos
Esta seção lista os tipos de logs de recursos que você pode coletar para este serviço. A secção extrai da lista de tipos de categorias de registos todos os recursos suportados no Azure Monitor.
Logs de recursos suportados para Microsoft.CognitiveServices/accounts
| Categoria | Nome de exibição da categoria | Tabela de logs | Suporta plano básico de registo | Suporta a transformação do tempo de ingestão | Exemplos de consultas | Custos de exportação |
|---|---|---|---|---|---|---|
Audit |
Registos de Auditoria |
AzureDiagnostics Registos de múltiplos recursos do Azure. |
Não | Não | Não | |
AzureOpenAIRequestUsage |
Azure OpenAI Utilização de Pedidos |
AzureDiagnostics Registos de múltiplos recursos do Azure. |
Não | Não | Yes | |
RequestResponse |
Registos de Pedidos e Respostas |
AzureDiagnostics Registos de múltiplos recursos do Azure. |
Não | Não | Não | |
Trace |
Registos de rastreamento |
AzureDiagnostics Registos de múltiplos recursos do Azure. |
Não | Não | Não |
Azure Monitor Logs tabelas
Esta secção lista as tabelas de Logs do Azure Monitor relevantes para este serviço, que estão disponíveis para consulta pelo Log Analytics através de consultas Kusto. As tabelas contêm dados de log de recursos e possivelmente mais, dependendo do que é coletado e roteado para elas.
Azure OpenAI microsoft.cognitiveservices/accounts
Registo de atividades
A tabela vinculada lista as operações que podem ser registradas no log de atividades desse serviço. Estas operações são um subconjunto de todas as operações possíveis do fornecedor de recursos no registo de atividade.
Para mais informações sobre o esquema das entradas do registo de atividade, consulte Esquema do Registo de Atividade.
Conteúdo relacionado
- Consulte Monitor Azure OpenAI para uma descrição da monitorização Azure OpenAI.
- Consulte Monitor Azure recursos com Azure Monitor para detalhes sobre a monitorização Azure recursos.