Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
A ver atualmente:Versão - portal Foundry (clássica)Mudar para a versão do novo portal da Foundry
Este artigo contém toda a informação de referência de monitorização para este serviço.
Consulte Monitor Azure OpenAI para detalhes sobre os dados que pode recolher para Azure OpenAI em Microsoft Foundry Models e como usá-los.
Metrics
Esta secção lista todas as métricas de plataforma recolhidas automaticamente para este serviço. Estas métricas fazem também parte da lista global de métricas all da plataforma suportadas em Azure Monitor.
Para informações sobre retenção de métricas, consulte Azure Monitor Visão geral das métricas.
Métricas suportadas para a Microsoft. CognitiveServices/contas
Aqui estão as métricas mais importantes que achamos que deve monitorizar para o Azure OpenAI. Mais adiante neste artigo há uma lista mais longa de todas as métricas disponíveis para este namespace, que contém mais detalhes sobre métricas nesta lista mais curta. Por favor, consulte a lista abaixo para informações mais atualizadas. Estamos a trabalhar na atualização das tabelas nas secções seguintes.
- Azure OpenAI Requests
- Active Tokens
- Tokens de Conclusão Gerados
- Horas de treino processadas FinAjustadas
- Tokens de Inferência Processados
- Tokens de Prompt Processados
- Utilização gerida por provisões V2
- Taxa de Correspondência do Cache do Token de Prompt
- Tempo para a Resposta
- Tempo Entre Fichas
- Tempo para o Último Byte
- Tempo Normalizado até ao Primeiro Byte
- Tokens por Segundo
Também pode monitorizar métricas de Segurança de Conteúdo utilizadas por outros serviços relacionados.
- Blocked Volume
- Volume Nocivo Detetado
- Potencial Número de Utilizadores Abusivos
- Evento do Sistema de Segurança
- Volume Total Enviado para Verificação de Segurança
Note
A métrica de Utilização Gerida por Provisões está agora obsoleta e já não é recomendada. Esta métrica foi substituída pela métrica Provisioned-managed Utilization V2 . Tokens por Segundo, Tempo até Resposta e Tempo Entre Tokens atualmente não estão disponíveis para implementações Standard.
As métricas de Serviços Cognitivos têm a categoria Serviços Cognitivos - Pedidos HTTP na tabela seguinte. Estas métricas são métricas legadas que são comuns a todos os recursos deste tipo. A Microsoft já não recomenda que utilize estas métricas com o Azure OpenAI.
A tabela seguinte lista as métricas disponíveis para a Microsoft. Serviços cognitivos/tipo de recurso de contas.
- Todas as colunas podem não estar presentes em todas as tabelas.
- Algumas colunas podem estar para além da área de visualização da página. Selecione Expandir tabela para ver todas as colunas disponíveis.
Table headings
- Categoria - O grupo de métricas ou classificação.
- Metric - O nome de visualização métrico tal como aparece no portal Azure.
- Nome na API REST - O nome da métrica referido na API REST.
- Unidade - Unidade de medida.
- Agregação - O tipo padrão de agregação . Valores válidos: Média (Média), Mínimo (Mínimo), Máximo (Máximo), Total (Soma), Contagem.
- Dimensões - Dimensões disponíveis para a métrica.
-
Grãos - do TempoIntervalos em que a métrica é amostrada. Por exemplo,
PT1Mindica que a métrica é amostrada a cada minuto,PT30Ma cada 30 minutos,PT1Ha cada hora, e assim sucessivamente. - DS Export- Se a métrica é exportável para Azure Monitor Logs através das definições de diagnóstico. Para informações sobre exportação de métricas, consulte Criar definições de diagnóstico em Azure Monitor.
Category: Actions
| Metric | Nome na API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Action Occurences Número de vezes que cada ação aparece. |
ActionIdOccurrences |
Count | Total (Sum) |
ActionId, Mode, RunId |
PT1M | Yes |
|
Ações por Evento Número de ações por evento. |
ActionsPerEvent |
Count | Average |
Mode, RunId |
PT1M | Yes |
Categoria: Azure OpenAI - Pedidos HTTP
| Metric | Nome na API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Azure OpenAI AvailabilityRate Percentagem de disponibilidade com o seguinte cálculo: (Total de Chamadas - Erros de Servidor)/Total de Chamadas. Erros de servidor incluem quaisquer respostas >HTTP =500. |
AzureOpenAIAvailabilityRate |
Percent | Mínimo, Máximo, Médio |
ApiName, OperationName, Region, StreamType, ModelDeploymentName, ModelName, ModelVersion |
PT1M | No |
|
Azure Pedidos OpenAI Número de chamadas feitas para a API OpenAI do Azure ao longo do tempo. Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go. Para detalhar os pedidos da API, pode adicionar um filtro ou aplicar divisão pelas seguintes dimensões: ModelDeploymentName, ModelName, ModelVersion, StatusCode (sucesso, clientes erros, erros do servidor), IsSpillover para informação de spillover, ServiceTier, StreamType (pedidos de streaming vs não-streaming) e operação. |
AzureOpenAIRequests |
Count | Total (Sum) |
ApiName, OperationName, StreamTypeRegion, , ModelDeploymentName, , ModelVersionStatusCodeIsSpilloverServiceTierRequestModelNameServiceTierResponse |
PT1M | Yes |
Categoria: Azure OpenAI - Latência
| Metric | Nome na API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Tempo Entre Fichas Para pedidos de streaming; taxa de geração de tokens de modelo, medida em milissegundos. Aplica-se a implementações PTU, PTU-managed e Pay-as-you-go. |
AzureOpenAINormalizedTBTInMS |
MilliSeconds | Máximo, Mínimo, Médio |
Region, ModelDeploymentName, ModelName, ModelVersion |
PT1M | Yes |
|
Tempo Normalizado até ao Primeiro Byte Para pedidos de streaming e não-streaming; O tempo que demora até o primeiro byte dos dados de resposta ser recebido após o pedido ser feito pelo modelo, normalizado pelo token. Aplica-se a implementações PTU, geridas por PTU e Pay-as-you-go. |
AzureOpenAINormalizedTTFTInMS |
MilliSeconds | Máximo, Mínimo, Médio |
Region, ModelDeploymentName, ModelName, ModelVersion |
PT1M | Yes |
|
Tempo para a Resposta Medida recomendada de latência (responsividade) para pedidos de streaming. Aplica-se a implementações PTU, PTU-managed e Pay-as-you-go. Calculado como o tempo necessário para a primeira resposta aparecer após o utilizador enviar um prompt, medido pelo gateway da API. Este número aumenta à medida que o tamanho do prompt aumenta e/ou diminui o tamanho das visualizações do cache. Para analisar a métrica de tempo até resposta, pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName e ModelVersion. Nota: esta métrica é uma aproximação, pois a latência medida depende fortemente de múltiplos fatores, incluindo chamadas simultâneas e o padrão global de carga de trabalho. Além disso, não tem em conta qualquer latência do lado do cliente que possa existir entre o seu cliente e o endpoint da API. Por favor, consulte o seu próprio registo para um rastreio de latência otimizado. |
AzureOpenAITimeToResponse |
MilliSeconds | Mínimo, Máximo, Médio |
ApiName, OperationName, RegionStreamType, , ModelDeploymentName, ModelName, ModelVersion,StatusCode |
PT1M | Yes |
|
Tokens por Segundo Enumera a velocidade de geração para a resposta de um dado modelo Azure OpenAI. O total de tokens gerados é dividido pelo tempo para gerar os tokens, em segundos. Aplica-se a implementações PTU, PTU-managed e Pay-as-you-go. |
AzureOpenAITokenPerSecond |
Count | Máximo, Mínimo, Médio |
Region, ModelDeploymentName, ModelName, ModelVersion |
PT1M | Yes |
|
Tempo para o Último Byte Para pedidos de streaming e não-streaming; O tempo que demora até o último byte dos dados de resposta ser recebido após o pedido ser feito pelo modelo. Aplica-se a implementações PTU, geridas por PTU e Pay-as-you-go. |
AzureOpenAITTLTInMS |
MilliSeconds | Máximo, Mínimo, Médio |
Region, ModelDeploymentName, ModelName, ModelVersion |
PT1M | Yes |
Categoria: Azure OpenAI - Utilização
| Metric | Nome na API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Active Tokens Total de tokens menos tokens armazenados em cache ao longo de um período de tempo. Aplica-se a implantações PTU e geridas pela PTU. Use esta métrica para compreender a sua utilização baseada em TPS ou TPM para PTUs e compare com os seus benchmarks para TPS ou TPM alvo para os seus cenários. Para detalhar os pedidos da API, pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName e ModelVersion. |
ActiveTokens |
Count | Mínimo, Máximo, Médio, Total (Soma) |
Region, ModelDeploymentName, ModelName, ModelVersion |
PT1M | Yes |
|
Tokens de Conclusão de Áudio Número de tokens de prompt de áudio gerados (output) num modelo OpenAI. Aplica-se a implementações gerenciadas por PTU e modelos Pay-as-you-go. |
AudioCompletionTokens |
Count | Total (Sum) |
ModelDeploymentName, ModelName, ModelVersion, Region |
PT1M | Yes |
|
Tokens de Prompt de Áudio Número de tokens de prompt áudio processados (entrada) num modelo OpenAI. Aplica-se a implementações gerenciadas por PTU e modelos Pay-as-you-go. |
AudioPromptTokens |
Count | Total (Sum) |
ModelDeploymentName, ModelName, ModelVersion, Region |
PT1M | Yes |
|
Taxa de Correspondência do Cache do Token de Prompt Percentagem de tokens de prompt que entram na cache. Aplica-se a implantações PTU e geridas pela PTU. |
AzureOpenAIContextTokensCacheMatchRate |
Percent | Mínimo, Máximo, Médio |
Region, ModelDeploymentName, ModelName, ModelVersion |
PT1M | No |
|
Utilização gerida por provisionamento (obsoleta) Utilização % para uma implantação gerida provisionalmente, calculada como (PTUs consumidas / PTUs implantadas) x 100. Quando a utilização é maior ou igual a 100%, as chamadas são limitadas e o código de erro 429 é devolvido. Para detalhar esta métrica, pode adicionar um filtro ou aplicar divisão pelas seguintes dimensões: ModelDeploymentName, ModelName, ModelVersion e StreamType (Pedidos de streaming vs não-streaming) |
AzureOpenAIProvisionedManagedUtilization |
Percent | Mínimo, Máximo, Médio |
Region, StreamType, ModelDeploymentName, ModelName, ModelVersion |
PT1M | No |
|
Utilização gerida por provisões V2 Utilização % para uma implantação gerida provisionalmente, calculada como (PTUs consumidas / PTUs implantadas) x 100. Quando a utilização é maior ou igual a 100%, as chamadas são limitadas e o código de erro 429 é devolvido. Para detalhar esta métrica, pode adicionar um filtro ou aplicar divisão pelas seguintes dimensões: ModelDeploymentName, ModelName, ModelVersion e StreamType (Pedidos de streaming vs não-streaming) |
AzureOpenAIProvisionedManagedUtilizationV2 |
Percent | Mínimo, Máximo, Médio |
Region, StreamType, ModelDeploymentName, ModelName, ModelVersion |
PT1M | No |
|
Horas de treino processadas FinAjustadas Número de horas de treino processadas num modelo OpenAI FineTuned |
FineTunedTrainingHours |
Count | Total (Sum) |
ApiName, ModelDeploymentName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Tokens de Conclusão Gerados Número de tokens gerados (output) a partir de um modelo OpenAI. Aplica-se a implementações PTU, PTU-managed e Pay-as-you-go. Para detalhar esta métrica, pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName e ModelName. |
GeneratedTokens |
Count | Total (Sum) |
ApiName, ModelDeploymentName, FeatureName, UsageChannel, Region, ModelVersion |
PT1M | Yes |
|
Tokens de Prompt Processados Número de tokens de prompt processados (entrada) num modelo OpenAI. Aplica-se a implementações PTU, PTU-managed e Pay-as-you-go. Para detalhar esta métrica, pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName e ModelName. |
ProcessedPromptTokens |
Count | Total (Sum) |
ApiName, ModelDeploymentName, FeatureName, UsageChannel, Region, ModelVersion |
PT1M | Yes |
|
Segundos de API em tempo real utilizados Número de segundos usados na RealtimeAPI |
RealtimeUsageTime |
Count | Total (Sum) |
Region, ModelDeploymentName |
PT1M | Yes |
|
Tokens de Inferência Processados Número de tokens de inferência processados num modelo OpenAI. Calculado como tokens de prompt (entrada) mais tokens gerados (output). Aplica-se a implementações PTU, PTU-managed e Pay-as-you-go. Para detalhar esta métrica, pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName e ModelName. |
TokenTransaction |
Count | Total (Sum) |
ApiName, ModelDeploymentName, FeatureName, UsageChannel, Region, ModelVersion |
PT1M | Yes |
Categoria: Serviços Cognitivos - Pedidos HTTP
| Metric | Nome na API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Blocked Calls Número de chamadas que excederam o limite de taxa ou quota. Não use para o serviço Azure OpenAI. |
BlockedCalls |
Count | Total (Sum) |
ApiName, OperationName, Region, RatelimitKey |
PT1M | Yes |
|
Client Errors Número de chamadas com erro do lado do cliente (código de resposta HTTP 4xx). Não use para o serviço Azure OpenAI. |
ClientErrors |
Count | Total (Sum) |
ApiName, OperationName, Region, RatelimitKey |
PT1M | Yes |
|
Data In Tamanho dos dados recebidos em bytes. Não use para o serviço Azure OpenAI. |
DataIn |
Bytes | Total (Sum) |
ApiName, OperationName, Region |
PT1M | Yes |
|
Data Out Tamanho dos dados de saída em bytes. Não use para o serviço Azure OpenAI. |
DataOut |
Bytes | Total (Sum) |
ApiName, OperationName, Region |
PT1M | Yes |
|
Latency Latência em milissegundos. Não use para o serviço Azure OpenAI. |
Latency |
MilliSeconds | Average |
ApiName, OperationName, Region, RatelimitKey |
PT1M | Yes |
|
Ratelimit O limite de taxa atual da chave de limite. Não use para o serviço Azure OpenAI. |
Ratelimit |
Count | Total (Sum) |
Region, RatelimitKey |
PT1M | Yes |
|
Server Errors Número de chamadas com erro interno do serviço (código de resposta HTTP 5xx). Não use para o serviço Azure OpenAI. |
ServerErrors |
Count | Total (Sum) |
ApiName, OperationName, Region, RatelimitKey |
PT1M | Yes |
|
Successful Calls Número de chamadas bem-sucedidas. Não use para o serviço Azure OpenAI. |
SuccessfulCalls |
Count | Total (Sum) |
ApiName, OperationName, Region, RatelimitKey |
PT1M | Yes |
|
Total Calls Número total de chamadas. Não use para o serviço Azure OpenAI. |
TotalCalls |
Count | Total (Sum) |
ApiName, OperationName, Region, RatelimitKey |
PT1M | Yes |
|
Total Errors Número total de chamadas com resposta de erro (código de resposta HTTP 4xx ou 5xx). Não use para o serviço Azure OpenAI. |
TotalErrors |
Count | Total (Sum) |
ApiName, OperationName, Region, RatelimitKey |
PT1M | Yes |
|
Total de Chamadas de Token Número total de chamadas de token. |
TotalTokenCalls |
Count | Total (Sum) |
ApiName, OperationName, Region |
PT1M | Yes |
Categoria: Serviços Cognitivos - SLI
| Metric | Nome na API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
AvailabilityRate Percentagem de disponibilidade com o seguinte cálculo: (Total de Chamadas - Erros de Servidor)/Total de Chamadas. Erros de servidor incluem quaisquer respostas >HTTP =500. Não use para o serviço Azure OpenAI. |
SuccessRate |
Percent | Mínimo, Máximo, Médio |
ApiName, OperationName, Region, RatelimitKey |
PT1M | No |
Categoria: Compreensão de Conteúdo - Utilização
| Metric | Nome na API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Face Transactions Número de chamadas API feitas para o serviço Face |
FaceApiTransactions |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Minutos de Áudio Processados Minutos de áudio processados |
ProcessedAudioMinutes |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Processed Pages Número de páginas de documento processadas |
ProcessedDocumentPages |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Processed Images Número de imagens processadas |
ProcessedImageCount |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Minutos de Vídeo Processados Minutos de vídeo processados |
ProcessedVideoMinutes |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Tokens Número de tokens consumidos |
Tokens |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
Categoria: ConteúdoSegurança - Riscos e Segurança
| Metric | Nome na API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Número de Utilizadores Potencialmente Abusivos Número de utilizadores potencialmente abusivos que foram detetados ao longo do tempo. Pode adicionar um filtro ou aplicar a divisão pela seguinte dimensão: ModelDeploymentName. |
RAIAbusiveUsersCount |
Count | Total (Sum) |
Region, ModelDeploymentName |
PT1M | Yes |
|
Volume Nocivo Detetado Número de chamadas feitas para a API OpenAI do Azure e detetadas como prejudiciais (tanto modelo de bloco como modo de anotação) pelo filtro de conteúdo aplicado ao longo do tempo. Pode adicionar um filtro ou aplicar divisão pelas seguintes dimensões: ModelDeploymentName, ModelName e TextType. |
RAIHarmfulRequests |
Count | Total (Sum) |
Region, ModelDeploymentName, ModelNameModelVersion, , ApiName, TextType, Category,Severity |
PT1M | Yes |
|
Blocked Volume Número de chamadas feitas para a API OpenAI do Azure e rejeitadas pelo filtro de conteúdo aplicado ao longo do tempo. Pode adicionar um filtro ou aplicar divisão pelas seguintes dimensões: ModelDeploymentName, ModelName e TextType. |
RAIRejectedRequests |
Count | Total (Sum) |
Region, ModelDeploymentName, ModelName, ModelVersion, ApiName, TextType, Category |
PT1M | Yes |
|
Evento do Sistema de Segurança Evento do sistema para monitorização de riscos e segurança. Pode adicionar um filtro ou aplicar divisão pela seguinte dimensão: EventType. |
RAISystemEvent |
Count | Average |
Region, EventType |
PT1M | Yes |
|
Volume Total Enviado para Verificação de Segurança Número de chamadas feitas para a API OpenAI do Azure e detetadas pelo filtro de conteúdo aplicado ao longo do tempo. Pode adicionar um filtro ou aplicar divisão pelas seguintes dimensões: ModelDeploymentName, ModelName. |
RAITotalRequests |
Count | Total (Sum) |
Region, ModelDeploymentName, ModelName, ModelVersion, ApiName |
PT1M | Yes |
Categoria: Conteúdo Segurança - Utilização
| Metric | Nome na API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Contagem de Chamadas para Moderação de Imagem Número de pedidos de moderação de imagens. |
ContentSafetyImageAnalyzeRequestCount |
Count | Total (Sum) | ApiVersion |
PT1M | Yes |
|
Contagem de Chamadas para Moderação de Mensagens Número de chamadas para moderação de texto. |
ContentSafetyTextAnalyzeRequestCount |
Count | Total (Sum) | ApiVersion |
PT1M | Yes |
Category: Estimations
| Metric | Nome na API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Contagem Base de Eventos Aleatórios Estimativa para a contagem inicial de eventos aleatórios. |
BaselineRandomEventCount |
Count | Total (Sum) |
Mode, RunId |
PT1M | Yes |
|
Recompensa Aleatória Básica Estimativa da recompensa aleatória base. |
BaselineRandomReward |
Count | Total (Sum) |
Mode, RunId |
PT1M | Yes |
|
Contagem de Eventos Online Estimativa para o número de eventos online. |
OnlineEventCount |
Count | Total (Sum) |
Mode, RunId |
PT1M | Yes |
|
Online Reward Estimativa para recompensa online. |
OnlineReward |
Count | Total (Sum) |
Mode, RunId |
PT1M | Yes |
|
Contagem de Eventos de Referência do Utilizador Estimativa para a contagem de eventos de referência definida pelo utilizador. |
UserBaselineEventCount |
Count | Total (Sum) |
Mode, RunId |
PT1M | Yes |
|
Recompensa Base do Utilizador Estimativa da recompensa base definida pelo utilizador. |
UserBaselineReward |
Count | Total (Sum) |
Mode, RunId |
PT1M | Yes |
Categoria: Ocorrências de Características
| Metric | Nome na API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Ocorrências de Características de Ação Número de vezes que cada elemento de ação aparece. |
ActionFeatureIdOccurrences |
Count | Total (Sum) |
FeatureId, Mode, RunId |
PT1M | Yes |
|
Ocorrências de Características de Contexto Número de vezes que cada característica de contexto aparece. |
ContextFeatureIdOccurrences |
Count | Total (Sum) |
FeatureId, Mode, RunId |
PT1M | Yes |
|
Ocorrências de Funcionalidades de Slot Número de vezes que cada funcionalidade de slot aparece. |
SlotFeatureIdOccurrences |
Count | Total (Sum) |
FeatureId, Mode, RunId |
PT1M | Yes |
Category: FeatureCardinality
| Metric | Nome na API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Cardinalidade das Características por Ação Cardinalidade da Característica com base na Ação. |
FeatureCardinality_Action |
Count | Average |
FeatureId, Mode, RunId |
PT1M | Yes |
|
Cardinalidade das características por contexto Cardinalidade das características com base no contexto. |
FeatureCardinality_Context |
Count | Average |
FeatureId, Mode, RunId |
PT1M | Yes |
|
Cardinalidade da Característica por Slot Cardinalidade da característica baseada no slot. |
FeatureCardinality_Slot |
Count | Average |
FeatureId, Mode, RunId |
PT1M | Yes |
Categoria: Características por Evento
| Metric | Nome na API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Características de Ação por Evento Número médio de características de ação por evento. |
ActionFeaturesPerEvent |
Count | Average |
Mode, RunId |
PT1M | Yes |
|
Características de Contexto por Evento Número de características contextuais por evento. |
ContextFeaturesPerEvent |
Count | Average |
Mode, RunId |
PT1M | Yes |
|
Funcionalidades de Slot por Evento Número médio de funcionalidades de slot por evento. |
SlotFeaturesPerEvent |
Count | Average |
Mode, RunId |
PT1M | Yes |
Categoria: Língua - Empregos
| Metric | Nome na API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Duração do Trabalho (Pré-visualização) Nota: este valor depende fortemente do tamanho da entrada, número de documentos e complexidade da tarefa. Este é um valor agregado em todas as tarefas do trabalho. |
JobDuration |
MilliSeconds | Mínimo, Máximo, Médio |
JobStatus, JobType |
PT1M | Yes |
Categoria: Modelos - Pedidos HTTP
| Metric | Nome na API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Taxa de Disponibilidade de Modelos Percentagem de disponibilidade com o seguinte cálculo: (Total de Chamadas - Erros de Servidor)/Total de Chamadas. Erros de servidor incluem quaisquer respostas >HTTP =500. |
ModelAvailabilityRate |
Percent | Mínimo, Máximo, Médio |
Region, ModelDeploymentName, ModelName, ModelVersion |
PT1M | No |
|
Model Requests Número de chamadas feitas para a API do modelo ao longo do tempo. Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go. |
ModelRequests |
Count | Total (Sum) |
ApiName, OperationName, StreamTypeRegion, , ModelDeploymentName, , ModelVersionStatusCodeIsSpilloverServiceTierRequestModelNameServiceTierResponse |
PT1M | Yes |
Categoria: Modelos - Latência
| Metric | Nome na API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Tempo Entre Fichas Taxa de geração de tokens de modelo, medida em milissegundos. Aplica-se a implantações PTU e geridas pela PTU. Para pedidos não em streaming, este valor é uma estimativa. |
NormalizedTimeBetweenTokens |
MilliSeconds | Máximo, Mínimo, Médio |
ApiName, OperationName, Region, StreamType, ModelDeploymentName, ModelName, ModelVersion |
PT1M | Yes |
|
Tempo Normalizado até ao Primeiro Byte Tempo que demora até o primeiro byte dos dados de resposta ser recebido após o pedido ser feito pelo modelo, normalizado pelo token. Aplica-se a implementações PTU, geridas por PTU e Pay-as-you-go. Para pedidos não em streaming, este valor é uma estimativa. |
NormalizedTimeToFirstToken |
MilliSeconds | Máximo, Mínimo, Médio |
ApiName, OperationName, Region, StreamType, ModelDeploymentName, ModelName, ModelVersion |
PT1M | Yes |
|
Tempo para o Último Byte O tempo que demora até o último byte dos dados de resposta ser recebido após o pedido ser feito pelo modelo. Aplica-se a implementações PTU, geridas por PTU e Pay-as-you-go. Para pedidos não em streaming, este valor é uma estimativa. |
TimeToLastByte |
MilliSeconds | Máximo, Mínimo, Médio |
ApiName, OperationName, Region, StreamType, ModelDeploymentName, ModelName, ModelVersion |
PT1M | Yes |
|
Tempo para a Resposta Medida recomendada de latência (responsividade). Aplica-se a implantações PTU e geridas pela PTU. Calculado como o tempo necessário para a primeira resposta aparecer após o utilizador enviar um prompt, medido pelo gateway da API. Este número aumenta à medida que o tamanho do prompt aumenta e/ou diminui o tamanho das visualizações do cache. Para analisar a métrica de tempo até resposta, pode adicionar um filtro ou aplicar a divisão pelas seguintes dimensões: ModelDeploymentName, ModelName e ModelVersion. Nota: esta métrica é uma aproximação, pois a latência medida depende fortemente de múltiplos fatores, incluindo chamadas simultâneas e o padrão global de carga de trabalho. Além disso, não tem em conta qualquer latência do lado do cliente que possa existir entre o seu cliente e o endpoint da API. Para pedidos não em streaming, este valor é uma estimativa. Por favor, consulte o seu próprio registo para um rastreio de latência otimizado. |
TimeToResponse |
MilliSeconds | Mínimo, Máximo, Médio |
ApiName, OperationName, RegionStreamType, , ModelDeploymentName, ModelName, ModelVersion,StatusCode |
PT1M | Yes |
|
Tokens por Segundo Enumera a velocidade de geração para uma dada resposta do modelo. O total de tokens gerados é dividido pelo tempo para gerar os tokens, em segundos. Aplica-se a implantações PTU e geridas pela PTU. Para pedidos não em streaming, este valor é uma estimativa. |
TokensPerSecond |
Count | Máximo, Mínimo, Médio |
ApiName, OperationName, Region, StreamType, ModelDeploymentName, ModelName, ModelVersion |
PT1M | Yes |
Categoria: Modelos - Utilização
| Metric | Nome na API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Annotated Pages Número total de páginas processadas com anotações. Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go. |
AnnotatedPages |
Count | Total (Sum) |
ApiName, Region, ModelDeploymentName, ModelName, ModelVersion |
PT1M | Yes |
|
Tokens de Entrada de Áudio Número de tokens de prompt áudio processados (entrada) num modelo OpenAI. Aplica-se a implementações de modelos geridos por PTU. |
AudioInputTokens |
Count | Total (Sum) |
ModelDeploymentName, ModelName, ModelVersion, Region |
PT1M | Yes |
|
Tokens de Saída de Áudio Número de tokens de prompt de áudio gerados (output) num modelo OpenAI. Aplica-se a implementações de modelos geridos por PTU. |
AudioOutputTokens |
Count | Total (Sum) |
ModelDeploymentName, ModelName, ModelVersion, Region |
PT1M | Yes |
|
Tokens de prompt lidos da cache Número total de tokens lidos da cache. Aplica-se a implementações de modelos Anthropic. Surgiu na secção de utilização de resposta como cache_read_input_tokens |
cacheReadInputTokens |
Count | Total (Sum) |
ApiName, Region, ModelDeploymentName, ModelName, ModelVersion, ContextLength |
PT1M | Yes |
|
Tokens de prompt escritos para cache (TTL de 1 hora) O número de tokens de prompt usados para criar a entrada de 1 hora. Aplica-se a implementações de modelos Anthropic. Surgiu na secção de utilização de resposta como cache_creation.ephemeral_1h_input_tokens |
ephemeral1hInputTokens |
Count | Total (Sum) |
ApiName, Region, ModelDeploymentName, ModelName, ModelVersion, ContextLength |
PT1M | Yes |
|
Tokens de prompt escritos para cache (TTL de 5 minutos) O número de tokens de prompt usados para criar a entrada do cache de 5 minutos. Aplica-se a implementações de modelos Anthropic. Surgiu na secção de utilização de resposta como cache_creation.ephemeral_5m_input_tokens |
ephemeral5mInputTokens |
Count | Total (Sum) |
ApiName, Region, ModelDeploymentName, ModelName, ModelVersion, ContextLength |
PT1M | Yes |
|
Generated Images Número total de imagens geradas. Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go. |
GeneratedImages |
Count | Total (Sum) |
ApiName, Region, ModelDeploymentName, ModelName, ModelVersion |
PT1M | Yes |
|
Input Tokens Número de tokens de prompt processados (entrada) num modelo. Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go. |
InputTokens |
Count | Total (Sum) |
ApiName, Region, ModelDeploymentName, ModelName, ModelVersion |
PT1M | Yes |
|
Output Tokens Número de tokens gerados (output) a partir de um modelo OpenAI. Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go. |
OutputTokens |
Count | Total (Sum) |
ApiName, Region, ModelDeploymentName, ModelName, ModelVersion |
PT1M | Yes |
|
Provisioned Utilization Utilização % para uma implantação gerida provisionalmente, calculada como (PTUs consumidas / PTUs implantadas) x 100. Quando a utilização é maior ou igual a 100%, as chamadas são limitadas e o código de erro 429 é devolvido. |
ProvisionedUtilization |
Percent | Mínimo, Máximo, Médio |
Region, ModelDeploymentName, ModelName, ModelVersion |
PT1M | No |
|
Total Pages Número total de páginas processadas. Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go. |
TotalPages |
Count | Total (Sum) |
ApiName, Region, ModelDeploymentName, ModelName, ModelVersion |
PT1M | Yes |
|
Total Tokens Número de tokens de inferência processados num modelo. Calculado como tokens de prompt (entrada) mais tokens gerados (output). Aplica-se a implantações PTU, PTU-Managed e Pay-as-you-go. |
TotalTokens |
Count | Total (Sum) |
ApiName, Region, ModelDeploymentName, ModelName, ModelVersion |
PT1M | Yes |
Categoria: Espaços de Nomes por Evento
| Metric | Nome na API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Namespaces de Ações por Evento Número médio de namespaces de ações por evento. |
ActionNamespacesPerEvent |
Count | Average |
Mode, RunId |
PT1M | Yes |
|
Espaços de Nomes de Contexto por Evento Número de namespaces de contexto por evento. |
ContextNamespacesPerEvent |
Count | Average |
Mode, RunId |
PT1M | Yes |
|
Espaços de Nomes de Slots por Evento Número médio de espaços de nomes de slot por evento. |
SlotNamespacesPerEvent |
Count | Average |
Mode, RunId |
PT1M | Yes |
Category: Rewards
| Metric | Nome na API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Recompensa Média por Evento Recompensa média por evento. |
Reward |
Count | Average |
BaselineAction, ChosenActionId, MatchesBaseline, NonDefaultReward, Mode, RunId |
PT1M | Yes |
|
Slot Reward Recompensa por slot. |
SlotReward |
Count | Average |
BaselineActionId, ChosenActionId, MatchesBaselineNonDefaultReward, , SlotId, SlotIndex, Mode,RunId |
PT1M | Yes |
Category: Slots
| Metric | Nome na API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Estimador de Referência Recompensa Global Estimador Baseline Recompensa Global. |
BaselineEstimatorOverallReward |
Count | Average |
Mode, RunId |
PT1M | Yes |
|
Recompensa do Slot do Estimador de Referência Estimador de referência Recompensa por slot. |
BaselineEstimatorSlotReward |
Count | Average |
SlotId, SlotIndex, Mode, RunId |
PT1M | Yes |
|
Recompensa Geral do Estimador Aleatório de Referência Recompensa global do estimador aleatório de base. |
BaselineRandomEstimatorOverallReward |
Count | Average |
Mode, RunId |
PT1M | Yes |
|
Recompensa de Slot de Estimador Aleatório de Referência Estimador Aleatório Base Recompensa por slot. |
BaselineRandomEstimatorSlotReward |
Count | Average |
SlotId, SlotIndex, Mode, RunId |
PT1M | Yes |
|
Slots Número de vagas por evento. |
NumberOfSlots |
Count | Average |
Mode, RunId |
PT1M | Yes |
|
Estimador Online Recompensa Global Estimador Online Recompensa Global. |
OnlineEstimatorOverallReward |
Count | Average |
Mode, RunId |
PT1M | Yes |
|
Bónus de Slot para Estimadores Online Estimador Online Recompensa por slot. |
OnlineEstimatorSlotReward |
Count | Average |
SlotId, SlotIndex, Mode, RunId |
PT1M | Yes |
|
Slot Occurrences Número de vezes que cada slot aparece. |
SlotIdOccurrences |
Count | Total (Sum) |
SlotId, SlotIndex, Mode, RunId |
PT1M | Yes |
Categoria: Serviços de Voz - Utilização
| Metric | Nome na API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Segundos de Áudio Transcritos em Lote Número de segundos em lote transcritos |
AudioSecondsBatchTranscribed |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Segundos de Áudio Sussurros em Batch Transcritos Número de segundos do sussurro em lote transcrito |
AudioSecondsBatchWhisperTranscribed |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Segundos de áudio transcritos rapidamente Número rápido de segundos transcrito |
AudioSecondsFastTranscribed |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Áudio Segundos Sussurros Rápidos Transcritos Número de segundos transcrevidos em sussurros rápidos |
AudioSecondsFastWhisperTranscribed |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Segundos de Áudio Transcritos Número de segundos transcritos |
AudioSecondsTranscribed |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Segundos de Áudio Traduzidos Número de segundos traduzidos |
AudioSecondsTranslated |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Modelos Avatar Hosting Seconds Número de segundos. |
AvatarModelHostingSeconds |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Segundos de Treino do Modelo Avatar Número de segundos. |
AvatarModelTrainingSeconds |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Número de Perfis de Oradores Número de perfis de oradores inscritos. Prorated hourly. |
NumberofSpeakerProfiles |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Transações de Reconhecimento de Oradores Número de transações de reconhecimento de altifalantes |
SpeakerRecognitionTransactions |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Horas de Apresentação do Modelo de Discurso Número de horas de apresentação de modelos de fala |
SpeechModelHostingHours |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Synthesized Characters Número de personagens. |
SynthesizedCharacters |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Segundos de Vídeo Sintetizados Número de segundos sintetizados |
VideoSecondsSynthesized |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Tokens de Entrada de Áudio ao Vivo por Voz Número de tokens de entrada áudio, excluindo tokens em cache. |
VoiceLiveAudioInputTokens |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Tokens de Saída de Áudio ao Vivo de Voz Número de tokens de saída áudio. |
VoiceLiveAudioOutputTokens |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Tokens de Entrada de Áudio em Cache de Voz ao Vivo Número de tokens de entrada áudio em cache. |
VoiceLiveCachedAudioInputTokens |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Tokens de Entrada de Texto em Cache Voice Live Número de tokens de entrada de texto em cache. |
VoiceLiveCachedTextInputTokens |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Tokens de Entrada de Texto ao Vivo por Voz Número de tokens de entrada de texto, excluindo tokens em cache. |
VoiceLiveTextInputTokens |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Tokens de Saída de Texto ao Vivo por Voz Número de tokens de saída de texto. |
VoiceLiveTextOutputTokens |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Horas de Apresentação de Modelos de Voz Número de horas. |
VoiceModelHostingHours |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Minutos de Treino de Modelos de Voz Número de minutos. |
VoiceModelTrainingMinutes |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
Categoria: Serviços de Tradução - Utilização
| Metric | Nome na API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Personagens Treinados (Descontinuados) Número total de personagens treinadas. |
CharactersTrained |
Count | Total (Sum) |
ApiName, OperationName, Region |
PT1M | Yes |
|
Personagens Traduzidas (Descontinuadas) Número total de caracteres no pedido de texto recebido. |
CharactersTranslated |
Count | Total (Sum) |
ApiName, OperationName, Region |
PT1M | Yes |
|
Caracteres do Documento Traduzidos Número de caracteres no pedido de tradução do documento. |
DocumentCharactersTranslated |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Caracteres Personalizados do Documento Traduzidos Número de caracteres no pedido de tradução de documentos personalizados. |
DocumentCustomCharactersTranslated |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Caracteres de Sincronização de Documentos Traduzidos Número de caracteres no pedido de tradução de documentos (síncrono). |
OneDocumentCharactersTranslated |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Sincronização de Documentos Caracteres Personalizados Traduzidos Número de caracteres no pedido de tradução personalizada de documentos (síncrono). |
OneDocumentCustomCharactersTranslated |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Caracteres de Texto Traduzidos Número de caracteres no pedido de tradução de texto recebido. |
TextCharactersTranslated |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Caracteres Personalizados de Texto Traduzidos Número de caracteres no pedido de tradução de texto personalizado recebido. |
TextCustomCharactersTranslated |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Caracteres treinados por texto Número de caracteres treinados usando tradução de texto. |
TextTrainedCharacters |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Segundo da aplicação Translator Pro Número de segundos de utilização da aplicação Translator Pro. |
TranslatorProAppSeconds |
Seconds | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
Category: Usage
| Metric | Nome na API REST | Unit | Aggregation | Dimensions | Time Grains | DS Export |
|---|---|---|---|---|---|---|
|
Inference Count Contagem de Inferência do Serviço da Porta de Entrada da Carnegie |
CarnegieInferenceCount |
Count | Total (Sum) |
Region, Modality, Category, Language, SeverityLevel, UseCustomList |
PT1M | Yes |
|
Imagem Digitalizada Transações Número de Transações de Imagem Digitalizada |
ComputerVisionTransactions |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Tempo de Treino Personalizado de Visão Tempo de treino Custom Vision |
CustomVisionTrainingTime |
Seconds | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Transações de Visão Personalizadas Número de transações de previsão do Custom Vision |
CustomVisionTransactions |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Imagens Faciais Treinadas Número de imagens treinadas. 1.000 imagens treinadas por transação. |
FaceImagesTrained |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Faces Stored Número de rostos armazenados, proporcional diariamente. O número de faces armazenadas é reportado diariamente. |
FacesStored |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Face Transactions Número de chamadas API feitas para o serviço Face |
FaceTransactions |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Images Stored Número de imagens Custom Vision armazenadas. |
ImagesStored |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Learned Events Número de Eventos Aprendidos. |
LearnedEvents |
Count | Total (Sum) |
IsMatchBaseline, Mode, RunId |
PT1M | Yes |
|
Pedidos de Discurso LUIS Número de pedidos de compreensão de LUIS de fala para intenção |
LUISSpeechRequests |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Pedidos de Texto LUIS Número de pedidos de texto LUIS |
LUISTextRequests |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Matched Rewards Número de recompensas igualadas. |
MatchedRewards |
Count | Total (Sum) |
Mode, RunId |
PT1M | Yes |
|
Eventos Não Ativados Número de eventos saltados. |
NonActivatedEvents |
Count | Total (Sum) |
Mode, RunId |
PT1M | Yes |
|
Observed Rewards Número de recompensas observadas. |
ObservedRewards |
Count | Total (Sum) |
Mode, RunId |
PT1M | Yes |
|
Processed Characters Número de caracteres processados pelo Leitura Avançada. |
ProcessedCharacters |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Registos de Texto de Saúde Processados Número de registos de texto de saúde processados |
ProcessedHealthTextRecords |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Processed Images Número de imagens processadas |
ProcessedImages |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Processed Pages Número de páginas processadas |
ProcessedPages |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Registos de Texto Processados Contagem de registos de texto. |
ProcessedTextRecords |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Registos de Texto de QA Número de registos de texto processados |
QuestionAnsweringTextRecords |
Count | Total (Sum) |
ApiName, FeatureName, UsageChannel, Region |
PT1M | Yes |
|
Duração da Sessão de Discurso (Descontinuado) Duração total da sessão de discurso em segundos. |
SpeechSessionDuration |
Seconds | Total (Sum) |
ApiName, OperationName, Region |
PT1M | Yes |
|
Total Events Número de eventos. |
TotalEvents |
Count | Total (Sum) |
Mode, RunId |
PT1M | Yes |
|
Transações Totais (Descontinuadas) Número total de transações. |
TotalTransactions |
Count | Total (Sum) | <nenhum> | PT1M | Yes |
Metric dimensions
Para informações sobre o que são dimensões métricas, veja Métricas multidimensionais.
Este serviço tem as seguintes dimensões associadas às suas métricas.
- ApiName
- FeatureName
- ModelDeploymentName
- ModelName
- ModelVersion
- OperationName
- Region
- StatusCode
- StreamType
- UsageChannel
Resource logs
Esta secção lista os tipos de registos de recursos que pode recolher para este serviço. A secção retira da lista de tipos de categorias de registos todos os recursos suportados em Azure Monitor.
Registos de recursos suportados para a Microsoft. CognitiveServices/contas
| Category | Nome de exibição da categoria | Log table | Suporta o plano básico de registos | Suporta a transformação do tempo de ingestão | Example queries | Custos de exportação |
|---|---|---|---|---|---|---|
Audit |
Audit Logs |
AzureDiagnostics Registos de múltiplos recursos do Azure. |
No | No | No | |
AzureOpenAIRequestUsage |
Azure OpenAI Utilização de Pedidos |
AzureDiagnostics Registos de múltiplos recursos do Azure. |
No | No | Yes | |
RequestResponse |
Registos de Pedidos e Respostas |
AzureDiagnostics Registos de múltiplos recursos do Azure. |
No | No | No | |
Trace |
Trace Logs |
AzureDiagnostics Registos de múltiplos recursos do Azure. |
No | No | No |
Azure Monitor Logs tables
Esta secção lista as tabelas Azure Monitor Logs relevantes para este serviço, que estão disponíveis para consulta pela Log Analytics usando consultas Kusto. As tabelas contêm dados de registo de recursos e possivelmente mais, dependendo do que é recolhido e encaminhado para elas.
Azure OpenAI microsoft.cognitiveservices/accounts
Activity log
A tabela ligada lista as operações que podem ser registadas no registo de atividades deste serviço. Estas operações são um subconjunto de todas as possíveis operações de fornecedores de recursos no registo de atividade.
Para mais informações sobre o esquema das entradas do registo de atividade, consulte Esquema do Registo de Atividades.
Related content
- Consulte Monitor Azure OpenAI para uma descrição da monitorização Azure OpenAI.
- Consulte Monitorize Azure recursos com Azure Monitor para detalhes sobre monitorização Azure recursos.