Partilhar via


Referência de dados de monitorização do Foundry Agent Service (clássico)

Observação

Este documento refere-se ao portal Microsoft Foundry (clássico).

🔍 Consulte a documentação (nova) da Microsoft Foundry para saber mais sobre o novo portal.

Este artigo contém todas as informações de referência de monitoramento para este serviço.

Consulte o Serviço de Agentes Monitor Foundry para detalhes sobre os dados que pode recolher sobre os seus agentes.

Métricas

Aqui estão as métricas mais importantes que achamos que deve monitorizar para o Serviço ao Agente. Mais adiante neste artigo é uma lista mais longa de todas as métricas disponíveis que contém mais detalhes sobre métricas nesta lista mais curta. Consulte a lista abaixo para obter as informações mais atualizadas. Estamos trabalhando para atualizar as tabelas nas seções a seguir.

Métricas suportadas

Esta seção lista todas as métricas de plataforma coletadas automaticamente para este serviço. Essas métricas também fazem parte da lista global de todas as métricas de plataforma com suporte no Azure Monitor.

  • Nem todas as colunas podem estar presentes em todas as tabelas.
  • Algumas colunas podem estar além da área de visualização da página. Selecione Expandir tabela para visualizar todas as colunas disponíveis.

Cabeçalhos de tabela

  • Categoria - O grupo ou classificação de métricas.
  • Metric - O nome de exibição da métrica conforme aparece no portal do Azure.
  • Nome na API REST - O nome da métrica conforme referido na API REST.
  • Unidade - Unidade de medida.
  • Agregação - O tipo de agregação padrão. Valores válidos: Média (Média), Mínima (Mín), Máxima (Máx), Total (Soma), Contagem.
  • Dimensões - Dimensões disponíveis para a métrica.
  • Grãos de Tempo - Intervalos em que a métrica é amostrada. Por exemplo, PT1M indica que a métrica é amostrada a cada minuto, PT30M a cada 30 minutos, PT1H a cada hora e assim por diante.
  • DS Export- Se a métrica é exportável para os Logs do Azure Monitor por meio de configurações de diagnóstico. Para obter informações sobre como exportar métricas, consulte Criar configurações de diagnóstico no Azure Monitor.

Categoria: Agentes

Métrico Nome na API REST Unidade Agregação Dimensões Segmentos de tempo DS Exportar
Agentes

Número de eventos para Agentes de IA neste espaço de trabalho
Agents Contar Média, Máximo, Mínimo, Total (Soma) EventType PT1M Não
Arquivos indexados

Número de arquivos indexados para pesquisa de arquivos neste espaço de trabalho
IndexedFiles Contar Média, Máximo, Mínimo, Total (Soma) ErrorCode, Status, VectorStoreId PT1M Não
Messages

Número de eventos para mensagens do AI Agent neste espaço de trabalho
Messages Contar Média, Máximo, Mínimo, Total (Soma) EventType, ThreadId PT1M Não
Funciona

Número de execuções por agentes de IA neste espaço de trabalho
Runs Contar Média, Máximo, Mínimo, Total (Soma) AgentId, RunStatus, StatusCode, StreamType PT1M Não
Tópicos

Número de eventos para threads do AI Agent neste espaço de trabalho
Threads Contar Média, Máximo, Mínimo, Total (Soma) EventType PT1M Não
Tokens

Contagem de tokens por agentes de IA neste espaço de trabalho
Tokens Contar Média, Máximo, Mínimo, Total (Soma) AgentId, TokenType PT1M Não
Chamadas de ferramentas

Solicitações de ferramentas feitas por agentes baseados em IA neste espaço de trabalho
ToolCalls Contar Média, Máximo, Mínimo, Total (Soma) AgentId, ToolName PT1M Não

Categoria: Modelo

Métrico Nome na API REST Unidade Agregação Dimensões Segmentos de tempo DS Exportar
Falha na implantação do modelo

Número de implantações de modelo que falharam neste espaço de trabalho
Model Deploy Failed Contar Total (soma), média, mínimo, máximo, contagem Scenario, StatusCode PT1M Yes
Implantação do modelo iniciada

Número de implantações de modelo iniciadas neste espaço de trabalho
Model Deploy Started Contar Total (soma), média, mínimo, máximo, contagem Scenario PT1M Yes
Implantação de modelo bem-sucedida

Número de implantações de modelo bem-sucedidas neste espaço de trabalho
Model Deploy Succeeded Contar Total (soma), média, mínimo, máximo, contagem Scenario PT1M Yes
Falha no registro do modelo

Número de registos de modelo que falharam neste espaço de trabalho
Model Register Failed Contar Total (soma), média, mínimo, máximo, contagem Scenario, StatusCode PT1M Yes
Registro de modelo bem-sucedido

Número de registos de modelos bem-sucedidos neste espaço de trabalho
Model Register Succeeded Contar Total (soma), média, mínimo, máximo, contagem Scenario PT1M Yes

Categoria: Quota

Métrico Nome na API REST Unidade Agregação Dimensões Segmentos de tempo DS Exportar
Núcleos ativos

Número de núcleos ativos
Active Cores Contar Média, Máximo, Mínimo, Total (Soma) Scenario, ClusterName PT1M Yes
Nós ativos

Número de nós Ativos. Estes são os nós que estão executando ativamente um trabalho.
Active Nodes Contar Média, Máximo, Mínimo, Total (Soma) Scenario, ClusterName PT1M Yes
Núcleos ociosos

Número de núcleos inativos
Idle Cores Contar Média, Máximo, Mínimo, Total (Soma) Scenario, ClusterName PT1M Yes
Nodos ociosos

Número de nós ociosos. Os nós inativos são os nós que não estão executando nenhuma tarefa, mas podem aceitar novas tarefas, se disponíveis.
Idle Nodes Contar Média, Máximo, Mínimo, Total (Soma) Scenario, ClusterName PT1M Yes
Deixando núcleos

Número de núcleos saindo
Leaving Cores Contar Média, Máximo, Mínimo, Total (Soma) Scenario, ClusterName PT1M Yes
Deixando Nodos

Número de nós de saída. Os nós de saída são os nós que acabaram de processar um trabalho e irão para o estado de inatividade.
Leaving Nodes Contar Média, Máximo, Mínimo, Total (Soma) Scenario, ClusterName PT1M Yes
Núcleos preemptivos

Número de núcleos preempcionados
Preempted Cores Contar Média, Máximo, Mínimo, Total (Soma) Scenario, ClusterName PT1M Yes
Nós preemptados

Número de nós preemptados. Esses nós são os nós de baixa prioridade que são retirados do pool de nós disponível.
Preempted Nodes Contar Média, Máximo, Mínimo, Total (Soma) Scenario, ClusterName PT1M Yes
Percentagem de Utilização de Quotas

Percentagem da quota utilizada
Quota Utilization Percentage Contar Média, Máximo, Mínimo, Total (Soma) Scenario, ClusterName, VmFamilyName, VmPriority PT1M Yes
Total de núcleos

Número total de núcleos
Total Cores Contar Média, Máximo, Mínimo, Total (Soma) Scenario, ClusterName PT1M Yes
Total de nós

Número total de nós. Este total inclui alguns dos nós ativos, nós ociosos, nós inutilizáveis, nós preemptivos, nós de saída
Total Nodes Contar Média, Máximo, Mínimo, Total (Soma) Scenario, ClusterName PT1M Yes
Núcleos inutilizáveis

Número de núcleos inutilizáveis
Unusable Cores Contar Média, Máximo, Mínimo, Total (Soma) Scenario, ClusterName PT1M Yes
Nós inoperantes

Número de nós inutilizáveis. Os nós inutilizáveis não são funcionais devido a algum problema insolúvel. O Azure reciclará esses nós.
Unusable Nodes Contar Média, Máximo, Mínimo, Total (Soma) Scenario, ClusterName PT1M Yes

Categoria: Recurso

Métrico Nome na API REST Unidade Agregação Dimensões Segmentos de tempo DS Exportar
CpuCapacityMillicores

Capacidade máxima de um nó da CPU em milicores. A capacidade é agregada em intervalos de um minuto.
CpuCapacityMillicores Contar Média, Máximo, Mínimo, Total (Soma) RunId, InstanceId, ComputeName PT1M Yes
CpuMemoryCapacityMegabytes

Utilização máxima de memória de um nó da CPU em megabytes. A utilização é agregada em intervalos de um minuto.
CpuMemoryCapacityMegabytes Contar Média, Máximo, Mínimo, Total (Soma) RunId, InstanceId, ComputeName PT1M Yes
CpuMemoryUtilizationMegabytes

Utilização de memória de um nó da CPU em megabytes. A utilização é agregada em intervalos de um minuto.
CpuMemoryUtilizationMegabytes Contar Média, Máximo, Mínimo, Total (Soma) RunId, InstanceId, ComputeName PT1M Yes
CpuMemoryUtilizationPercentage

Porcentagem de utilização de memória de um nó da CPU. A utilização é agregada em intervalos de um minuto.
CpuMemoryUtilizationPercentage Contar Média, Máximo, Mínimo, Total (Soma) RunId, InstanceId, ComputeName PT1M Yes
Utilização da CPU

Porcentagem de utilização em um nó da CPU. A utilização é relatada em intervalos de um minuto.
CpuUtilization Contar Média, Máximo, Mínimo, Total (Soma) Scenario, runId, NodeId, ClusterName PT1M Yes
UtilizaçãoDoProcessadorEmMillicores

Utilização de milinúcleos em um nó de CPU. A utilização é agregada em intervalos de um minuto.
CpuUtilizationMillicores Contar Média, Máximo, Mínimo, Total (Soma) RunId, InstanceId, ComputeName PT1M Yes
PercentagemDeUtilizaçãoDaCPU

Porcentagem de utilização de um nó da CPU. A utilização é agregada em intervalos de um minuto.
CpuUtilizationPercentage Contar Média, Máximo, Mínimo, Total (Soma) RunId, InstanceId, ComputeName PT1M Yes
DiskAvailMegabytes

Espaço disponível em disco em megabytes. As métricas são agregadas em intervalos de um minuto.
DiskAvailMegabytes Contar Média, Máximo, Mínimo, Total (Soma) RunId, InstanceId, ComputeName PT1M Yes
DiskReadMegabytes

Dados lidos do disco em megabytes. As métricas são agregadas em intervalos de um minuto.
DiskReadMegabytes Contar Média, Máximo, Mínimo, Total (Soma) RunId, InstanceId, ComputeName PT1M Yes
DiskUsedMegabytes

Espaço em disco usado em megabytes. As métricas são agregadas em intervalos de um minuto.
DiskUsedMegabytes Contar Média, Máximo, Mínimo, Total (Soma) RunId, InstanceId, ComputeName PT1M Yes
DiskWriteMegabytes

Dados gravados em disco em megabytes. As métricas são agregadas em intervalos de um minuto.
DiskWriteMegabytes Contar Média, Máximo, Mínimo, Total (Soma) RunId, InstanceId, ComputeName PT1M Yes
GpuCapacityMilliGPUs

Capacidade máxima de um dispositivo GPU em mili-GPUs. A capacidade é agregada em intervalos de um minuto.
GpuCapacityMilliGPUs Contar Média, Máximo, Mínimo, Total (Soma) RunId, InstanceId, DeviceId, ComputeName PT1M Yes
GpuEnergyJoules

Energia de intervalo em Joules num nó de GPU. A energia é reportada em intervalos de um minuto.
GpuEnergyJoules Contar Média, Máximo, Mínimo, Total (Soma) Scenario, runId, rootRunId, InstanceId, DeviceId, ComputeName PT1M Yes
GpuMemoryCapacityMegabytes

Capacidade máxima de memória de um dispositivo GPU em megabytes. Capacidade agregada em intervalos de um minuto.
GpuMemoryCapacityMegabytes Contar Média, Máximo, Mínimo, Total (Soma) RunId, InstanceId, DeviceId, ComputeName PT1M Yes
GpuMemoryUtilization

Percentagem de utilização de memória num nó de GPU. A utilização é relatada em intervalos de um minuto.
GpuMemoryUtilization Contar Média, Máximo, Mínimo, Total (Soma) Scenario, runId, NodeId, DeviceId, ClusterName PT1M Yes
GpuMemoryUtilizationMegabytes

Utilização de memória de um dispositivo GPU em megabytes. Utilização agregada em intervalos de um minuto.
GpuMemoryUtilizationMegabytes Contar Média, Máximo, Mínimo, Total (Soma) RunId, InstanceId, DeviceId, ComputeName PT1M Yes
GpuMemoryUtilizationPercentage

Percentagem de utilização de memória de um dispositivo GPU. Utilização agregada em intervalos de um minuto.
GpuMemoryUtilizationPercentage Contar Média, Máximo, Mínimo, Total (Soma) RunId, InstanceId, DeviceId, ComputeName PT1M Yes
UtilizaçãoGpu

Porcentagem de utilização em um nó de GPU. A utilização é relatada em intervalos de um minuto.
GpuUtilization Contar Média, Máximo, Mínimo, Total (Soma) Scenario, runId, NodeId, DeviceId, ClusterName PT1M Yes
Utilização de GPU em MilliGPUs

Utilização de um dispositivo GPU em mili-GPUs. A utilização é agregada em intervalos de um minuto.
GpuUtilizationMilliGPUs Contar Média, Máximo, Mínimo, Total (Soma) RunId, InstanceId, DeviceId, ComputeName PT1M Yes
Percentagem de Utilização da GPU

Porcentagem de utilização de um dispositivo GPU. A utilização é agregada em intervalos de um minuto.
GpuUtilizationPercentage Contar Média, Máximo, Mínimo, Total (Soma) RunId, InstanceId, DeviceId, ComputeName PT1M Yes
IBReceiveMegabytes

Dados de rede recebidos através da InfiniBand em megabytes. As métricas são agregadas em intervalos de um minuto.
IBReceiveMegabytes Contar Média, Máximo, Mínimo, Total (Soma) RunId, InstanceId, ComputeName, DeviceId PT1M Yes
IBTransmitMegabytes

Dados de rede enviados através da InfiniBand em megabytes. As métricas são agregadas em intervalos de um minuto.
IBTransmitMegabytes Contar Média, Máximo, Mínimo, Total (Soma) RunId, InstanceId, ComputeName, DeviceId PT1M Yes
NetworkInputMegabytes

Dados de rede recebidos em megabytes. As métricas são agregadas em intervalos de um minuto.
NetworkInputMegabytes Contar Média, Máximo, Mínimo, Total (Soma) RunId, InstanceId, ComputeName, DeviceId PT1M Yes
NetworkOutputMegabytes

Dados de rede enviados em megabytes. As métricas são agregadas em intervalos de um minuto.
NetworkOutputMegabytes Contar Média, Máximo, Mínimo, Total (Soma) RunId, InstanceId, ComputeName, DeviceId PT1M Yes
StorageAPIFailureCount

Contagem de falhas de chamadas da API de Armazenamento de Blob do Azure.
StorageAPIFailureCount Contar Média, Máximo, Mínimo, Total (Soma) RunId, InstanceId, ComputeName PT1M Yes
StorageAPISuccessCount

Contagem de chamadas bem-sucedidas da API de Armazenamento Blob do Azure.
StorageAPISuccessCount Contar Média, Máximo, Mínimo, Total (Soma) RunId, InstanceId, ComputeName PT1M Yes

Categoria: Corrida

Métrico Nome na API REST Unidade Agregação Dimensões Segmentos de tempo DS Exportar
Cancelar corridas solicitadas

Número de vezes em que o cancelamento foi solicitado para este espaço de trabalho. A contagem é atualizada quando a solicitação de cancelamento é recebida relativamente a uma corrida.
Cancel Requested Runs Contar Total (soma), média, mínimo, máximo, contagem Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName PT1M Yes
Execuções canceladas

Número de operações canceladas para este espaço de trabalho. A contagem é atualizada quando uma execução é cancelada com êxito.
Cancelled Runs Contar Total (soma), média, mínimo, máximo, contagem Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName PT1M Yes
Execuções concluídas

Número de execuções concluídas com êxito para este espaço de trabalho. A contagem é atualizada quando uma execução é concluída e a saída é coletada.
Completed Runs Contar Total (soma), média, mínimo, máximo, contagem Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName PT1M Yes
Erros

Número de erros de execução neste espaço de trabalho. A contagem é atualizada sempre que a execução encontra um erro.
Errors Contar Total (soma), média, mínimo, máximo, contagem Scenario PT1M Yes
Execuções com falha

Número de execuções falhadas neste espaço de trabalho. A contagem é atualizada quando uma execução falha.
Failed Runs Contar Total (soma), média, mínimo, máximo, contagem Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName PT1M Yes
Conclusão das Execuções

Número de execuções inseridas no estado de finalização para este espaço de trabalho. A contagem é atualizada quando uma execução é concluída, mas a coleta de saída ainda está em andamento.
Finalizing Runs Contar Total (soma), média, mínimo, máximo, contagem Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName PT1M Yes
Execuções não respondedoras

Número de tarefas que não estão a responder neste espaço de trabalho. A contagem é atualizada quando uma execução entra no estado Não respondendo.
Not Responding Runs Contar Total (soma), média, mínimo, máximo, contagem Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName PT1M Yes
Execuções não iniciadas

Número de execuções no estado Não Iniciado para este espaço de trabalho. A contagem é atualizada quando uma solicitação é recebida para criar uma execução, mas as informações de execução ainda não foram preenchidas.
Not Started Runs Contar Total (soma), média, mínimo, máximo, contagem Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName PT1M Yes
Preparação de Corridas

Número de execuções que estão a prepararem-se neste espaço de trabalho. A contagem é atualizada quando uma execução entra no estado Preparando enquanto o ambiente de execução está sendo preparado.
Preparing Runs Contar Total (soma), média, mínimo, máximo, contagem Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName PT1M Yes
Execuções de provisionamento

Número de execuções que estão provisionando para este espaço de trabalho. A contagem é atualizada quando uma execução aguarda a criação ou o provisionamento do alvo de computação.
Provisioning Runs Contar Total (soma), média, mínimo, máximo, contagem Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName PT1M Yes
Execuções na Fila

Número de execuções enfileiradas para este espaço de trabalho. A contagem é atualizada quando uma execução é enfileirada no destino de computação. Pode ocorrer ao aguardar que os nós de computação necessários estejam prontos.
Queued Runs Contar Total (soma), média, mínimo, máximo, contagem Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName PT1M Yes
Execuções iniciadas

Número de execuções em execução para este espaço de trabalho. A contagem é atualizada quando a execução começa a usar os recursos necessários.
Started Runs Contar Total (soma), média, mínimo, máximo, contagem Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName PT1M Yes
Iniciando Processos

Número de execuções de runs iniciadas para este espaço de trabalho. A contagem é atualizada depois que a solicitação para criar a corrida e as informações da corrida, como a ID de corrida, foi preenchida.
Starting Runs Contar Total (soma), média, mínimo, máximo, contagem Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepType, ExperimentName PT1M Yes
Warnings

Número de avisos de execução neste espaço de trabalho. A contagem é atualizada sempre que uma execução encontra um aviso.
Warnings Contar Total (soma), média, mínimo, máximo, contagem Scenario PT1M Yes