다음을 통해 공유


Azure AI Foundry 에이전트 서비스 모니터링 데이터 참조

이 문서에는 이 서비스에 대한 모든 모니터링 참조 정보가 포함되어 있습니다.

에이전트에서 수집할 수 있는 데이터에 대한 자세한 내용은 Azure AI Foundry 에이전트 서비스 모니터링 을 참조하세요.

지표

다음은 Azure AI Foundry 에이전트 서비스에 대해 모니터링해야 한다고 생각하는 가장 중요한 메트릭입니다. 이 문서의 뒷부분에서는 이 짧은 목록의 메트릭에 대한 자세한 내용을 포함하는 사용 가능한 모든 메트릭의 긴 목록입니다. 최신 정보는 아래 목록을 참조하세요. 다음 섹션에서 테이블을 새로 고치는 작업을 진행 중입니다.

지원되는 메트릭

이 섹션에는 이 서비스에 대해 자동으로 모은 플랫폼 메트릭이 모두 나열되어 있습니다. 이러한 메트릭은 Azure Monitor에서 지원되는 모든 플랫폼 메트릭의 전역 목록의 일부이기도 합니다.

  • 모든 테이블에 모든 열이 있는 것은 아닙니다.
  • 일부 열은 페이지의 보기 영역 밖에 있을 수 있습니다. 사용 가능한 모든 열을 보려면 테이블 확장을 선택합니다.

테이블 제목

  • 범주 - 메트릭 그룹 또는 분류입니다.
  • 메트릭 - Azure Portal에 표시되는 메트릭 표시 이름입니다.
  • REST API의 이름 - REST API에서 참조되는 메트릭 이름입니다.
  • 단위 - 측정 단위입니다.
  • 집계 - 기본 집계 형식입니다. 유효한 값은 평균(Avg), 최소(Min), 최대(Max), 합계(Sum), 개수입니다.
  • 크기 - 해당 메트릭에 사용할 수 있는 크기입니다.
  • 시간 조직 - 메트릭이 샘플링되는 간격입니다. 예를 들어, PT1M은 메트릭이 1분마다, PT30M은 30분마다, PT1H는 1시간마다 샘플링됨을 나타냅니다.
  • DS 내보내기- 진단 설정을 통해 메트릭을 Azure Monitor 로그로 내보낼 수 있는지 여부를 나타냅니다. 메트릭 내보내기에 대한 자세한 내용은 Azure Monitor의 진단 설정 생성을 참조하세요.

범주: 에이전트

측정단위 REST API의 이름 단위 집계 치수 시간 입자 DS 데이터 내보내기
에이전트

이 작업 영역의 AI 에이전트에 대한 이벤트 수
Agents 수량 평균, 최대, 최소, 합계(Sum) EventType PT1M 아니오
인덱싱된파일

이 작업 영역에서 파일 검색을 위해 인덱싱된 파일 수
IndexedFiles 수량 평균, 최대, 최소, 합계(Sum) ErrorCode, , StatusVectorStoreId PT1M 아니오
메시지

이 작업 영역의 AI 에이전트 메시지에 대한 이벤트 수
Messages 수량 평균, 최대, 최소, 합계(Sum) EventType, ThreadId PT1M 아니오
실행

이 작업 영역에서 AI 에이전트의 실행 수
Runs 수량 평균, 최대, 최소, 합계(Sum) AgentId, RunStatus, StatusCodeStreamType PT1M 아니오
스레드

이 작업 영역의 AI 에이전트 스레드에 대한 이벤트 수
Threads 수량 평균, 최대, 최소, 합계(Sum) EventType PT1M 아니오
토큰

이 작업 영역의 AI 에이전트별 토큰 수
Tokens 수량 평균, 최대, 최소, 합계(Sum) AgentId, TokenType PT1M 아니오
ToolCalls

이 작업 영역에서 AI 에이전트가 수행한 도구 호출
ToolCalls 수량 평균, 최대, 최소, 합계(Sum) AgentId, ToolName PT1M 아니오

범주: 모델

측정단위 REST API의 이름 단위 집계 치수 시간 입자 DS 데이터 내보내기
모델 배포 실패

이 작업 영역에서 실패한 모델 배포 수
Model Deploy Failed 수량 합계(합계), 평균, 최소, 최대, 개수 Scenario, StatusCode PT1M
모델 배포 시작

이 작업 영역에서 시작한 모델 배포 수
Model Deploy Started 수량 합계(합계), 평균, 최소, 최대, 개수 Scenario PT1M
모델 배포 성공

이 작업 영역에서 성공한 모델 배포 수
Model Deploy Succeeded 수량 합계(합계), 평균, 최소, 최대, 개수 Scenario PT1M
모델 등록 실패

이 작업 영역에서 실패한 모델 등록 수
Model Register Failed 수량 합계(합계), 평균, 최소, 최대, 개수 Scenario, StatusCode PT1M
모델 등록 성공

이 작업 영역에서 성공한 모델 등록 수
Model Register Succeeded 수량 합계(합계), 평균, 최소, 최대, 개수 Scenario PT1M

범주: 할당량

측정단위 REST API의 이름 단위 집계 치수 시간 입자 DS 데이터 내보내기
Active Cores

활성 코어 수
Active Cores 수량 평균, 최대, 최소, 합계(Sum) Scenario, ClusterName PT1M
활성 노드

Active 노드의 수입니다. 다음은 작업을 적극적으로 실행하는 노드입니다.
Active Nodes 수량 평균, 최대, 최소, 합계(Sum) Scenario, ClusterName PT1M
유휴 코어

유휴 코어 수
Idle Cores 수량 평균, 최대, 최소, 합계(Sum) Scenario, ClusterName PT1M
유휴 노드

유휴 노드 수. 유휴 노드는 어떤 작업도 실행하지 않지만 사용 가능한 경우 새 작업을 수락할 수 있는 노드입니다.
Idle Nodes 수량 평균, 최대, 최소, 합계(Sum) Scenario, ClusterName PT1M
나가는 코어

떠나는 코어 수
Leaving Cores 수량 평균, 최대, 최소, 합계(Sum) Scenario, ClusterName PT1M
노드를 종료합니다.

나가는 노드 수. 나가는 노드란 방금 작업 처리를 완료했으며 곧 유휴 상태로 전환될 노드입니다.
Leaving Nodes 수량 평균, 최대, 최소, 합계(Sum) Scenario, ClusterName PT1M
선점된 코어

선점된 코어 수
Preempted Cores 수량 평균, 최대, 최소, 합계(Sum) Scenario, ClusterName PT1M
선점된 노드

선점된 노드 수. 이러한 노드는 사용 가능한 노드 풀에서 제거되는 우선 순위가 낮은 노드입니다.
Preempted Nodes 수량 평균, 최대, 최소, 합계(Sum) Scenario, ClusterName PT1M
할당량 활용율

사용된 할당량의 백분율
Quota Utilization Percentage 수량 평균, 최대, 최소, 합계(Sum) Scenario, ClusterName, VmFamilyNameVmPriority PT1M
총 코어 수

총 코어 수
Total Cores 수량 평균, 최대, 최소, 합계(Sum) Scenario, ClusterName PT1M
총 노드 수

총 노드 수. 이 합계에는 일부 활성 노드, 유휴 노드, 사용할 수 없는 노드, 선점된 노드, 노드 종료가 포함됩니다.
Total Nodes 수량 평균, 최대, 최소, 합계(Sum) Scenario, ClusterName PT1M
사용할 수 없는 코어

사용할 수 없는 코어 수
Unusable Cores 수량 평균, 최대, 최소, 합계(Sum) Scenario, ClusterName PT1M
사용할 수 없는 노드

사용할 수 없는 노드 수입니다. 사용할 수 없는 노드는 해결할 수 없는 문제로 인해 기능하지 않습니다. Azure에서는 이러한 노드를 재활용합니다.
Unusable Nodes 수량 평균, 최대, 최소, 합계(Sum) Scenario, ClusterName PT1M

범주: 리소스

측정단위 REST API의 이름 단위 집계 치수 시간 입자 DS 데이터 내보내기
CPU 용량 밀리코어

CPU 노드의 최대 용량(밀리코어). 용량은 1분 간격으로 집계됩니다.
CpuCapacityMillicores 수량 평균, 최대, 최소, 합계(Sum) RunId, , InstanceIdComputeName PT1M
CpuMemoryCapacityMegabytes

CPU 노드의 최대 메모리 사용률(메가바이트)입니다. 사용률은 1분 간격으로 집계됩니다.
CpuMemoryCapacityMegabytes 수량 평균, 최대, 최소, 합계(Sum) RunId, , InstanceIdComputeName PT1M
CpuMemoryUtilizationMegabytes

CPU 노드의 메모리 사용률(MB)입니다. 사용률은 1분 간격으로 집계됩니다.
CpuMemoryUtilizationMegabytes 수량 평균, 최대, 최소, 합계(Sum) RunId, , InstanceIdComputeName PT1M
CpuMemoryUtilizationPercentage

CPU 노드의 메모리 사용률 백분율입니다. 사용률은 1분 간격으로 집계됩니다.
CpuMemoryUtilizationPercentage 수량 평균, 최대, 최소, 합계(Sum) RunId, , InstanceIdComputeName PT1M
CPU 사용률

CPU 노드의 사용률 비율입니다. 사용률은 1분 간격으로 보고됩니다.
CpuUtilization 수량 평균, 최대, 최소, 합계(Sum) Scenario, runId, NodeIdClusterName PT1M
CPU사용율밀리코어

CPU 노드의 사용률(밀리코어) 사용률은 1분 간격으로 집계됩니다.
CpuUtilizationMillicores 수량 평균, 최대, 최소, 합계(Sum) RunId, , InstanceIdComputeName PT1M
CpuUtilizationPercentage

CPU 노드의 사용률(%). 사용률은 1분 간격으로 집계됩니다.
CpuUtilizationPercentage 수량 평균, 최대, 최소, 합계(Sum) RunId, , InstanceIdComputeName PT1M
DiskAvailMegabytes

사용 가능한 디스크 공간(MB)입니다. 메트릭은 1분 간격으로 집계됩니다.
DiskAvailMegabytes 수량 평균, 최대, 최소, 합계(Sum) RunId, , InstanceIdComputeName PT1M
DiskReadMegabytes

디스크에서 읽은 데이터(MB)입니다. 메트릭은 1분 간격으로 집계됩니다.
DiskReadMegabytes 수량 평균, 최대, 최소, 합계(Sum) RunId, , InstanceIdComputeName PT1M
DiskUsedMegabytes

사용된 디스크 공간(MB)입니다. 메트릭은 1분 간격으로 집계됩니다.
DiskUsedMegabytes 수량 평균, 최대, 최소, 합계(Sum) RunId, , InstanceIdComputeName PT1M
DiskWriteMegabytes

디스크에 기록된 데이터(MB)입니다. 메트릭은 1분 간격으로 집계됩니다.
DiskWriteMegabytes 수량 평균, 최대, 최소, 합계(Sum) RunId, , InstanceIdComputeName PT1M
GpuCapacityMilliGPU

GPU 디바이스의 최대 용량(밀리 GPU). 용량은 1분 간격으로 집계됩니다.
GpuCapacityMilliGPUs 수량 평균, 최대, 최소, 합계(Sum) RunId, InstanceId, DeviceIdComputeName PT1M
GpuEnergyJoules

GPU 노드의 간격 에너지(Joules). 에너지는 1분 간격으로 보고됩니다.
GpuEnergyJoules 수량 평균, 최대, 최소, 합계(Sum) Scenario, runId, rootRunId, InstanceId, DeviceIdComputeName PT1M
GpuMemoryCapacityMegabytes

GPU 디바이스의 최대 메모리 용량(메가바이트)입니다. 용량은 1분 간격으로 집계됩니다.
GpuMemoryCapacityMegabytes 수량 평균, 최대, 최소, 합계(Sum) RunId, InstanceId, DeviceIdComputeName PT1M
GpuMemoryUtilization

GPU 노드의 메모리 사용률 비율입니다. 사용률은 1분 간격으로 보고됩니다.
GpuMemoryUtilization 수량 평균, 최대, 최소, 합계(Sum) Scenario, runId, NodeId, DeviceIdClusterName PT1M
GpuMemoryUtilizationMegabytes

GPU 디바이스의 메모리 사용률(MB). 사용률은 1분 간격으로 집계됩니다.
GpuMemoryUtilizationMegabytes 수량 평균, 최대, 최소, 합계(Sum) RunId, InstanceId, DeviceIdComputeName PT1M
GpuMemoryUtilizationPercentage

GPU 디바이스의 메모리 사용률 비율입니다. 사용률은 1분 간격으로 집계됩니다.
GpuMemoryUtilizationPercentage 수량 평균, 최대, 최소, 합계(Sum) RunId, InstanceId, DeviceIdComputeName PT1M
GpuUtilization

GPU 노드의 사용률입니다. 사용률은 1분 간격으로 보고됩니다.
GpuUtilization 수량 평균, 최대, 최소, 합계(Sum) Scenario, runId, NodeId, DeviceIdClusterName PT1M
GpuUtilizationMilliGPU

GPU 디바이스 사용률(밀리초). 사용률은 1분 간격으로 집계됩니다.
GpuUtilizationMilliGPUs 수량 평균, 최대, 최소, 합계(Sum) RunId, InstanceId, DeviceIdComputeName PT1M
GpuUtilizationPercentage

GPU 디바이스의 사용률(%). 사용률은 1분 간격으로 집계됩니다.
GpuUtilizationPercentage 수량 평균, 최대, 최소, 합계(Sum) RunId, InstanceId, DeviceIdComputeName PT1M
IBReceiveMegabytes

InfiniBand를 통해 수신된 네트워크 데이터(MB). 메트릭은 1분 간격으로 집계됩니다.
IBReceiveMegabytes 수량 평균, 최대, 최소, 합계(Sum) RunId, InstanceId, ComputeNameDeviceId PT1M
IBTransmitMegabytes

InfiniBand를 통해 발송된 네트워크 데이터(MB). 메트릭은 1분 간격으로 집계됩니다.
IBTransmitMegabytes 수량 평균, 최대, 최소, 합계(Sum) RunId, InstanceId, ComputeNameDeviceId PT1M
NetworkInputMegabytes

수신된 네트워크 데이터(메가바이트)입니다. 메트릭은 1분 간격으로 집계됩니다.
NetworkInputMegabytes 수량 평균, 최대, 최소, 합계(Sum) RunId, InstanceId, ComputeNameDeviceId PT1M
네트워크 출력 메가바이트

발송된 네트워크 데이터(MB). 메트릭은 1분 간격으로 집계됩니다.
NetworkOutputMegabytes 수량 평균, 최대, 최소, 합계(Sum) RunId, InstanceId, ComputeNameDeviceId PT1M
저장소 API 오류 횟수

Azure Blob Storage API 호출 실패 횟수
StorageAPIFailureCount 수량 평균, 최대, 최소, 합계(Sum) RunId, , InstanceIdComputeName PT1M
저장소API성공횟수

Azure Blob Storage API 호출 성공 횟수
StorageAPISuccessCount 수량 평균, 최대, 최소, 합계(Sum) RunId, , InstanceIdComputeName PT1M

범주: 달리기

측정단위 REST API의 이름 단위 집계 치수 시간 입자 DS 데이터 내보내기
요청된 실행 취소

이 작업 영역에 대해 취소가 요청된 실행 수. 실행에 대한 취소 요청을 받은 경우 개수가 업데이트됩니다.
Cancel Requested Runs 수량 합계(합계), 평균, 최소, 최대, 개수 Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M
취소된 실행

이 작업 영역에 대해 취소된 실행 수입니다. 실행이 성공적으로 취소되면 개수가 업데이트됩니다.
Cancelled Runs 수량 합계(합계), 평균, 최소, 최대, 개수 Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M
완료된 실행

이 작업 영역에 대해 성공적으로 완료된 실행 수입니다. 실행이 완료되고 출력이 수집되면 수가 업데이트 됩니다.
Completed Runs 수량 합계(합계), 평균, 최소, 최대, 개수 Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M
오류

이 작업 영역의 실행 오류 수. 실행 시 오류가 발생할 때마다 개수가 업데이트됩니다.
Errors 수량 합계(합계), 평균, 최소, 최대, 개수 Scenario PT1M
실패한 실행

이 작업 공간에서 실패한 실행 횟수입니다. 실행이 실패하면 수가 업데이트 됩니다.
Failed Runs 수량 합계(합계), 평균, 최소, 최대, 개수 Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M
실행 완료

이 작업 영역에 대해 완료 중인 상태에 진입한 실행 수. 실행이 완료되었지만 출력 컬렉션이 아직 진행 중인 경우 개수가 업데이트됩니다.
Finalizing Runs 수량 합계(합계), 평균, 최소, 최대, 개수 Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M
응답하지 않는 실행

이 작업 영역에 대해 응답하지 않는 실행 수입니다. 실행이 응답하지 않는 상태로 들어가면 개수가 업데이트됩니다.
Not Responding Runs 수량 합계(합계), 평균, 최소, 최대, 개수 Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M
시작되지 않은 실행

이 작업 영역에 대해 시작되지 않음 상태의 실행 수. 실행을 만드는 요청이 수신되었지만 실행 정보가 아직 채워지지 않은 경우 수가 업데이트됩니다.
Not Started Runs 수량 합계(합계), 평균, 최소, 최대, 개수 Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M
준비 중인 실행

이 작업 영역에 대해 준비 중인 실행 수. 실행 환경이 준비되는 동안 실행이 준비 상태로 들어가면 개수가 업데이트됩니다.
Preparing Runs 수량 합계(합계), 평균, 최소, 최대, 개수 Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M
프로비저닝 작업 실행

이 작업 영역을 위해 프로비저닝되는 실행 수입니다. 계산 대상 생성 또는 프로비저닝을 기다리는 동안 실행이 대기하는 경우 개수가 업데이트됩니다.
Provisioning Runs 수량 합계(합계), 평균, 최소, 최대, 개수 Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M
큐에서 대기 중인 실행

이 작업 영역에 대해 대기 중인 실행 수입니다. 실행이 컴퓨팅 대상의 큐에서 대기할 때 개수가 업데이트됩니다. 필요한 컴퓨팅 노드가 준비될 때까지 대기할 때 발생할 수 있습니다.
Queued Runs 수량 합계(합계), 평균, 최소, 최대, 개수 Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M
시작된 실행

이 작업 영역에 대해 실행 중인 실행 수. 필요한 리소스에서 실행이 시작되면 개수가 업데이트됩니다.
Started Runs 수량 합계(합계), 평균, 최소, 최대, 개수 Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M
실행 시작

이 작업 영역에 대해 시작된 실행 수. 실행 ID와 같은 실행 정보를 포함한 실행 생성 요청이 처리된 후, 정보가 채워지고 나면 개수가 업데이트됩니다.
Starting Runs 수량 합계(합계), 평균, 최소, 최대, 개수 Scenario, RunType, PublishedPipelineId, ComputeType, PipelineStepTypeExperimentName PT1M
경고

이 작업 영역의 실행 경고 수입니다. 실행에서 경고가 발생할 때마다 개수가 업데이트됩니다.
Warnings 수량 합계(합계), 평균, 최소, 최대, 개수 Scenario PT1M