注
このドキュメントでは、 Microsoft Foundry (クラシック) ポータルを参照します。
🔍 新しいポータルの詳細については、Microsoft Foundry (新しい) ドキュメント を参照してください。
この記事には、このサービスに関するすべての監視リファレンス情報が含まれています。
エージェントで収集できるデータの詳細については、 Foundry Agent Service の監視 に関するページを参照してください。
Metrics
エージェント サービスを監視する必要があると考える最も重要なメトリックを次に示します。 この記事の後半では、この短い一覧のメトリックの詳細を含む、使用可能なすべてのメトリックの長い一覧を示します。 最新の情報については、次の一覧を参照してください。 次のセクションでは、テーブルの更新に取り組んでいます。
サポートされているメトリック
このセクションには、このサービスに関して自動的に収集されるすべてのプラットフォーム メトリックが一覧表示されています。 これらのメトリックは、Azure Monitor でサポートされているすべてのプラットフォーム メトリックのグローバル リストにも含まれています。
- すべての列がすべてのテーブルに存在しないことがあります。
- 一部の列がページの表示領域を超えている場合があります。 [テーブルの展開] を選択すると、使用可能なすべての列が表示されます。
テーブル見出し
- カテゴリ - メトリック グループまたは分類。
- メトリック - Azure Portal に表示されるメトリックの表示名。
- REST API の名前 - REST API で参照されるメトリック名。
- 単位 - 測定単位。
- 集計 - 既定の 集計 の種類。 有効な値: 平均 (Avg)、最小 (Min)、最大 (Max)、合計 (Sum)、数。
- ディメンション - メトリックで使用できるディメンション。
-
時間グレイン - メトリックをサンプリングする間隔。 たとえば、
PT1Mは、メトリックを 1 分ごとに、PT30Mは 30 分ごとに、PT1Hは 1 時間ごとにサンプリングすることを示します。 - DS エクスポート - メトリックが診断設定を介して Azure Monitor ログにエクスポート可能かどうかを示します。 メトリックのエクスポートについては、「Azure Monitor で診断設定を作成する」を参照してください。
カテゴリ: エージェント
| メトリック | REST API での名前 | 単位 | 集約 | ディメンション | タイムグレインズ | DS エクスポート |
|---|---|---|---|---|---|---|
|
エージェント このワークスペース内の AI エージェントのイベントの数 |
Agents |
数える | 平均、最大、最小、合計(和) | EventType |
PT1M | いいえ |
|
インデックスされたファイル このワークスペース内のファイル検索用にインデックスが作成されたファイルの数 |
IndexedFiles |
数える | 平均、最大、最小、合計(和) |
ErrorCode、Status、VectorStoreId |
PT1M | いいえ |
|
メッセージ このワークスペース内の AI エージェント メッセージのイベントの数 |
Messages |
数える | 平均、最大、最小、合計(和) |
EventType、ThreadId |
PT1M | いいえ |
|
実行 このワークスペース内の AI エージェントによる実行の数 |
Runs |
数える | 平均、最大、最小、合計(和) |
AgentId、 RunStatus、 StatusCode、 StreamType |
PT1M | いいえ |
|
スレッド このワークスペース内の AI エージェント スレッドのイベントの数 |
Threads |
数える | 平均、最大、最小、合計(和) | EventType |
PT1M | いいえ |
|
トークン このワークスペース内のAIエージェントごとのトークンの数 |
Tokens |
数える | 平均、最大、最小、合計(和) |
AgentId、TokenType |
PT1M | いいえ |
|
ToolCalls このワークスペース内の AI エージェントによって行われたツール呼び出し |
ToolCalls |
数える | 平均、最大、最小、合計(和) |
AgentId、ToolName |
PT1M | いいえ |
カテゴリ: モデル
| メトリック | REST API での名前 | 単位 | 集約 | ディメンション | タイムグレインズ | DS エクスポート |
|---|---|---|---|---|---|---|
|
モデルのデプロイに失敗しました このワークスペースで失敗したモデル デプロイの数 |
Model Deploy Failed |
数える | 合計(和)、平均、最小、最大、件数 |
Scenario、StatusCode |
PT1M | イエス |
|
モデルのデプロイが開始されました このワークスペースで開始されたモデル デプロイの数 |
Model Deploy Started |
数える | 合計(和)、平均、最小、最大、件数 | Scenario |
PT1M | イエス |
|
モデルのデプロイに成功しました このワークスペースで成功したモデル デプロイの数 |
Model Deploy Succeeded |
数える | 合計(和)、平均、最小、最大、件数 | Scenario |
PT1M | イエス |
|
モデルの登録に失敗しました このワークスペースで失敗したモデル登録の数 |
Model Register Failed |
数える | 合計(和)、平均、最小、最大、件数 |
Scenario、StatusCode |
PT1M | イエス |
|
モデル登録が成功しました このワークスペースで成功したモデル登録の数 |
Model Register Succeeded |
数える | 合計(和)、平均、最小、最大、件数 | Scenario |
PT1M | イエス |
カテゴリ: 割当
| メトリック | REST API での名前 | 単位 | 集約 | ディメンション | タイムグレインズ | DS エクスポート |
|---|---|---|---|---|---|---|
|
アクティブ コア アクティブなコアの数 |
Active Cores |
数える | 平均、最大、最小、合計(和) |
Scenario、ClusterName |
PT1M | イエス |
|
アクティブ ノード アクティブ ノードの数。 これらは、ジョブをアクティブに実行しているノードです。 |
Active Nodes |
数える | 平均、最大、最小、合計(和) |
Scenario、ClusterName |
PT1M | イエス |
|
アイドル状態のコア アイドル状態のコアの数 |
Idle Cores |
数える | 平均、最大、最小、合計(和) |
Scenario、ClusterName |
PT1M | イエス |
|
アイドル状態のノード アイドル状態のノードの数。 アイドル状態のノードは、ジョブを実行していないノードですが、使用可能な場合は新しいジョブを受け入れることができます。 |
Idle Nodes |
数える | 平均、最大、最小、合計(和) |
Scenario、ClusterName |
PT1M | イエス |
|
終了中のコア 離脱するコアの数 |
Leaving Cores |
数える | 平均、最大、最小、合計(和) |
Scenario、ClusterName |
PT1M | イエス |
|
ノードを離れる 退出するノードの数。 終了中のノードとは、ジョブの処理を完了したばかりで、アイドル状態に移行していくノードのことです。 |
Leaving Nodes |
数える | 平均、最大、最小、合計(和) |
Scenario、ClusterName |
PT1M | イエス |
|
割り込まれたコア 割り込まれたコアの数 |
Preempted Cores |
数える | 平均、最大、最小、合計(和) |
Scenario、ClusterName |
PT1M | イエス |
|
割り込まれたノード 割り込まれたノードの数。 これらのノードは低優先度のノードであり、使用可能なノード プールから外されます。 |
Preempted Nodes |
数える | 平均、最大、最小、合計(和) |
Scenario、ClusterName |
PT1M | イエス |
|
クォータ使用率 クォータ使用率 (%) |
Quota Utilization Percentage |
数える | 平均、最大、最小、合計(和) |
Scenario、 ClusterName、 VmFamilyName、 VmPriority |
PT1M | イエス |
|
コアの合計 コアの合計数 |
Total Cores |
数える | 平均、最大、最小、合計(和) |
Scenario、ClusterName |
PT1M | イエス |
|
合計ノード数 ノードの合計数。 この合計には、稼働中のノード、アイドル状態のノード、使用できないノード、プリエンプトされたノード、退去中のノードなどが含まれます。 |
Total Nodes |
数える | 平均、最大、最小、合計(和) |
Scenario、ClusterName |
PT1M | イエス |
|
使用できないコア 使用できないコアの数 |
Unusable Cores |
数える | 平均、最大、最小、合計(和) |
Scenario、ClusterName |
PT1M | イエス |
|
使用できないノード 使用できないノードの数。 使用できないノードは、いくつかの問題が解決されていないため、機能していません。 これらのノードは Azure によってリサイクルされます。 |
Unusable Nodes |
数える | 平均、最大、最小、合計(和) |
Scenario、ClusterName |
PT1M | イエス |
カテゴリ: リソース
| メトリック | REST API での名前 | 単位 | 集約 | ディメンション | タイムグレインズ | DS エクスポート |
|---|---|---|---|---|---|---|
|
CPUの容量ミリコア CPU ノードの最大容量 (ミリコア単位)。 容量は 1 分間隔で集計されます。 |
CpuCapacityMillicores |
数える | 平均、最大、最小、合計(和) |
RunId、InstanceId、ComputeName |
PT1M | イエス |
|
CpuMemoryCapacityMegabytes CPU ノードの最大メモリ使用量 (MB 単位)。 使用量は 1 分間隔で集計されます。 |
CpuMemoryCapacityMegabytes |
数える | 平均、最大、最小、合計(和) |
RunId、InstanceId、ComputeName |
PT1M | イエス |
|
CpuMemoryUtilizationMegabytes CPU ノードのメモリ使用量 (MB 単位)。 使用量は 1 分間隔で集計されます。 |
CpuMemoryUtilizationMegabytes |
数える | 平均、最大、最小、合計(和) |
RunId、InstanceId、ComputeName |
PT1M | イエス |
|
CpuMemoryUtilizationPercentage CPU ノードのメモリ使用率 (%)。 使用量は 1 分間隔で集計されます。 |
CpuMemoryUtilizationPercentage |
数える | 平均、最大、最小、合計(和) |
RunId、InstanceId、ComputeName |
PT1M | イエス |
|
CPU使用率 CPU ノードの使用率 (%)。 使用率は 1 分間隔で報告されます。 |
CpuUtilization |
数える | 平均、最大、最小、合計(和) |
Scenario、 runId、 NodeId、 ClusterName |
PT1M | イエス |
|
CPU使用率ミリコア CPU ノードの使用量 (ミリコア単位)。 使用量は 1 分間隔で集計されます。 |
CpuUtilizationMillicores |
数える | 平均、最大、最小、合計(和) |
RunId、InstanceId、ComputeName |
PT1M | イエス |
|
CpuUtilizationPercentage CPU ノードの使用率。 使用量は 1 分間隔で集計されます。 |
CpuUtilizationPercentage |
数える | 平均、最大、最小、合計(和) |
RunId、InstanceId、ComputeName |
PT1M | イエス |
|
DiskAvailMegabytes 使用可能なディスク領域 (メガバイト単位)。 メトリックは 1 分間隔で集計されます。 |
DiskAvailMegabytes |
数える | 平均、最大、最小、合計(和) |
RunId、InstanceId、ComputeName |
PT1M | イエス |
|
DiskReadMegabytes ディスクから読み取られたデータ (メガバイト単位)。 メトリックは 1 分間隔で集計されます。 |
DiskReadMegabytes |
数える | 平均、最大、最小、合計(和) |
RunId、InstanceId、ComputeName |
PT1M | イエス |
|
DiskUsedMegabytes 使用されたディスク領域 (メガバイト単位)。 メトリックは 1 分間隔で集計されます。 |
DiskUsedMegabytes |
数える | 平均、最大、最小、合計(和) |
RunId、InstanceId、ComputeName |
PT1M | イエス |
|
DiskWriteMegabytes ディスクに書き込まれたデータ (メガバイト単位)。 メトリックは 1 分間隔で集計されます。 |
DiskWriteMegabytes |
数える | 平均、最大、最小、合計(和) |
RunId、InstanceId、ComputeName |
PT1M | イエス |
|
GpuCapacityMilliGPUs GPU デバイスの最大容量 (ミリ GPU 単位)。 容量は 1 分間隔で集計されます。 |
GpuCapacityMilliGPUs |
数える | 平均、最大、最小、合計(和) |
RunId、 InstanceId、 DeviceId、 ComputeName |
PT1M | イエス |
|
GpuEnergyJoules GPUノードにおけるジュール単位でのインターバルエネルギー。 エネルギーは 1 分間隔で報告されます。 |
GpuEnergyJoules |
数える | 平均、最大、最小、合計(和) |
Scenario、 runId、 rootRunId、 InstanceId、 DeviceId、 ComputeName |
PT1M | イエス |
|
GpuMemoryCapacityMegabytes GPU デバイスの最大メモリ容量 (MB 単位)。 容量は 1 分間隔で集計されます。 |
GpuMemoryCapacityMegabytes |
数える | 平均、最大、最小、合計(和) |
RunId、 InstanceId、 DeviceId、 ComputeName |
PT1M | イエス |
|
GpuMemoryUtilization GPU ノードのメモリ使用率 (%)。 使用率は 1 分間隔で報告されます。 |
GpuMemoryUtilization |
数える | 平均、最大、最小、合計(和) |
Scenario、runId、NodeId、DeviceId、ClusterName |
PT1M | イエス |
|
GpuMemoryUtilizationMegabytes GPU デバイスのメモリ使用量 (MB 単位)。 使用量は 1 分間隔で集計されます。 |
GpuMemoryUtilizationMegabytes |
数える | 平均、最大、最小、合計(和) |
RunId、 InstanceId、 DeviceId、 ComputeName |
PT1M | イエス |
|
GpuMemoryUtilizationPercentage GPU デバイスのメモリ使用率。 使用量は 1 分間隔で集計されます。 |
GpuMemoryUtilizationPercentage |
数える | 平均、最大、最小、合計(和) |
RunId、 InstanceId、 DeviceId、 ComputeName |
PT1M | イエス |
|
GpuUtilization GPU ノードの使用率 (%)。 使用率は 1 分間隔で報告されます。 |
GpuUtilization |
数える | 平均、最大、最小、合計(和) |
Scenario、runId、NodeId、DeviceId、ClusterName |
PT1M | イエス |
|
GPU使用率ミリGPU GPU デバイスの使用量 (ミリ GPU 単位)。 使用量は 1 分間隔で集計されます。 |
GpuUtilizationMilliGPUs |
数える | 平均、最大、最小、合計(和) |
RunId、 InstanceId、 DeviceId、 ComputeName |
PT1M | イエス |
|
GpuUtilizationPercentage GPU デバイスの使用率。 使用量は 1 分間隔で集計されます。 |
GpuUtilizationPercentage |
数える | 平均、最大、最小、合計(和) |
RunId、 InstanceId、 DeviceId、 ComputeName |
PT1M | イエス |
|
IBReceiveMegabytes InfiniBand 経由で受信されたネットワーク データ (メガバイト単位)。 メトリックは 1 分間隔で集計されます。 |
IBReceiveMegabytes |
数える | 平均、最大、最小、合計(和) |
RunId、 InstanceId、 ComputeName、 DeviceId |
PT1M | イエス |
|
IBTransmitMegabytes InfiniBand 経由で送信されたネットワーク データ (メガバイト単位)。 メトリックは 1 分間隔で集計されます。 |
IBTransmitMegabytes |
数える | 平均、最大、最小、合計(和) |
RunId、 InstanceId、 ComputeName、 DeviceId |
PT1M | イエス |
|
NetworkInputMegabytes 受信されたネットワーク データ (メガバイト単位)。 メトリックは 1 分間隔で集計されます。 |
NetworkInputMegabytes |
数える | 平均、最大、最小、合計(和) |
RunId、 InstanceId、 ComputeName、 DeviceId |
PT1M | イエス |
|
ネットワーク出力メガバイト 送信されたネットワーク データ (メガバイト単位)。 メトリックは 1 分間隔で集計されます。 |
NetworkOutputMegabytes |
数える | 平均、最大、最小、合計(和) |
RunId、 InstanceId、 ComputeName、 DeviceId |
PT1M | イエス |
|
ストレージAPIエラー数 Azure Blob Storage API 呼び出しの失敗数。 |
StorageAPIFailureCount |
数える | 平均、最大、最小、合計(和) |
RunId、InstanceId、ComputeName |
PT1M | イエス |
|
StorageAPISuccessCount Azure Blob Storage API 呼び出しの成功数。 |
StorageAPISuccessCount |
数える | 平均、最大、最小、合計(和) |
RunId、InstanceId、ComputeName |
PT1M | イエス |
カテゴリ: ランニング
| メトリック | REST API での名前 | 単位 | 集約 | ディメンション | タイムグレインズ | DS エクスポート |
|---|---|---|---|---|---|---|
|
要求された実行の取り消し このワークスペースにおいてキャンセルが要求された実行回数。 実行のキャンセル要求が受信されたときに、カウントが更新されます。 |
Cancel Requested Runs |
数える | 合計(和)、平均、最小、最大、件数 |
Scenario、 RunType、 PublishedPipelineId、 ComputeType、 PipelineStepType、 ExperimentName |
PT1M | イエス |
|
取り消された実行 このワークスペースに対して取り消された実行の数。 実行が正常に取り消されたときに、カウントが更新されます。 |
Cancelled Runs |
数える | 合計(和)、平均、最小、最大、件数 |
Scenario、 RunType、 PublishedPipelineId、 ComputeType、 PipelineStepType、 ExperimentName |
PT1M | イエス |
|
完了した実行 このワークスペースに対して正常に完了した実行の数。 実行が完了し、出力が収集されたときに、カウントが更新されます。 |
Completed Runs |
数える | 合計(和)、平均、最小、最大、件数 |
Scenario、 RunType、 PublishedPipelineId、 ComputeType、 PipelineStepType、 ExperimentName |
PT1M | イエス |
|
エラー このワークスペースの実行エラーの数。 実行時にエラーが発生するたびに、カウントが更新されます。 |
Errors |
数える | 合計(和)、平均、最小、最大、件数 | Scenario |
PT1M | イエス |
|
失敗した実行 このワークスペースで失敗した実行の数。 実行に失敗すると、カウントが更新されます。 |
Failed Runs |
数える | 合計(和)、平均、最小、最大、件数 |
Scenario、 RunType、 PublishedPipelineId、 ComputeType、 PipelineStepType、 ExperimentName |
PT1M | イエス |
|
実行の最終処理 このワークスペースに対して終了処理状態になった実行の数。 実行は完了しているものの、出力の収集がまだ進行中の場合に、カウントが更新されます。 |
Finalizing Runs |
数える | 合計(和)、平均、最小、最大、件数 |
Scenario、 RunType、 PublishedPipelineId、 ComputeType、 PipelineStepType、 ExperimentName |
PT1M | イエス |
|
応答しない実行 このワークスペースで応答していない実行数。 実行が応答していない状態になったときに、カウントが更新されます。 |
Not Responding Runs |
数える | 合計(和)、平均、最小、最大、件数 |
Scenario、 RunType、 PublishedPipelineId、 ComputeType、 PipelineStepType、 ExperimentName |
PT1M | イエス |
|
未開始の実行 このワークスペースに対して未開始状態の実行の数。 実行を作成するために要求が受信されたものの、実行情報がまだ設定されていない場合に、カウントが更新されます。 |
Not Started Runs |
数える | 合計(和)、平均、最小、最大、件数 |
Scenario、 RunType、 PublishedPipelineId、 ComputeType、 PipelineStepType、 ExperimentName |
PT1M | イエス |
|
実行の準備 このワークスペースに対して準備中の実行の数。 実行環境の準備中に実行が準備状態になると、カウントが更新されます。 |
Preparing Runs |
数える | 合計(和)、平均、最小、最大、件数 |
Scenario、 RunType、 PublishedPipelineId、 ComputeType、 PipelineStepType、 ExperimentName |
PT1M | イエス |
|
プロビジョニング中の実行数 このワークスペースに対してプロビジョニング中の実行の数。 実行がコンピュートターゲットの作成またはプロビジョニング中に待機している場合、カウントが更新されます。 |
Provisioning Runs |
数える | 合計(和)、平均、最小、最大、件数 |
Scenario、 RunType、 PublishedPipelineId、 ComputeType、 PipelineStepType、 ExperimentName |
PT1M | イエス |
|
キューに入れられた実行数 このワークスペースに対してキューに入れられた実行の数。 コンピューティング先で実行がキューに入れられたときに、カウントが更新されます。 必要なコンピューティング ノードの準備が整うまで待機しているときに発生する場合があります。 |
Queued Runs |
数える | 合計(和)、平均、最小、最大、件数 |
Scenario、 RunType、 PublishedPipelineId、 ComputeType、 PipelineStepType、 ExperimentName |
PT1M | イエス |
|
開始された実行数 このワークスペースで実行中のランの数。 必要なリソースに対して実行が開始されたときに、カウントが更新されます。 |
Started Runs |
数える | 合計(和)、平均、最小、最大、件数 |
Scenario、 RunType、 PublishedPipelineId、 ComputeType、 PipelineStepType、 ExperimentName |
PT1M | イエス |
|
実行の開始 このワークスペースに対して開始された実行の数。 実行の作成要求の後、および実行 ID などの実行情報が設定された後に、カウントが更新されます |
Starting Runs |
数える | 合計(和)、平均、最小、最大、件数 |
Scenario、 RunType、 PublishedPipelineId、 ComputeType、 PipelineStepType、 ExperimentName |
PT1M | イエス |
|
Warnings このワークスペースの実行警告の数。 実行時に警告が発生するたびに、カウントが更新されます。 |
Warnings |
数える | 合計(和)、平均、最小、最大、件数 | Scenario |
PT1M | イエス |
関連するコンテンツ
- 監視エージェント サービスの説明については、「エージェント サービスの監視」を参照してください。
- Azure リソースの監視の詳細については、「Azure Monitor で Azure リソースを監視する」を参照してください。