Azure OpenAI 監視データ リファレンス

この記事には、このサービスのすべての監視参照情報が含まれています。

Monitor Azure OpenAI に関するページで、Microsoft Foundry Models で openAI をAzureするために収集できるデータとその使用方法について詳しく説明します。

Metrics

このセクションでは、このサービスに対して自動的に収集されたすべてのプラットフォーム メトリックの一覧を示します。 これらのメトリックは、 Azure Monitor でサポートされるすべてのプラットフォーム メトリックのグローバル リストの一部でもあります。

メトリックのリテンション期間については、「Azure Monitor メトリックの概要を参照してください。

Microsoftでサポートされているメトリック。CognitiveServices/accounts

ここでは、Azure OpenAI を監視する必要があると考える最も重要なメトリックを示します。 この記事の後半では、この短いリストのメトリックの詳細を含む、この名前空間で使用可能なすべてのメトリックの長い一覧を示します。 最新の情報については、以下の一覧を参照してください。 次のセクションでは、テーブルの更新に取り組んでいます。

  • OpenAI 要求のAzure
  • Active Tokens
  • 生成された完了トークン
  • 処理済み FineTuned トレーニング時間
  • 処理された推論トークン
  • 処理されたプロンプト トークン
  • プロビジョニングされたマネージド使用率 V2
  • プロンプト トークン キャッシュの一致率
  • Time to Response
  • トークン間の時間
  • 最後のバイトまでの時間
  • 正規化された時刻から最初のバイト
  • 1 秒あたりのトークン数

また、他の関連サービスで使用されているコンテンツの安全性メトリックを監視することもできます。

  • Blocked Volume
  • 有害なボリュームが検出されました
  • 潜在的な不正なユーザー数
  • 安全システムイベント
  • 安全性チェックのために送信された合計ボリューム

Note

プロビジョニングされたマネージド使用率メトリックは非推奨になり、推奨されなくなりました。 このメトリックは、 プロビジョニングされたマネージド使用率 V2 メトリックに 置き換えられました。 現時点では、1 秒あたりのトークン数、Time to Response、Time Between Tokens は、Standard デプロイでは使用できません。

Cognitive Services メトリックのカテゴリは、次の表の Cognitive Services - HTTP 要求 です。 これらのメトリックは、この種類のすべてのリソースに共通するレガシ メトリックです。 Microsoftでは、これらのメトリックを Azure OpenAI で使用することは推奨されなくなりました。

次の表に、Microsoftで使用できるメトリックを示します。CognitiveServices/accounts リソースの種類。

  • すべての列がすべてのテーブルに存在しない場合があります。
  • 一部の列は、ページの表示領域を超えている可能性があります。 [ テーブルの展開] を選択すると、使用可能なすべての列が表示されます。

Table headings

  • カテゴリ - メトリック グループまたは分類。
  • Metric - Azure ポータルに表示されるメトリックの表示名。
  • REST API の名前 - REST API で参照されるメトリック名。
  • 単位 - 測定単位。
  • 集計 - 既定の 集計 の種類。 有効な値: Average (Avg)、Minimum (Min)、Maximum (Max)、Total (Sum)、Count。
  • ディメンション - メトリックで使用できるディメンション
  • 時間グレイン - メトリックサンプリング間隔。 たとえば、 PT1M は、メトリックが毎分サンプリングされ、30 分ごとに PT30M 、1 時間ごとに PT1H されることを示します。
  • DS Export- 診断設定を使用してメトリックを Azure Monitor ログにエクスポートできるかどうかを指定します。 メトリックのエクスポートの詳細については、「Azure Monitor で診断設定を作成するを参照してください。

Category: Actions

Metric REST API の名前 Unit Aggregation Dimensions Time Grains DS Export
Action Occurences

各アクションが表示される回数。
ActionIdOccurrences Count Total (Sum) ActionIdModeRunId PT1M Yes
イベントあたりのアクション数

イベントあたりのアクションの数。
ActionsPerEvent Count Average Mode, RunId PT1M Yes

カテゴリ: Azure OpenAI - HTTP 要求

Metric REST API の名前 Unit Aggregation Dimensions Time Grains DS Export
Azure OpenAI AvailabilityRate

次の計算による可用性の割合: (合計呼び出し数 - サーバー エラー数)/呼び出しの合計数。 サーバー エラーには、HTTP 応答 >=500 が含まれます。
AzureOpenAIAvailabilityRate Percent 最小値、最大値、平均 ApiNameOperationNameRegionStreamTypeModelDeploymentNameModelNameModelVersion PT1M No
Azure OpenAI 要求

Azure OpenAI API に対して一定期間に行われた呼び出しの数。 PTU、PTU-Managed、従量課金制のデプロイに適用されます。 API 要求を内訳するには、フィルターを追加するか、ModelDeploymentName、ModelName、ModelVersion、StatusCode (成功、clienterrors、サーバー エラー)、スピルオーバー情報の IsSpillover、ServiceTier、StreamType (ストリーミング要求と非ストリーミング要求) と操作のディメンションで分割を適用できます。
AzureOpenAIRequests Count Total (Sum) ApiNameOperationNameRegionStreamTypeModelDeploymentNameModelNameModelVersionStatusCodeIsSpilloverServiceTierRequestServiceTierResponse PT1M Yes

カテゴリ: Azure OpenAI - 待機時間

Metric REST API の名前 Unit Aggregation Dimensions Time Grains DS Export
トークン間の時間

ストリーミング要求の場合。モデル トークン生成率 (ミリ秒単位)。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。
AzureOpenAINormalizedTBTInMS MilliSeconds 最大、最小、平均 RegionModelDeploymentNameModelNameModelVersion PT1M Yes
正規化された時刻から最初のバイト

ストリーミング要求と非ストリーミング要求の場合。要求がモデルによって行われ、トークンによって正規化された後に、応答データの最初のバイトが受信されるまでにかかる時間。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。
AzureOpenAINormalizedTTFTInMS MilliSeconds 最大、最小、平均 RegionModelDeploymentNameModelNameModelVersion PT1M Yes
Time to Response

ストリーミング要求の推奨待機時間 (応答性) 測定。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。 API ゲートウェイによって測定された、ユーザーがプロンプトを送信した後に最初の応答が表示される時間として計算されます。 この数は、プロンプト サイズの増加やキャッシュ ヒット サイズの縮小に伴って増加します。 応答メトリックの内訳時間を設定するには、フィルターを追加するか、ModelDeploymentName、ModelName、ModelVersion というディメンションで分割を適用します。

注: このメトリックは、測定された待機時間が同時呼び出しや全体的なワークロード パターンなど、複数の要因に大きく依存する近似値です。 さらに、クライアントと API エンドポイントの間に存在する可能性のあるクライアント側の待機時間は考慮されません。 最適な待機時間の追跡については、独自のログ記録を参照してください。
AzureOpenAITimeToResponse MilliSeconds 最小値、最大値、平均 ApiNameOperationNameRegionStreamTypeModelDeploymentNameModelNameModelVersionStatusCode PT1M Yes
1 秒あたりのトークン数

特定の Azure OpenAI モデル応答の生成速度を列挙します。 生成されたトークンの合計は、トークンを生成する時間 (秒単位) で除算されます。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。
AzureOpenAITokenPerSecond Count 最大、最小、平均 RegionModelDeploymentNameModelNameModelVersion PT1M Yes
最後のバイトまでの時間

ストリーミング要求と非ストリーミング要求の場合。モデルによって要求が行われた後、応答データの最後のバイトが受信されるまでにかかる時間。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。
AzureOpenAITTLTInMS MilliSeconds 最大、最小、平均 RegionModelDeploymentNameModelNameModelVersion PT1M Yes

カテゴリ: Azure OpenAI - 使用状況

Metric REST API の名前 Unit Aggregation Dimensions Time Grains DS Export
Active Tokens

一定期間のトークンの合計からキャッシュされたトークンを差し引いた値。 PTU と PTU で管理されるデプロイに適用されます。 このメトリックを使用して、PTU の TPS または TPM ベースの使用率を理解し、シナリオのターゲット TPS または TPM のベンチマークと比較します。 API 要求を内訳するには、フィルターを追加するか、ModelDeploymentName、ModelName、および ModelVersion というディメンションで分割を適用できます。
ActiveTokens Count Minimum、Maximum、Average、Total (Sum) RegionModelDeploymentNameModelNameModelVersion PT1M Yes
オーディオ補完トークン

OpenAI モデルで生成 (出力) されたオーディオ プロンプト トークンの数。 PTU マネージドおよび従量課金制モデルのデプロイに適用されます。
AudioCompletionTokens Count Total (Sum) ModelDeploymentNameModelNameModelVersionRegion PT1M Yes
オーディオ プロンプト トークン

OpenAI モデルで処理 (入力) されたオーディオ プロンプト トークンの数。 PTU マネージドおよび従量課金制モデルのデプロイに適用されます。
AudioPromptTokens Count Total (Sum) ModelDeploymentNameModelNameModelVersionRegion PT1M Yes
プロンプト トークン キャッシュの一致率

キャッシュにヒットしたプロンプト トークンの割合。 PTU と PTU で管理されるデプロイに適用されます。
AzureOpenAIContextTokensCacheMatchRate Percent 最小値、最大値、平均 RegionModelDeploymentNameModelNameModelVersion PT1M No
プロビジョニングされたマネージド使用率 (非推奨)

プロヴィゾンマネージド展開の利用率 % は(消費PTU数/展開数)×100で計算されます。 利用率が100%を超えると通話が制限され、エラーコード429が返されます。 このメトリックを内訳するには、フィルターを追加するか、ModelDeploymentName、ModelName、ModelVersion、StreamType (ストリーミング要求と非ストリーミング要求) のディメンションで分割を適用できます。
AzureOpenAIProvisionedManagedUtilization Percent 最小値、最大値、平均 RegionStreamTypeModelDeploymentNameModelNameModelVersion PT1M No
プロビジョニングされたマネージド使用率 V2

プロヴィゾンマネージド展開の利用率 % は(消費PTU数/展開数)×100で計算されます。 利用率が100%を超えると通話が制限され、エラーコード429が返されます。 このメトリックを内訳するには、フィルターを追加するか、ModelDeploymentName、ModelName、ModelVersion、StreamType (ストリーミング要求と非ストリーミング要求) のディメンションで分割を適用できます。
AzureOpenAIProvisionedManagedUtilizationV2 Percent 最小値、最大値、平均 RegionStreamTypeModelDeploymentNameModelNameModelVersion PT1M No
処理済み FineTuned トレーニング時間

OpenAI FineTuned モデルで処理されたトレーニング時間数
FineTunedTrainingHours Count Total (Sum) ApiNameModelDeploymentNameFeatureNameUsageChannelRegion PT1M Yes
生成された完了トークン

OpenAI モデルから生成 (出力) されたトークンの数。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。 このメトリックを内訳するには、フィルターを追加するか、ModelDeploymentName と ModelName というディメンションで分割を適用します。
GeneratedTokens Count Total (Sum) ApiNameModelDeploymentNameFeatureNameUsageChannelRegionModelVersion PT1M Yes
処理されたプロンプト トークン

OpenAI モデルで処理 (入力) されたプロンプト トークンの数。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。 このメトリックを内訳するには、フィルターを追加するか、ModelDeploymentName と ModelName というディメンションで分割を適用します。
ProcessedPromptTokens Count Total (Sum) ApiNameModelDeploymentNameFeatureNameUsageChannelRegionModelVersion PT1M Yes
リアルタイム API の使用秒数

RealtimeAPI の使用秒数
RealtimeUsageTime Count Total (Sum) Region, ModelDeploymentName PT1M Yes
処理された推論トークン

OpenAI モデルで処理された推論トークンの数。 プロンプト トークン (入力) と生成されたトークン (出力) として計算されます。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。 このメトリックを内訳するには、フィルターを追加するか、ModelDeploymentName と ModelName というディメンションで分割を適用します。
TokenTransaction Count Total (Sum) ApiNameModelDeploymentNameFeatureNameUsageChannelRegionModelVersion PT1M Yes

カテゴリ: Cognitive Services - HTTP 要求

Metric REST API の名前 Unit Aggregation Dimensions Time Grains DS Export
Blocked Calls

レートまたはクォータの制限を超えた呼び出しの数。 Azure OpenAI サービスには使用しないでください。
BlockedCalls Count Total (Sum) ApiNameOperationNameRegionRatelimitKey PT1M Yes
Client Errors

クライアント側エラーが発生した呼び出しの数 (HTTP 応答コード 4xx)。 Azure OpenAI サービスには使用しないでください。
ClientErrors Count Total (Sum) ApiNameOperationNameRegionRatelimitKey PT1M Yes
Data In

受信データのサイズ (バイト単位)。 Azure OpenAI サービスには使用しないでください。
DataIn Bytes Total (Sum) ApiNameOperationNameRegion PT1M Yes
Data Out

送信データのサイズ (バイト単位)。 Azure OpenAI サービスには使用しないでください。
DataOut Bytes Total (Sum) ApiNameOperationNameRegion PT1M Yes
Latency

待機時間 (ミリ秒単位)。 Azure OpenAI サービスには使用しないでください。
Latency MilliSeconds Average ApiNameOperationNameRegionRatelimitKey PT1M Yes
Ratelimit

ratelimit キーの現在の ratelimit。 Azure OpenAI サービスには使用しないでください。
Ratelimit Count Total (Sum) Region, RatelimitKey PT1M Yes
Server Errors

サービス内部エラーが発生した呼び出しの数 (HTTP 応答コード 5xx)。 Azure OpenAI サービスには使用しないでください。
ServerErrors Count Total (Sum) ApiNameOperationNameRegionRatelimitKey PT1M Yes
Successful Calls

成功した呼び出しの数。 Azure OpenAI サービスには使用しないでください。
SuccessfulCalls Count Total (Sum) ApiNameOperationNameRegionRatelimitKey PT1M Yes
Total Calls

呼び出しの合計数。 Azure OpenAI サービスには使用しないでください。
TotalCalls Count Total (Sum) ApiNameOperationNameRegionRatelimitKey PT1M Yes
Total Errors

エラー応答を含む呼び出しの合計数 (HTTP 応答コード 4xx または 5xx)。 Azure OpenAI サービスには使用しないでください。
TotalErrors Count Total (Sum) ApiNameOperationNameRegionRatelimitKey PT1M Yes
トークン呼び出しの合計数

トークン呼び出しの合計数。
TotalTokenCalls Count Total (Sum) ApiNameOperationNameRegion PT1M Yes

カテゴリ: Cognitive Services - SLI

Metric REST API の名前 Unit Aggregation Dimensions Time Grains DS Export
AvailabilityRate

次の計算による可用性の割合: (合計呼び出し数 - サーバー エラー数)/呼び出しの合計数。 サーバー エラーには、HTTP 応答 >=500 が含まれます。 Azure OpenAI サービスには使用しないでください。
SuccessRate Percent 最小値、最大値、平均 ApiNameOperationNameRegionRatelimitKey PT1M No

カテゴリ: コンテンツの理解 - 使用状況

Metric REST API の名前 Unit Aggregation Dimensions Time Grains DS Export
Face Transactions

Face サービスに対して行われた API 呼び出しの数
FaceApiTransactions Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
処理済みオーディオ (分)

処理されたオーディオの分数
ProcessedAudioMinutes Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
Processed Pages

処理されたドキュメント ページの数
ProcessedDocumentPages Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
Processed Images

処理されたイメージの数
ProcessedImageCount Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
処理されたビデオの時間 (分)

処理されたビデオの分数
ProcessedVideoMinutes Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
Tokens

使用されたトークンの数
Tokens Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes

カテゴリ: ContentSafety - リスクと安全性

Metric REST API の名前 Unit Aggregation Dimensions Time Grains DS Export
悪用される可能性のあるユーザー数

一定期間に検出された、悪用される可能性のあるユーザーの数。 フィルターを追加するか、次のディメンションで分割を適用できます: ModelDeploymentName。
RAIAbusiveUsersCount Count Total (Sum) Region, ModelDeploymentName PT1M Yes
有害なボリュームが検出されました

OpenAI API Azure呼び出しが行われ、一定期間にわたって適用されたコンテンツ フィルターによって有害 (ブロック モデルと注釈モードの両方) として検出された呼び出しの数。 フィルターを追加するか、ModelDeploymentName、ModelName、および TextType というディメンションで分割を適用できます。
RAIHarmfulRequests Count Total (Sum) RegionModelDeploymentNameModelNameModelVersionApiNameTextTypeCategorySeverity PT1M Yes
Blocked Volume

Azure OpenAI API に対して行われ、一定期間に適用されたコンテンツ フィルターによって拒否された呼び出しの数。 フィルターを追加するか、ModelDeploymentName、ModelName、および TextType というディメンションで分割を適用できます。
RAIRejectedRequests Count Total (Sum) RegionModelDeploymentNameModelNameModelVersionApiNameTextTypeCategory PT1M Yes
安全システムイベント

リスクと安全性の監視のためのシステム イベント。 フィルターを追加するか、次のディメンションで分割を適用できます: EventType。
RAISystemEvent Count Average Region, EventType PT1M Yes
安全性チェックのために送信された合計ボリューム

Azure OpenAI API に対して行われ、一定期間にわたって適用されたコンテンツ フィルターによって検出された呼び出しの数。 フィルターを追加したり、ModelDeploymentName、ModelName というディメンションで分割を適用したりできます。
RAITotalRequests Count Total (Sum) RegionModelDeploymentNameModelNameModelVersionApiName PT1M Yes

カテゴリ: ContentSafety - Usage

Metric REST API の名前 Unit Aggregation Dimensions Time Grains DS Export
イメージ モデレーションの呼び出し数

イメージ モデレーションの呼び出しの数。
ContentSafetyImageAnalyzeRequestCount Count Total (Sum) ApiVersion PT1M Yes
テキスト モデレーションの呼び出し数

テキスト モデレーションの呼び出しの数。
ContentSafetyTextAnalyzeRequestCount Count Total (Sum) ApiVersion PT1M Yes

Category: Estimations

Metric REST API の名前 Unit Aggregation Dimensions Time Grains DS Export
ベースラインランダムイベント数

ベースラインランダムイベント数の推定。
BaselineRandomEventCount Count Total (Sum) Mode, RunId PT1M Yes
ベースラインランダム報酬

ベースラインランダム報酬の推定。
BaselineRandomReward Count Total (Sum) Mode, RunId PT1M Yes
オンライン イベント数

オンライン イベント数の見積もり。
OnlineEventCount Count Total (Sum) Mode, RunId PT1M Yes
Online Reward

オンライン報酬の見積もり。
OnlineReward Count Total (Sum) Mode, RunId PT1M Yes
ユーザー ベースライン イベント数

ユーザー定義のベースライン イベント数の見積もり。
UserBaselineEventCount Count Total (Sum) Mode, RunId PT1M Yes
ユーザー ベースライン報酬

ユーザー定義のベースライン報酬の見積もり。
UserBaselineReward Count Total (Sum) Mode, RunId PT1M Yes

カテゴリ: 特徴の発生

Metric REST API の名前 Unit Aggregation Dimensions Time Grains DS Export
アクション機能の出現回数

各アクション機能が表示される回数。
ActionFeatureIdOccurrences Count Total (Sum) FeatureIdModeRunId PT1M Yes
コンテキスト機能の出現

各コンテキスト機能が表示される回数。
ContextFeatureIdOccurrences Count Total (Sum) FeatureIdModeRunId PT1M Yes
スロットフィーチャーの出現回数

各スロット機能が表示される回数。
SlotFeatureIdOccurrences Count Total (Sum) FeatureIdModeRunId PT1M Yes

Category: FeatureCardinality

Metric REST API の名前 Unit Aggregation Dimensions Time Grains DS Export
アクション別の特徴カーディナリティ

アクションに基づく特徴カーディナリティ。
FeatureCardinality_Action Count Average FeatureIdModeRunId PT1M Yes
コンテキスト別の特徴カーディナリティ

コンテキストに基づく特徴カーディナリティ。
FeatureCardinality_Context Count Average FeatureIdModeRunId PT1M Yes
スロットごとの特徴カーディナリティ

スロットに基づく特徴カーディナリティ。
FeatureCardinality_Slot Count Average FeatureIdModeRunId PT1M Yes

カテゴリ: イベントごとの機能

Metric REST API の名前 Unit Aggregation Dimensions Time Grains DS Export
イベントごとのアクション機能

イベントあたりのアクション機能の平均数。
ActionFeaturesPerEvent Count Average Mode, RunId PT1M Yes
イベントごとのコンテキスト機能

イベントあたりのコンテキスト特徴の数。
ContextFeaturesPerEvent Count Average Mode, RunId PT1M Yes
イベントごとのスロット機能

イベントあたりのスロット機能の平均数。
SlotFeaturesPerEvent Count Average Mode, RunId PT1M Yes

カテゴリ: 言語 - ジョブ

Metric REST API の名前 Unit Aggregation Dimensions Time Grains DS Export
ジョブの期間 (プレビュー)

注: この値は、入力サイズ、ドキュメント数、タスクの複雑さに大きく依存します。 これは、すべてのジョブ タスクの集計値です。
JobDuration MilliSeconds 最小値、最大値、平均 JobStatus, JobType PT1M Yes

カテゴリ: モデル - HTTP 要求

Metric REST API の名前 Unit Aggregation Dimensions Time Grains DS Export
モデルの可用性率

次の計算による可用性の割合: (合計呼び出し数 - サーバー エラー数)/呼び出しの合計数。 サーバー エラーには、HTTP 応答 >=500 が含まれます。
ModelAvailabilityRate Percent 最小値、最大値、平均 RegionModelDeploymentNameModelNameModelVersion PT1M No
Model Requests

一定期間にモデル API に対して行われた呼び出しの数。 PTU、PTU-Managed、従量課金制のデプロイに適用されます。
ModelRequests Count Total (Sum) ApiNameOperationNameRegionStreamTypeModelDeploymentNameModelNameModelVersionStatusCodeIsSpilloverServiceTierRequestServiceTierResponse PT1M Yes

カテゴリ: モデル - 待機時間

Metric REST API の名前 Unit Aggregation Dimensions Time Grains DS Export
トークン間の時間

モデル トークン生成率 (ミリ秒単位)。 PTU と PTU で管理されるデプロイに適用されます。 ストリーミング以外の要求の場合、この値は見積もりです。
NormalizedTimeBetweenTokens MilliSeconds 最大、最小、平均 ApiNameOperationNameRegionStreamTypeModelDeploymentNameModelNameModelVersion PT1M Yes
正規化された時刻から最初のバイト

要求がモデルによって行われ、トークンによって正規化された後、応答データの最初のバイトが受信されるまでにかかる時間。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。 ストリーミング以外の要求の場合、この値は見積もりです。
NormalizedTimeToFirstToken MilliSeconds 最大、最小、平均 ApiNameOperationNameRegionStreamTypeModelDeploymentNameModelNameModelVersion PT1M Yes
最後のバイトまでの時間

モデルによって要求が行われた後、応答データの最後のバイトが受信されるまでにかかる時間。 PTU、PTU マネージド、従量課金制のデプロイに適用されます。 ストリーミング以外の要求の場合、この値は見積もりです。
TimeToLastByte MilliSeconds 最大、最小、平均 ApiNameOperationNameRegionStreamTypeModelDeploymentNameModelNameModelVersion PT1M Yes
Time to Response

推奨される待機時間 (応答性) の測定。 PTU と PTU で管理されるデプロイに適用されます。 API ゲートウェイによって測定された、ユーザーがプロンプトを送信した後に最初の応答が表示される時間として計算されます。 この数は、プロンプト サイズの増加やキャッシュ ヒット サイズの縮小に伴って増加します。 応答メトリックの内訳時間を設定するには、フィルターを追加するか、ModelDeploymentName、ModelName、ModelVersion というディメンションで分割を適用します。

注: このメトリックは、測定された待機時間が同時呼び出しや全体的なワークロード パターンなど、複数の要因に大きく依存する近似値です。 さらに、クライアントと API エンドポイントの間に存在する可能性のあるクライアント側の待機時間は考慮されません。 ストリーミング以外の要求の場合、この値は見積もりです。 最適な待機時間の追跡については、独自のログ記録を参照してください。
TimeToResponse MilliSeconds 最小値、最大値、平均 ApiNameOperationNameRegionStreamTypeModelDeploymentNameModelNameModelVersionStatusCode PT1M Yes
1 秒あたりのトークン数

特定のモデル応答の生成速度を列挙します。 生成されたトークンの合計は、トークンを生成する時間 (秒単位) で除算されます。 PTU と PTU で管理されるデプロイに適用されます。 ストリーミング以外の要求の場合、この値は見積もりです。
TokensPerSecond Count 最大、最小、平均 ApiNameOperationNameRegionStreamTypeModelDeploymentNameModelNameModelVersion PT1M Yes

カテゴリ: モデル - 使用法

Metric REST API の名前 Unit Aggregation Dimensions Time Grains DS Export
Annotated Pages

注釈で処理されたページの合計数。 PTU、PTU-Managed、従量課金制のデプロイに適用されます。
AnnotatedPages Count Total (Sum) ApiNameRegionModelDeploymentNameModelNameModelVersion PT1M Yes
オーディオ入力トークン

OpenAI モデルで処理 (入力) されたオーディオ プロンプト トークンの数。 PTU マネージド モデルのデプロイに適用されます。
AudioInputTokens Count Total (Sum) ModelDeploymentNameModelNameModelVersionRegion PT1M Yes
オーディオ出力トークン

OpenAI モデルで生成 (出力) されたオーディオ プロンプト トークンの数。 PTU マネージド モデルのデプロイに適用されます。
AudioOutputTokens Count Total (Sum) ModelDeploymentNameModelNameModelVersionRegion PT1M Yes
キャッシュからトークンの読み取りを求める

キャッシュから読み取られたトークンの合計数。 Anthropic モデルのデプロイに適用されます。 応答の使用状況セクションで次のように表示されます。 cache_read_input_tokens
cacheReadInputTokens Count Total (Sum) ApiNameRegionModelDeploymentNameModelNameModelVersionContextLength PT1M Yes
キャッシュに書き込まれたプロンプト トークン (1 時間 TTL)

1 時間のエントリの作成に使用されるプロンプト トークンの数。 Anthropic モデルのデプロイに適用されます。 応答の使用状況セクションで次のように表示されます。 cache_creation.ephemeral_1h_input_tokens
ephemeral1hInputTokens Count Total (Sum) ApiNameRegionModelDeploymentNameModelNameModelVersionContextLength PT1M Yes
キャッシュに書き込まれたプロンプト トークン (5 分 TTL)

5 分間のキャッシュ エントリの作成に使用されるプロンプト トークンの数。 Anthropic モデルのデプロイに適用されます。 応答の使用状況セクションで次のように表示されます。 cache_creation.ephemeral_5m_input_tokens
ephemeral5mInputTokens Count Total (Sum) ApiNameRegionModelDeploymentNameModelNameModelVersionContextLength PT1M Yes
Generated Images

生成されたイメージの合計数。 PTU、PTU-Managed、従量課金制のデプロイに適用されます。
GeneratedImages Count Total (Sum) ApiNameRegionModelDeploymentNameModelNameModelVersion PT1M Yes
Input Tokens

モデルで処理 (入力) されたプロンプト トークンの数。 PTU、PTU-Managed、従量課金制のデプロイに適用されます。
InputTokens Count Total (Sum) ApiNameRegionModelDeploymentNameModelNameModelVersion PT1M Yes
Output Tokens

OpenAI モデルから生成 (出力) されたトークンの数。 PTU、PTU-Managed、従量課金制のデプロイに適用されます。
OutputTokens Count Total (Sum) ApiNameRegionModelDeploymentNameModelNameModelVersion PT1M Yes
Provisioned Utilization

プロヴィゾンマネージド展開の利用率 % は(消費PTU数/展開数)×100で計算されます。 利用率が100%を超えると通話が制限され、エラーコード429が返されます。
ProvisionedUtilization Percent 最小値、最大値、平均 RegionModelDeploymentNameModelNameModelVersion PT1M No
Total Pages

処理されたページの合計数。 PTU、PTU-Managed、従量課金制のデプロイに適用されます。
TotalPages Count Total (Sum) ApiNameRegionModelDeploymentNameModelNameModelVersion PT1M Yes
Total Tokens

モデルで処理された推論トークンの数。 プロンプト トークン (入力) と生成されたトークン (出力) として計算されます。 PTU、PTU-Managed、従量課金制のデプロイに適用されます。
TotalTokens Count Total (Sum) ApiNameRegionModelDeploymentNameModelNameModelVersion PT1M Yes

カテゴリ: イベントごとの名前空間

Metric REST API の名前 Unit Aggregation Dimensions Time Grains DS Export
イベントごとのアクション名前空間

イベントあたりのアクション名前空間の平均数。
ActionNamespacesPerEvent Count Average Mode, RunId PT1M Yes
イベントごとのコンテキスト名前空間

イベントあたりのコンテキスト名前空間の数。
ContextNamespacesPerEvent Count Average Mode, RunId PT1M Yes
イベントごとのスロット名前空間

イベントあたりのスロット名前空間の平均数。
SlotNamespacesPerEvent Count Average Mode, RunId PT1M Yes

Category: Rewards

Metric REST API の名前 Unit Aggregation Dimensions Time Grains DS Export
イベントあたりの平均報酬

イベントあたりの平均報酬。
Reward Count Average BaselineActionChosenActionIdMatchesBaselineNonDefaultRewardModeRunId PT1M Yes
Slot Reward

スロットあたりの報酬。
SlotReward Count Average BaselineActionIdChosenActionIdMatchesBaselineNonDefaultRewardSlotIdSlotIndexModeRunId PT1M Yes

Category: Slots

Metric REST API の名前 Unit Aggregation Dimensions Time Grains DS Export
ベースライン推定器の全体的な報酬

ベースライン推定器の全体的な報酬。
BaselineEstimatorOverallReward Count Average Mode, RunId PT1M Yes
ベースライン推定スロット報酬

スロットごとのベースライン推定リワード。
BaselineEstimatorSlotReward Count Average SlotIdSlotIndexModeRunId PT1M Yes
ベースライン ランダム推定器の全体的な報酬

ベースラインランダム推定器の全体的な報酬。
BaselineRandomEstimatorOverallReward Count Average Mode, RunId PT1M Yes
ベースラインランダムエスティメータースロット報酬

スロットごとのベースラインランダム推定報酬。
BaselineRandomEstimatorSlotReward Count Average SlotIdSlotIndexModeRunId PT1M Yes
Slots

イベントあたりのスロット数。
NumberOfSlots Count Average Mode, RunId PT1M Yes
オンライン推定器の全体的な報酬

オンライン推定器の全体的な報酬。
OnlineEstimatorOverallReward Count Average Mode, RunId PT1M Yes
オンライン推定スロット報酬

スロットごとのオンライン推定報酬。
OnlineEstimatorSlotReward Count Average SlotIdSlotIndexModeRunId PT1M Yes
Slot Occurrences

各スロットが表示される回数。
SlotIdOccurrences Count Total (Sum) SlotIdSlotIndexModeRunId PT1M Yes

カテゴリ: SpeechServices - Usage

Metric REST API の名前 Unit Aggregation Dimensions Time Grains DS Export
Audio Seconds Batch Transcribed

文字起こしされたバッチ秒数
AudioSecondsBatchTranscribed Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
オーディオ秒バッチささやき文字起こし

バッチ囁き文字起こし秒数
AudioSecondsBatchWhisperTranscribed Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
Audio Seconds Fast Transcribed

文字起こしされた高速秒数
AudioSecondsFastTranscribed Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
オーディオ秒高速ささやき文字起こし

高速囁き文字起こし秒数
AudioSecondsFastWhisperTranscribed Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
Audio Seconds Transcribed

文字起こしされた秒数
AudioSecondsTranscribed Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
Audio Seconds Translated

変換された秒数
AudioSecondsTranslated Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
アバター モデルホスティング秒

秒数。
AvatarModelHostingSeconds Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
アバター モデル トレーニング秒数

秒数。
AvatarModelTrainingSeconds Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
話者プロファイルの数

登録された話者プロファイルの数。 Prorated hourly.
NumberofSpeakerProfiles Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
話者認識トランザクション

話者認識トランザクションの数
SpeakerRecognitionTransactions Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
Speech モデルのホスティング時間

音声モデルのホスティング時間の数
SpeechModelHostingHours Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
Synthesized Characters

文字数。
SynthesizedCharacters Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
合成されたビデオ秒数

合成された秒数
VideoSecondsSynthesized Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
音声ライブ オーディオ入力トークン

キャッシュされたトークンを除くオーディオ入力トークンの数。
VoiceLiveAudioInputTokens Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
音声ライブ オーディオ出力トークン

オーディオ出力トークンの数。
VoiceLiveAudioOutputTokens Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
Voice Live Cached Audio Input Tokens

キャッシュされたオーディオ入力トークンの数。
VoiceLiveCachedAudioInputTokens Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
音声ライブ キャッシュ テキスト入力トークン

キャッシュされたテキスト入力トークンの数。
VoiceLiveCachedTextInputTokens Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
音声ライブ テキスト入力トークン

キャッシュされたトークンを除くテキスト入力トークンの数。
VoiceLiveTextInputTokens Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
音声ライブ テキスト出力トークン

テキスト出力トークンの数。
VoiceLiveTextOutputTokens Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
音声モデルのホスティング時間

時間数。
VoiceModelHostingHours Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
音声モデルのトレーニング時間 (分)

分数。
VoiceModelTrainingMinutes Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes

カテゴリ: Translator Services - 使用状況

Metric REST API の名前 Unit Aggregation Dimensions Time Grains DS Export
トレーニング済み文字 (非推奨)

トレーニングされた文字数の合計。
CharactersTrained Count Total (Sum) ApiNameOperationNameRegion PT1M Yes
翻訳された文字 (非推奨)

受信テキスト要求の合計文字数。
CharactersTranslated Count Total (Sum) ApiNameOperationNameRegion PT1M Yes
翻訳されたドキュメント文字

ドキュメント翻訳要求の文字数。
DocumentCharactersTranslated Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
翻訳されたカスタム文字をドキュメント化する

カスタム ドキュメント翻訳要求の文字数。
DocumentCustomCharactersTranslated Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
翻訳されたドキュメント同期文字

ドキュメント変換 (同期) 要求の文字数。
OneDocumentCharactersTranslated Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
翻訳されたドキュメント同期のカスタム文字

カスタム ドキュメント翻訳 (同期) 要求の文字数。
OneDocumentCustomCharactersTranslated Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
翻訳されたテキスト文字

受信テキスト翻訳要求の文字数。
TextCharactersTranslated Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
翻訳されたテキスト カスタム文字

受信したカスタム テキスト翻訳要求の文字数。
TextCustomCharactersTranslated Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
テキストトレーニング済み文字

テキスト翻訳を使用してトレーニングされた文字数。
TextTrainedCharacters Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
Translator Pro App Seconds

Translator Pro アプリの使用秒数。
TranslatorProAppSeconds Seconds Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes

Category: Usage

Metric REST API の名前 Unit Aggregation Dimensions Time Grains DS Export
Inference Count

カーネギー フロントドア サービスの推論数
CarnegieInferenceCount Count Total (Sum) RegionModalityCategoryLanguageSeverityLevelUseCustomList PT1M Yes
Computer Vision Transactions

Computer Vision トランザクションの数
ComputerVisionTransactions Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
Custom Vision トレーニング時間

Custom Vision トレーニング時間
CustomVisionTrainingTime Seconds Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
Custom Vision トランザクション

Custom Vision 予測トランザクションの数
CustomVisionTransactions Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
トレーニング済みの顔画像

トレーニングされたイメージの数。 トランザクションごとにトレーニングされた 1,000 個のイメージ。
FaceImagesTrained Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
Faces Stored

毎日日割りで保存された顔の数。 格納されている顔の数は毎日報告されます。
FacesStored Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
Face Transactions

Face サービスに対して行われた API 呼び出しの数
FaceTransactions Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
Images Stored

保存されている Custom Vision イメージの数。
ImagesStored Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
Learned Events

学習イベントの数。
LearnedEvents Count Total (Sum) IsMatchBaselineModeRunId PT1M Yes
LUIS Speech Requests

LUIS 音声から意図への理解要求の数
LUISSpeechRequests Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
LUIS テキスト要求

LUIS テキスト要求の数
LUISTextRequests Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
Matched Rewards

一致したリワードの数。
MatchedRewards Count Total (Sum) Mode, RunId PT1M Yes
非アクティブ化イベント

スキップされたイベントの数。
NonActivatedEvents Count Total (Sum) Mode, RunId PT1M Yes
Observed Rewards

観察された報酬の数。
ObservedRewards Count Total (Sum) Mode, RunId PT1M Yes
Processed Characters

Immersive Readerによって処理される文字数。
ProcessedCharacters Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
処理された正常性テキスト レコード

処理された正常性テキスト レコードの数
ProcessedHealthTextRecords Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
Processed Images

処理されたイメージの数
ProcessedImages Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
Processed Pages

処理されたページの数
ProcessedPages Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
処理されたテキスト レコード

テキスト レコードの数。
ProcessedTextRecords Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
QA テキスト レコード

処理されたテキスト レコードの数
QuestionAnsweringTextRecords Count Total (Sum) ApiNameFeatureNameUsageChannelRegion PT1M Yes
Speech Session Duration (非推奨)

音声セッションの合計時間 (秒)。
SpeechSessionDuration Seconds Total (Sum) ApiNameOperationNameRegion PT1M Yes
Total Events

イベントの数。
TotalEvents Count Total (Sum) Mode, RunId PT1M Yes
合計トランザクション数 (非推奨)

トランザクションの合計数。
TotalTransactions Count Total (Sum) <なし> PT1M Yes

Metric dimensions

メトリック ディメンションの詳細については、「 多次元メトリック」を参照してください。

このサービスには、メトリックに関連付けられた次のディメンションがあります。

  • ApiName
  • FeatureName
  • ModelDeploymentName
  • ModelName
  • ModelVersion
  • OperationName
  • Region
  • StatusCode
  • StreamType
  • UsageChannel

Resource logs

このセクションでは、このサービス用に収集できるリソース ログの種類を示します。 このセクションは、Azure Monitor でサポートされているリソース ログ カテゴリの種類の一覧から取得します。

Microsoftでサポートされているリソース ログ。CognitiveServices/accounts

Category カテゴリの表示名 Log table 基本的なログ プランをサポート インジェスト時間変換をサポート Example queries エクスポートするコスト
Audit Audit Logs AzureDiagnostics

複数のAzure リソースからのログ。

No No No
AzureOpenAIRequestUsage OpenAI 要求の使用状況のAzure AzureDiagnostics

複数のAzure リソースからのログ。

No No Yes
RequestResponse 要求ログと応答ログ AzureDiagnostics

複数のAzure リソースからのログ。

No No No
Trace Trace Logs AzureDiagnostics

複数のAzure リソースからのログ。

No No No

ログ テーブルのAzure Monitor

このセクションでは、このサービスに関連する Azure Monitor ログ テーブルの一覧を示します。このテーブルは、Kusto クエリを使用してLog Analyticsクエリに使用できます。 テーブルにはリソース ログ データが含まれています。場合によっては、収集され、それらにルーティングされる内容によって異なります。

Azure OpenAI microsoft.cognitiveservices/accounts

Activity log

リンク テーブルには、このサービスのアクティビティ ログに記録できる操作が一覧表示されます。 これらの操作は、 アクティビティ ログで使用可能なすべてのリソース プロバイダー操作のサブセットです。

アクティビティ ログ エントリのスキーマの詳細については、「 アクティビティ ログ スキーマ」を参照してください。