サービスのクォータと制限

[アーティクル]
09/26/2024

このコンテンツの適用対象: v4.0 (プレビュー) | 以前のバージョン: v3.1 (GA) v3.0 (GA)

このコンテンツの適用対象: v2.1 | 最新バージョン: v4.0 (プレビュー)

この記事には、すべての価格レベルの Azure AI Document Intelligence サービスのクォータと制限に関するクイックリファレンスと詳細な説明の両方が記載されています。また、要求のスロットリングを回避するためのベストプラクティスについても説明します。

モデルの使用法

サポートされているドキュメントの種類	既読	Layout	事前構築済みのモデル	カスタムモデル	アドオン機能
PDF	✔️	✔️	✔️	✔️	✔️
画像: `JPEG/JPG`, `PNG`, `BMP`, `TIFF`, `HEIF`	✔️	✔️	✔️	✔️	✔️
Microsoft Office: `DOCX`、`PPTX`、`XLS`	✔️	✔️	✖️	✖️	✖️

✔️ = サポート対象 ✖️ = サポート対象外

サポートされているドキュメントの種類	既読	Layout	事前構築済みのモデル	カスタムモデル
PDF	✔️	✔️	✔️	✔️
画像: `JPEG/JPG`, `PNG`, `BMP`, `TIFF`, `HEIF`	✔️	✔️	✔️	✔️
Microsoft Office: `DOCX`、`PPTX`、`XLS`	✔️	✖️	✖️	✖️

✔️ = サポート対象 ✖️ = サポート対象外

請求

Document Intelligence の課金は、モデルの種類と分析されたページ数に基づいて月単位で計算されます。 Azure portal のメトリックダッシュボードに使用状況メトリックがあります。このダッシュボードには、Azure AI Document Intelligence によって処理されるページ数が表示されます。 Azure 料金計算ツールを使用して、リソースに費やされた推定コストを確認できます。詳細な手順については、「使用量の確認とコストの見積もり」を参照してください。次に、いくつかの詳しい情報を記載します。

分析のためにドキュメントを送信すると、その要求で pages パラメーターを使用してページ範囲を指定しない限り、サービスではすべてのページを分析します。サービスで読み取り、OCR、またはレイアウトモデルを使用して Microsoft Excel および PowerPoint ドキュメントを分析する場合は、各 Excel ワークシートと PowerPoint スライドを 1 ページとしてカウントします。
サービスで PDF および TIFF ファイルを分析する場合は、PDF ファイル内の各ページまたは TIFF ファイル内の各画像を最大文字数の制限なしで 1 ページとしてカウントします。
サービスで読み取りおよびレイアウトモデルでサポートされている Microsoft Word および HTML ファイルを分析する場合は、ページをそれぞれ 3,000 文字のブロック単位でカウントします。たとえば、ドキュメントに 7,000 文字が含まれている場合は、それぞれ 3,000 文字を含む 2 ページと 1,000 文字を含む 1 ページの合計 3 ページになります。
読み取りモデルとレイアウトモデルでは、Microsoft Word、Excel、PowerPoint、および HTML ファイルの埋め込み画像またはリンクされた画像の分析はサポートされていません。そのため、サービスでは、それらを追加された画像としてカウントしません。
カスタムモデルのトレーニングは、Document Intelligence では常に無料です。サービスでモデルを使用してドキュメントを分析する場合にのみ課金されます。
コンテナーの価格は、クラウドサービスの価格と同じです。
Document Intelligence には、すべての Document Intelligence 機能をテストできる Free レベル (F0) が用意されています。
Document Intelligence には、大規模ワークロード用のコミットメントベースの価格モデルがあります。
レイアウトモデルは、カスタムトレーニング用のデータセットのラベルを生成するために必要です。カスタムトレーニングに使用するデータセットに使用可能なラベルファイルがない場合は、自動的に生成され、レイアウトモデルの使用に対して課金が行われます。

Quota	Free (F0)¹	Standard (S0)
1 秒あたりのトランザクション数の制限	1	15 (既定値)
調整可能	いいえ	はい ²
ドキュメントの最大サイズ	4 MB	500 MB
調整可能	いいえ	いいえ
ページの最大数 (分析)	2	2000
調整可能	いいえ	いいえ
ラベルファイルの最大サイズ	10 MB	10 MB
調整可能	いいえ	いいえ
OCR json 応答の最大サイズ	500 MB	500 MB
調整可能	いいえ	いいえ
テンプレートモデルの最大数	500	5000
調整可能	いいえ	いいえ
ニューラルモデルの最大数	100	500
調整可能	いいえ	いいえ

カスタムモデルの使用

Quota	Free (F0) ¹	Standard (S0)
Compose モデルの制限	5	500 (既定値)
調整可能	いいえ	いいえ
*トレーニングデータセットのサイズニューラルと生成**	1 GB ³	1 GB (既定値)
調整可能	いいえ	いいえ
*トレーニングデータセットサイズテンプレート**	50 MB ⁴	50 MB (既定値)
調整可能	いいえ	いいえ
*ページの最大数 (トレーニング) テンプレート**	500	500 (既定値)
調整可能	いいえ	いいえ
*ページの最大数 (トレーニング) ニューラルと生成**	50,000	50,000 (既定値)
調整可能	いいえ	いいえ
カスタムニューラルモデルのトレーニング	10 時間/月 ⁵	制限なし (時間単位の支払い)
調整可能	いいえ	はい ³
*ページの最大数 (トレーニング) 分類子**	10,000	10,000 (既定値)
調整可能	いいえ	いいえ
*ドキュメントの種類 (クラス) の最大数分類子**	500	500 (既定値)
調整可能	いいえ	いいえ
*トレーニングデータセットサイズ分類子**	1GB	2GB (既定値)
調整可能	いいえ	いいえ
*クラスあたりの最小サンプル数分類子**	5	5 (既定値)
調整可能	いいえ	いいえ

カスタムモデルの使用

Quota	Free (F0) ¹	Standard (S0)
Compose モデルの制限	5	200 (既定値)
調整可能	いいえ	いいえ
*トレーニングデータセットサイズニューラル**	1 GB ³	1 GB (既定値)
調整可能	いいえ	いいえ
*トレーニングデータセットサイズテンプレート**	50 MB ⁴	50 MB (既定値)
調整可能	いいえ	いいえ
*ページの最大数 (トレーニング) テンプレート**	500	500 (既定値)
調整可能	いいえ	いいえ
*ページの最大数 (トレーニング) ニューラル**	50,000	50,000 (既定値)
調整可能	いいえ	いいえ
カスタムニューラルモデルのトレーニング	1 か月あたり 10	1 か月あたり 20
調整可能	いいえ	はい ³
*ページの最大数 (トレーニング) 分類子**	10,000	10,000 (既定値)
調整可能	いいえ	いいえ
*ドキュメントの種類 (クラス) の最大数分類子**	500	500 (既定値)
調整可能	いいえ	いいえ
*トレーニングデータセットサイズ分類子**	1GB	1GB (既定値)
調整可能	いいえ	いいえ
*クラスあたりの最小サンプル数分類子**	5	5 (既定値)
調整可能	いいえ	いいえ

カスタムモデルの使用

Quota	Free (F0) ¹	Standard (S0)
Compose モデルの制限	5	200 (既定値)
調整可能	いいえ	いいえ
*トレーニングデータセットサイズニューラル**	1 GB ³	1 GB (既定値)
調整可能	いいえ	いいえ
*トレーニングデータセットサイズテンプレート**	50 MB ⁴	50 MB (既定値)
調整可能	いいえ	いいえ
*ページの最大数 (トレーニング) テンプレート**	500	500 (既定値)
調整可能	いいえ	いいえ
*ページの最大数 (トレーニング) ニューラル**	50,000	50,000 (既定値)
調整可能	いいえ	いいえ
カスタムニューラルモデルのトレーニング	1 か月あたり 10	1 か月あたり 20
調整可能	いいえ	はい ³
*ページの最大数 (トレーニング) 分類子**	10,000	10,000 (既定値)
調整可能	いいえ	いいえ
*ドキュメントの種類 (クラス) の最大数分類子**	500	500 (既定値)
調整可能	いいえ	いいえ
*トレーニングデータセットサイズ分類子**	1GB	1GB (既定値)
調整可能	いいえ	いいえ
*クラスあたりの最小サンプル数分類子**	5	5 (既定値)
調整可能	いいえ	いいえ

カスタムモデルの制限

Quota	Free (F0) ¹	Standard (S0)
Compose モデルの制限	5	200 (既定値)
調整可能	いいえ	いいえ
トレーニングデータセットサイズ	50 MB	50 MB (既定値)
調整可能	いいえ	いいえ
ページの最大数 (トレーニング)	500	500 (既定値)
調整可能	いいえ	いいえ

¹Free (F0) 価格レベルについては、価格ページで月額料金も参照してください。
²ベストプラクティスおよび調整手順を参照してください。
³ ニューラルモデルのトレーニング数は、暦月ごとにリセットされます。サポートリクエストを提出し、毎月のトレーニング制限を引き上げます。

⁴ この制限は、ラベル付け関連の更新の前にトレーニングデータセットフォルダー内で見つかるすべてのドキュメントに適用されます。

⁵ この制限は、v 4.0 (2024-07-31) カスタムニューラルモデルにのみ適用されます。 v 4.0以降、大規模なドキュメントのトレーニングがより長期間サポートされます (最大 10 時間無料。その後に料金が発生します)。詳細については、カスタムニューラルモデルのページを参照してください。

詳細な説明、クォータの調整、およびベストプラクティス

クォータの引き上げを要求する前に (該当する場合)、それが必要であることを確認します。 Document Intelligence サービスでは、自動スケーリングを用いて必要なコンピューティングリソース on-demand を提供し、顧客のコストを低く抑え、過剰なハードウェア容量を維持しないようにして未使用のリソースをプロビジョニング解除します。

アプリケーションから応答コード 429 ("要求が多すぎます") が返され、ワークロードが定義された制限内である場合、原因として最も可能性が高いのは、サービスが要求に対応するようにスケールアップされた一方で、必要なスケールに達していないということです。このため、サービスには、要求に対応するための十分なリソースがすぐには準備されません。この状態は一時的なものであり、長くは続かないはずです。

自動スケーリング時のスロットリングを緩和するための一般的なベストプラクティス

スロットリングに関連する問題 (応答コード 429) を最小限に抑えるには、次の手法を使用することをお勧めします。

アプリケーションで再試行ロジックを実装します。
ワークロードが急激に変化しないようにします。ワークロードは徐々に増やします
例。アプリケーションで Document Intelligence が使用されており、現在のワークロードは 10 TPS (1 秒あたりのトランザクション数) です。次の 1 秒間で、負荷を 40 TPS (4 倍以上) に増やしたとします。この新しい負荷に対応するため、サービスでは直ちにスケールアップが開始されますが、おそらく 1 秒以内に処理することはできないため、一部の要求では応答コード 429 が返されます。

次のセクションでは、クォータを調整する特定のケースについて説明します。 Document Intelligence: 同時要求の制限を引き上げる方法に移動

1 秒あたりのトランザクション数に関する要求の制限を引き上げる

既定では、1 秒あたりのトランザクション数は、Document Intelligence リソースに対して 1 秒あたり 15 トランザクションに制限されます。 Standard 価格レベルでは、この数を増やすことができます。要求を送信する前に、こちらのセクションの資料について理解していること、およびこれらのベストプラクティスを把握していることを確認してください。

同時要求の上限を上げても、コストに直接影響することはありません。 Document Intelligence サービスでは、"使用した分だけ支払う" モデルを使用しています。この制限によって、要求のスロットリングが開始される前に、サービスをどの程度スケーリングできるかが定義されます。

同時要求の上限パラメーターの既存の値は、Azure portal、コマンドラインツール、または API 要求では表示されません。既存の値を確認するには、Azure サポートリクエストを作成します。

1 秒あたりのトランザクション数を増やす場合は、リソースの自動スケーリングを有効にすることができます。このドキュメントに従って、リソースの自動スケーリングを有効にします * 自動スケーリングを有効にする。 TPS の増加サポート要求を送信することもできます。

以下の必要な情報を準備します

Document Intelligence リソース ID
リージョン
基本モデル情報:
- Azure ポータル
- トランザクションの上限を引き上げる Document Intelligence リソースを選択します
- [プロパティ] ([リソース管理] グループ) を選択します
- 次のフィールドの値をコピーして保存しておきます。
  - リソース ID
  - 場所 (エンドポイントのリージョン)

サポートリクエストの作成と送信

サポートリクエストを送信して、リソースの 1 秒あたりのトランザクション数 (TPS) の制限を引き上げる手順を開始します。

必要な情報があることを確認します
Azure ポータル
TPS の上限を引き上げる Document Intelligence リソースを選択します
[新しいサポートリクエスト] ([サポート + トラブルシューティング] グループ) を選択します。 Azure サブスクリプションと Azure リソースに関する情報が自動的に入力された新しいウィンドウが表示されます
[概要] を入力します (「Document Intelligence TPS の上限を引き上げる」など)
問題の種類フィールドに [クォータまたは使用状況の検証] を選択します。
[次へ: ソリューション] を選択します。
要求の作成を進めます
[詳細] フィールドで、[説明] フィールドに次の情報を入力します。
- 要求が Document Intelligence クォータに関するものであることを示すメモ。
- TPS に関して希望するスケーリングの目標値を指定
- 収集した Azure リソース情報
- 必要な情報を入力して、[確認と作成] タブの [作成] ボタンを選択します。
- Azure portal 通知のサポートリクエスト番号をメモしておきます。 [サポート] を探して、この後の処理について確認します。

ワークロードパターンの例のベストプラクティス

この例では、自動スケーリングが進行中であることによって発生する可能性がある要求のスロットリングを軽減するために、次のようなアプローチを推奨しています。これは「正確なレシピ」ではなく、必要に応じて従い、調整するテンプレートにすぎません。

Document Intelligence リソースに既定の制限が設定されているとします。ワークロードを開始して、分析要求を送信します。応答コード 429 で頻繁にスロットリングが発生している場合、まず、GET 分析応答リクエストでエクスポネンシャルバックオフを実装します。連続するエラー応答の再試行間で待機時間を徐々に長くします。たとえば、リクエスト間の遅延パターンを 2-5-13-34 にします。一般に、対応する POST 要求に対して 2 秒に 1 回以上応答分析取得を呼び出さないことをお勧めします。

送信されるドキュメントの POST 要求の数が調整されていることがわかった場合は、要求間に遅延を追加することを検討してください。ワークロードでより高度な同時処理が必要な場合は、サポートリクエストを作成して、1 秒あたりのトランザクションのサービス制限を引き上げる必要があります。

一般に、運用環境に移行する前にワークロードとワークロードパターンをテストしておくことをお勧めします。

次のステップ

エラーコードとトラブルシューティングについて学習する

次の方法で共有

サービスのクォータと制限

モデルの使用法

請求

カスタムモデルの使用

カスタムモデルの使用

カスタムモデルの使用

カスタムモデルの制限

詳細な説明、クォータの調整、およびベストプラクティス

自動スケーリング時のスロットリングを緩和するための一般的なベストプラクティス

1 秒あたりのトランザクション数に関する要求の制限を引き上げる

以下の必要な情報を準備します

サポートリクエストの作成と送信

ワークロードパターンの例のベストプラクティス

次のステップ

フィードバック

その他のリソース

次の方法で共有

サービスのクォータと制限

モデルの使用法

請求

カスタム モデルの使用

カスタム モデルの使用

カスタム モデルの使用

カスタム モデルの制限

詳細な説明、クォータの調整、およびベスト プラクティス

自動スケーリング時のスロットリングを緩和するための一般的なベスト プラクティス

1 秒あたりのトランザクション数に関する要求の制限を引き上げる

以下の必要な情報を準備します

サポート リクエストの作成と送信

ワークロード パターンの例のベスト プラクティス

次のステップ

フィードバック

その他のリソース

カスタムモデルの使用

カスタムモデルの使用

カスタムモデルの使用

カスタムモデルの制限

詳細な説明、クォータの調整、およびベストプラクティス

自動スケーリング時のスロットリングを緩和するための一般的なベストプラクティス

サポートリクエストの作成と送信

ワークロードパターンの例のベストプラクティス