Azure AI Document Intelligence に関する FAQ

このコンテンツは、checkmarkv4.0 (プレビュー)checkmarkv3.1 (GA)checkmarkv3.0 (GA)checkmarkv2.1 (GA) に適用されます

一般的な概念

Azure AI Document Intelligence とは何であり、Azure AI Form Recognizer はどうなったのですか?

Azure AI Document Intelligence は、機械学習モデルを使用してドキュメントからキーと値のペア、テキスト、テーブルを抽出するクラウド ベースのサービスです。 返される結果は、構造化された JSON 出力です。 Document Intelligence のユース ケースには、自動データ処理、強化されたデータ ドリブン戦略、エンリッチされたドキュメント検索機能が含まれます。

Document Intelligence は Azure AI サービスの一部です。 Azure AI サービスには、以前 Azure Cognitive Services および Azure Applied AI Services と呼ばれていたものすべてが含まれています。

Document Intelligence の以前の名前は Azure AI Form Recognizer でした。 Form Recognizer は、2023 年 7 月に正式に Document Intelligence になりました。

価格に変更はありません。 Cognitive Services と Applied AI Services の名前は、引き続き Azure の課金、コスト分析、価格表、価格 API で使用されます。

API またはクライアント ライブラリ (SDK) への破壊的変更はありません。 REST API と SDK バージョン 2024-02-29-preview、2023-10-31-preview 以降は document intelligence と名前が変更されます。

一部のプラットフォームでは、まだ名前が更新されていません。 Microsoft のドキュメントでは、Form Recognizer と Document Intelligence のすべてのメンションが同じ Azure サービスを参照します。

Document Intelligence はドキュメント生成 AI とどのように関連していますか?

ドキュメント生成 AI ソリューションを使用すると、ドキュメントでチャットしたり、これらのドキュメントから魅力的なコンテンツを生成したり、データ上の Azure OpenAI Service モデルにアクセスしたりできます。 Azure AI Document Intelligence と Azure OpenAI を組み合わせると、自然言語を使用してドキュメントをシームレスに操作したり、回答を簡単に見つけて貴重な分析情報を入手したり、既存のドキュメントから新しい魅力的なコンテンツを生成したりするエンタープライズ アプリケーションを構築できます。 詳細については、技術コミュニティのブログを参照してください。

Document Intelligence は取得拡張生成とどのように関連していますか?

セマンティック チャンキングは、取得拡張生成 (RAG) の効率的な格納と取得を確保するための重要な手順です。 Document Intelligence のレイアウト モデルによって、高度なコンテンツ抽出とドキュメント構造分析の機能のための包括的なソリューションが提供されます。

レイアウト モデルを使用すると、任意の分割ではなくセマンティック コンテンツに基づいて、大きなテキスト本文をより小さな意味のあるチャンクに分割するためのテキストと構造の要素を簡単に抽出できます。 その後、提供された構成要素に基づいてセマンティック チャンキング戦略を定義できるように、抽出された情報をマークダウン形式に簡単に出力できます。 詳細については、Document Intelligence の RAG の概要に関するページを参照してください。

特別な考慮が必要な Document Intelligence のユース ケース

財務データ、保護された健康データ、個人データ、または機密性の高いデータを扱うドキュメント処理プロジェクトには慎重な検討が必要です。

すべての国/地域の要件および業界固有の要件に必ず従うようにしてください。

Document Intelligence でサポートされる言語

Document Intelligence のディープ ラーニング ベースのユニバーサル モデルでは、画像やドキュメント (言語が混在しているテキスト行を含む) から多言語テキストを抽出できる多くの言語がサポートされています。

言語サポートは、Document Intelligence サービスの機能によって異なります。 Document Intelligence でサポートできる手書きのテキストと印刷されたテキストの完全な一覧については、言語サポートに関するページを参照してください。

自分の Azure リージョンで Document Intelligence を利用できますか?

Document Intelligence は、60 以上の Azure グローバル インフラストラクチャ リージョンの多くで一般提供されています。

お客様とその顧客に最適なリージョンを選択してください。

Document Intelligence は他の Microsoft サービスと統合されますか?

はい。Document Intelligence は、次のサービスと統合されています。

Document Intelligence は光学式文字認識とどのように関連していますか?

Document Intelligence は、Azure AI サービスの光学式文字認識 (OCR)、テキスト分析、カスタム テキスト分類が組み込まれているクラウド ベースのサービスです。

Document Intelligence では、テキスト抽出により多くの構造と情報を提供するために、OCR を使用して、AI でサポートされている活字と手書きのテキスト ドキュメントから情報を検出して抽出します。

カスタム モデルを使用できる期間はどれくらいですか?

モデルのライフサイクルは、そのトレーニングのために使用する API バージョンと同じです。 一般提供 (GA) バージョンの API でトレーニングされたカスタム モデルのライフサイクルは、その API バージョンと同じです。 API バージョンが非推奨になると、モデルは推論に使用できなくなります。 また、プレビュー バージョンの API でトレーニングされたモデルのライフサイクルも、そのプレビュー API と同じです。

プレビュー API は、更新されたプレビュー API バージョンまたはより新しい GA API バージョンから 3 か月以内に非推奨となることが予測されます。

正確性スコアとはどのようなものであり、どのように計算されますか?

build (v3.0 以降のバージョン) または train (v2.1) のカスタム モデル操作の出力には、正確性スコアの推定値が含まれます。 このスコアは、視覚的に類似したドキュメント上のラベル付けされた値を正確に予測するモデルの能力を表します。

正確性は、0% (低) から 100% (高) までのパーセンテージ値の範囲内で測定されます。

詳細については、正確性スコアと信頼度スコアに関するページを参照してください。

正確性スコアを向上させるにはどうすればよいですか?

ドキュメントの視覚的構造の差異が、モデルの正確性に影響を与える場合があります。 いくつかのヒントを次に示します。

  • トレーニング データセットにドキュメントのすべての差異を含めます。 差異には形式の違い (デジタル PDF とスキャンされた PDF など) が含まれます。

  • 視覚的な違いが明らかである種類ごとにドキュメントを分離し、さまざまなモデルをトレーニングします。

  • 余分なラベルがないことを確認します。

  • 署名と領域のラベル付けに関しては、周囲のテキストを含めないでください。

詳細については、正確性スコアと信頼度スコアに関するページを参照してください。

信頼度スコアとはどのようなものであり、どのように計算されますか?

信頼度スコアは、抽出された結果が正しく検出されているという統計的確実性の度合いを測定して、確率を示しています。

信頼度値の範囲は、0% (低) から 100% (高) までのパーセンテージです。 最も良いのは、80% 以上のスコアを目標にすることです。 より機密性の高いケース (財務や医療の記録など) では、100% に近いスコアをお勧めします。 また、人間によるレビューを要求することもできます。

詳細については、正確性スコアと信頼度スコアに関するページを参照してください。

信頼度スコアを上げるにはどうすればよいですか?

分析操作の後に、JSON 出力を確認します。 pageResults ノードの下で、キーと値形式の結果ごとに confidence 値を調べます。 また、readResults ノード内の信頼度スコアにも注目してください。こちらはテキスト読み取り操作に対応します。 読み取り結果の信頼度は、キーと値の抽出結果の信頼度には影響しません。したがって両方を確認する必要があります。 いくつかのヒントを次に示します。

  • readResults オブジェクトの信頼度スコアが低い場合は、入力ドキュメントの品質を改善します。

  • pageResults オブジェクトの信頼度スコアが低い場合は、分析しているドキュメントが同じ種類であることを確認します。

  • 人間によるレビューをワークフローに組み込むことを検討します。

  • 各フィールド内の値が異なるフォームを使用します。

  • カスタム モデルの場合は、トレーニング ドキュメントのより大きなセットを使用します。 より多くのドキュメントにタグを付けると、モデルによるフィールド認識の正確性が向上します。

詳細については、正確性スコアと信頼度スコアに関するページを参照してください。

境界ボックスとは何ですか?

境界ボックス (v3.0 以降のバージョンでは polygon) は、ドキュメントまたはフォーム内のテキスト要素を囲む抽象的な四角形です。 オブジェクト検出のための基準点として使用されます。

境界ボックスでは、4 つの数値ペアの配列で表される xy 座標平面を使用して位置を指定します。 各ペアが、左上、右上、右下、左下の順序でこのボックスの角を表します。

画像の場合、座標はピクセル単位です。 PDF の場合、座標はインチ単位です。

Document Intelligence は、ドキュメントの分類に役立ちますか?

Document Intelligence には、単一ファイルまたは複数ファイル ドキュメントを分析して、トレーニングされたドキュメントの種類のいずれかが入力ファイルに含まれているかどうかを識別できるカスタム分類モデルが用意されています。 このサービスでは、次のシナリオがサポートされています。

  • 1 つのドキュメントの種類が含まれている 1 つのファイル (ローン申請フォームなど)。

  • 複数のドキュメントが含まれている 1 つのファイル。 この例には、ローン申請フォーム、給与明細、銀行取引明細書が含まれているローン申請パッケージがあります。

  • 同じドキュメントの複数のインスタンスが含まれている 1 つのファイル。 この例には、スキャンされた請求書のコレクションがあります。

詳細については、カスタム分類モデルの概要を参照してください。

アプリ開発

Document Intelligence には、どのような開発オプションがありますか?

Document Intelligence は、次のプラットフォーム内で最新の開発オプションを提供します。

最新のプログラミング言語 SDK でサポートされている API バージョンはどこで確認できますか?

次の表に、最新の SDK バージョンへのリンクを提供し、サポートされている Document Intelligence SDK と API バージョンの関係を示します。

サポートされている言語の Azure SDK リファレンス サポートされる API バージョン
• C#/.NET: 4.0.0

• Java: 4.0.0

• JavaScript: 4.0.0

• Python 3.2.0
2023-10-31-preview
v3.0
v2.1
v2.0

詳細については、v4.0 でサポートされているクライアントおよび v3.1 でサポートされているクライアントを参照してください。

Document Intelligence v3.0 と v2.1 の違いは何であり、最新バージョンに移行するにはどうすればよいですか?

ユーザビリティを向上させるために、Document Intelligence v3.0 では、完全に再設計されたクライアント ライブラリが導入されています。 最新の Document Intelligence API 機能を正常に使用するには、最新の SDK が必要であり、新しいクライアントを使用するようにアプリケーション コードを更新する必要があります。

次の表に、最新バージョンの Document Intelligence に移行するための詳細な手順へのリンクを示します。

言語/API 移行ガイド
REST API v3
C#/.NET 4.0.0
Java 4.0.0
JavaScript 4.0.0
Python 3.2.0

Document Intelligence はどのファイル形式をサポートしますか? 入力ドキュメントにはサイズの制限がありますか?

最高の結果を得るには、入力の要件を参照してください。

ドキュメント内で分析するページの範囲を指定するにはどうすればよいですか?

複数ページの PDF および TIFF ドキュメントのページを指定するには、pages パラメーター (REST API の v2.1、v3.0 以降のバージョンでサポートされています) を使用します。 受け入れられる入力には、次の範囲が含まれます。

  • 単一ページ。 たとえば、1, 2 を指定した場合は、ページ 1 と 2 が処理されます。
  • 有限の範囲。 たとえば、2-5 を指定した場合は、ページ 2 から 5 が処理されます。
  • オープンエンドの範囲。 たとえば、5- を指定した場合は、ページ 5 からのすべてのページが処理されます。 -10 を指定した場合は、ページ 1 から 10 が処理されます。

これらのパラメーターは混在させることができ、範囲も重複させることができます。 たとえば、-5, 1, 3, 5-10 を指定した場合は、ページ 1 から 10 が処理されます。

サービスは、ドキュメントの少なくとも 1 ページが処理できる場合、要求を受け入れます。 たとえば、5 ページのドキュメントでの 5-100 の使用は有効な入力です。つまり、ページ 5 が処理されます。

ページ範囲を指定しない場合は、ドキュメント全体が処理されます。

Document Intelligence Studio と FOTT サンプル ラベル付けツールの両方を使用できます。 使用する方法の選択

ほとんどの場合は、Document Intelligence Studio をお勧めします。これにより、Document Intelligence リソースやストレージ サービスを構成するための時間を短縮できるためです。

次のシナリオの場合は、フォーム OCR テスト ツール (FOTT) の使用を検討してください。

サービスの制限と価格

Azure では Document Intelligence を使用するための価格をどのように計算しますか?

Document Intelligence の課金は、モデルの種類と分析されたページ数に基づいて月単位で計算されます。 次に、いくつかの詳しい情報を記載します。

  • 分析のためにドキュメントを送信すると、その要求で pages パラメーターを使用してページ範囲を指定しない限り、サービスではすべてのページを分析します。 サービスで読み取り、OCR、またはレイアウト モデルを使用して Microsoft Excel および PowerPoint ドキュメントを分析する場合は、各 Excel ワークシートと PowerPoint スライドを 1 ページとしてカウントします。

  • サービスで PDF および TIFF ファイルを分析する場合は、PDF ファイル内の各ページまたは TIFF ファイル内の各画像を最大文字数の制限なしで 1 ページとしてカウントします。

  • サービスで読み取りおよびレイアウト モデルでサポートされている Microsoft Word および HTML ファイルを分析する場合は、ページをそれぞれ 3,000 文字のブロック単位でカウントします。 たとえば、ドキュメントに 7,000 文字が含まれている場合は、それぞれ 3,000 文字を含む 2 ページと 1,000 文字を含む 1 ページの合計 3 ページになります。

  • 読み取りまたはレイアウト モデルを使用して Microsoft Word、Excel、PowerPoint、HTML の各ファイルを分析する場合、埋め込み画像やリンクされた画像はサポートされません。 そのため、サービスでは、それらを追加された画像としてカウントしません。

  • カスタム モデルのトレーニングは、Document Intelligence では常に無料です。 サービスでモデルを使用してドキュメントを分析する場合にのみ課金されます。

  • コンテナーの価格は、クラウド サービスの価格と同じです。

  • Document Intelligence には、すべての Document Intelligence 機能をテストできる Free レベル (F0) が用意されています。

  • Document Intelligence には、大規模ワークロード用のコミットメントベースの価格モデルがあります。

詳細については、Azure AI Document Intelligence の価格オプションを参照してください。

Document Intelligence の使用状況を調べて価格を推測するにはどうすればよいですか?

Azure portal のメトリック ダッシュボードに使用状況メトリックがあります。 このダッシュボードには、Azure AI Document Intelligence によって処理されるページ数が表示されます。 Azure 料金計算ツールを使用して、リソースに費やされた推定コストを確認できます。 詳細な手順については、「使用量の確認とコストの見積もり」を参照してください。

調整を軽減するためのベスト プラクティスはどのようなものですか?

Document Intelligence では、自動スケーリングを使用して、お客様のコストを低く維持しながら必要なコンピューティング リソースをオンデマンドで提供します。 自動スケール中のスロットリングを軽減するために、次の方法をお勧めします。

  • アプリケーションで再試行ロジックを実装します。

  • POST 要求の数で調整されていることがわかった場合は、要求の間に遅延を追加することを検討してください。

  • ワークロードは徐々に増やします。 急激に変化しないようにします。

  • 1 秒あたりのトランザクション数 (TPS) の制限を増やすためのサポート リクエストを作成します。

Document Intelligence のサービスのクォータと制限について説明します。

ドキュメントの分析にはどのくらいの時間がかかりますか?

ドキュメントの分析にかかる時間は、サイズ(例えばページ数)や各ページの関連コンテンツによって異なります。

Document Intelligence は、類似したドキュメントの待ち時間が同等であるが、必ずしも同じとは限らないマルチテナント サービスです。 待機時間は、API サーバーが受信要求を処理し、クライアントに送信応答を配信するためにかかる時間です。 待ち時間やパフォーマンスにおける不定期の変動は、画像や大きなドキュメントを大規模に処理するマイクロサービス ベースのステートレスなすべての非同期サービスに固有のものです。

Microsoft では、ハードウェア、容量、スケーリング機能を継続的にスケールアップしていますが、実行時に待ち時間の問題が発生する可能性は依然として存在します。

カスタム モデル

最高のトレーニング データを構築するにはどうすればよいですか?

Document Intelligence のカスタム モデルを使用するときは、ユーザーが独自のトレーニング データを提供します。 モデルを効果的にトレーニングするためのヒントを、いくつか次に示します。

  • 可能な場合は、画像ベースではなくテキストベースの PDF を使用します。 画像ベースの PDF を識別する 1 つの方法は、ドキュメント内の特定のテキストを選択してみることです。 テキストの画像全体しか選択できない場合、そのドキュメントはテキスト ベースではなく、画像ベースです。

  • 形式 (JPEG/JPG、PNG、BMP、PDF、または TIFF) 別のサブフォルダーを使用してトレーニング ドキュメントを整理します。

  • 使用可能なフィールドがすべて入力済みのフォームを使用します。

  • 各フィールドに異なる値が含まれたフォームを使用します。

  • 画像の品質が低い場合は、より大きなデータセット (6 つ以上のトレーニング ドキュメント) を使用します。

トレーニング データセットの構築に関する詳細を確認してください。

きわめて正確なカスタム モデルをトレーニングするためのベスト プラクティスはどのようなものですか?

モデルの正確性のレベルは、トレーニング資料の品質に依存します。 いくつかのヒントを次に示します。

  • 1 つのモデルを使用する必要があるか、複数のモデルから作成された 1 つのモデルを使用する必要があるかを判断します。

  • 1 つのモデルで複数の形式を分析しようとすると、モデルの正確性が低下する可能性があります。 データセットをフォルダーに分割することを計画します。その場合、各フォルダーが固有のテンプレートになります。 フォルダーごとに 1 つのモデルをトレーニングし、結果として得られたモデルから 1 つのエンドポイントを作成します。

  • カスタム フォームは、一貫性のあるビジュアル テンプレートに依存しています。 フォームに形式や改ページのバリエーションがある場合、データセットをセグメント化して複数のモデルをトレーニングすることを検討してください。

  • 形式、ドキュメントの種類、構造を考慮して、バランスの取れたデータセットになっていることを確認します。

作成済みモデルの詳細を確認してください。

カスタム モデルを再トレーニングできますか?

Document Intelligence に明示的な再トレーニング操作はありません。 トレーニング操作のたびに新しいモデルが生成されます。

モデルに再トレーニングが必要なことがわかった場合は、トレーニング データセットにさらに多くのサンプルを追加し、新しいモデルをトレーニングします。

いくつのカスタム モデルから 1 つのカスタム モデルを作成できますか?

[モデルの作成] 操作では、200 個までのモデルを 1 つのモデル ID に割り当てることができます。 作成されたモデル ID を使用して Analyze Document 要求を実行すると、Document Intelligence では、送信されたフォームを分類し、最適なモデルを選択して結果を返します。 [モデルの作成] は現在、ラベルを使用してトレーニングするカスタム モデルでのみ使用できます。

作成済みモデルを使用したドキュメントの分析は、1 つのモデルを使用したドキュメントの分析と同じです。 Analyze Document の結果では、ドキュメントを分析するためにどちらのコンポーネント モデルを選択したかを示す docType プロパティが返されます。 個々のカスタム モデルまたは作成されたカスタム モデルを使用してドキュメントを分析するための価格に変更はありません。

作成済みモデルの詳細を確認してください。

作成したいモデルの数が作成済みモデルの上限を超えている場合は、どのような代替手段がありますか?

次の代替手段のいずれかを使用できます。

初期トレーニングからさらにモデルを洗練するにはどうすればよいですか?

各トレーニング操作によって新しいモデルが生成されます。

  1. 新しいテンプレートのためのデータセットを作成します。

  2. 新しいモデルのラベル付けとトレーニングを行います。

  3. 特定のドキュメントの種類に対して新しいモデルのパフォーマンスが良好であることを検証します。

  4. この新しいモデルと既存のモデルから、1 つのエンドポイントを作成します。 これで、Document Intelligence が、分析する各ドキュメントに最適なモデルを決定できます。

作成済みモデルの詳細を確認してください。

カスタム モデルを構築しています。 署名検出ラベルでは何が返されますか?

署名検出では、ドキュメントに署名した人物の ID ではなく、署名の存在を探します。

モデルが署名検出に対して未署名を返した場合、そのモデルでは、定義されたフィールドに署名が見つかりませんでした。

ドキュメントからテーブルを抽出するために考慮すべきことは何ですか? また、そのベスト プラクティスはどのようなものですか?

Document Intelligence のレイアウト モデルを出発点に、ドキュメントや画像からテキスト、テーブル、選択マーク、構造情報を抽出できます。 次の要因を考慮することもできます。

  • 抽出するデータはテーブルとして表されていますか? また、テーブル構造には意味がありますか?

  • データがテーブル形式でない場合、そのデータは 2 次元グリッドに収まりますか?

  • テーブルは複数のページにまたがっていますか? その場合は、すべてのページにラベルを付けなくても済むように、PDF を Document Intelligence に送信する前にページに分割します。 分析の後に、そのページを 1 つのテーブルに後処理します。

  • カスタム モデルを作成している場合は、「テーブルとしてのラベル付け」を参照してください。 動的テーブルには、列ごとに可変数の行があります。 固定テーブルには、列ごとに一定数の行があります。

トレーニング済みのモデルを、ある環境(ベータ版など)から別の環境(本番環境など)に移動するには、どうすればよいのでしょうか?

カスタム モデルをある Document Intelligence アカウントから、サポートされているいずれかの地理的リージョンに存在する他のアカウントにコピーするには、コピー API を使用できます。 詳細な手順については、「ディザスター リカバリー」を参照してください。

このコピー操作は、そのモデルをトレーニングした特定のクラウド環境内でのモデルのコピーに制限されます。 たとえば、パブリック クラウドから Azure Government クラウドへのモデルのコピーはサポートされていません。

カスタム トレーニングを実行したときにレイアウトに対して課金されたのはなぜですか?

レイアウトは、データセットのラベルを生成するために必要です。 カスタム トレーニングに使用するデータセットに使用可能なラベル ファイルがない場合は、サービスによって自動的に生成されます。

ストレージ アカウント

数日前はストレージ アカウントにアクセスできました。 現在、再接続しようとして問題が発生していますが、それはなぜですか?

共有アクセス署名を作成する場合、既定の期間は 48 時間です。 48 時間後に、新しいトークンを作成する必要があります。

Document Intelligence でストレージ アカウントを使用している時間に対してより長い期間を設定することを検討してください。

ストレージ アカウントが仮想ネットワークまたはファイアウォールの背後に位置する場合、Document Intelligence にデータへのアクセス権を付与するにはどうすればよいですか?

Azure ストレージ アカウントが仮想ネットワークまたはファイアウォールによって保護されている場合は、Document Intelligence からそのストレージ アカウントに直接アクセスできません。 ただし、プライベート Azure ストレージ アカウントのアクセスと認証では、Azure リソース用マネージド IDがサポートされます。 マネージド ID を使用している場合、Document Intelligence サービスでは、割り当てられている資格情報を使用してストレージ アカウントにアクセスできます。

FOTT を使用してプライベート ストレージ アカウント データを分析しようとする場合は、仮想ネットワークまたはファイアウォールの背後にツールをデプロイする必要があります。

Document Intelligence リソース用のマネージド ID を作成して使用する方法を説明します。

Document Intelligence Studio

Document Intelligence Studio にアクセスするにはどのようなアクセス許可が必要ですか?

Document Intelligence Studio にアクセスするには、少なくとも閲覧者ロールを持つアクティブな Azure アカウントとサブスクリプションが必要です。

ドキュメント分析および事前構築済みモデルの場合のユーザー シナリオのためのロール要件を次に示します。

  • 基本

  • 上級

    • 共同作成者: リソース グループまたは Document Intelligence リソースを作成するには、このロールが必要です。 共同作成者ロールでは、Cognitive Services のキーを一覧表示できません。 Document Intelligence Studio を使用するには、Cognitive Services ユーザー ロールが引き続き必要です。

カスタム モデル プロジェクトの場合のユーザー シナリオのためのロール要件を次に示します。

  • 基本

    • Cognitive Services ユーザー: Document Intelligence または Cognitive Services マルチサービス リソースでカスタム モデルをトレーニングしたり、トレーニング済みモデルを使用して分析したりするには、このロールが必要です。

    • ストレージ BLOB データ共同作成者: ストレージ アカウントでプロジェクトおよびラベル データを作成するには、このロールが必要です。

  • 上級

    • ストレージ アカウント共同作成者: ストレージ アカウントでクロス オリジン リソース共有 (CORS) 設定を設定するには、このロールが必要です。 同じストレージ アカウントを再利用する場合、これは 1 回限りの作業です。

      共同作成者ロールでは、BLOB 内のデータにアクセスできません。 Document Intelligence Studio を使用するには、ストレージ BLOB データ共同作成者ロールが引き続き必要です。

    • 共同作成者: リソース グループとリソースを作成するには、このロールが必要です。 共同作成者ロールでは、作成されたリソースまたはストレージを使用するためのアクセス権は付与されません。 Document Intelligence Studio を使用するには、基本的なロールが引き続き必要です。

詳細については、Microsoft Entra 組み込みロールに関するページ、および Document Intelligence Studio クイックスタートの Azure ロールの割り当てに関するセクションを参照してください。

1 つのドキュメント内に複数のページがあります。 Document Intelligence Studio で 2 ページしか分析されないのはなぜですか?

Free レベル (F0) のリソースの場合は、Document Intelligence Studio、REST API、SDK のいずれを使用しているかにかかわらず、最初の 2 ページだけが分析されます。

Document Intelligence Studio で、[設定] (歯車) ボタンを選択し、[リソース] タブを選択して、ドキュメントを分析するために使用している価格レベルを確認します。 ドキュメント内のすべてのページを分析する場合は、有料の (S0) リソースに変更してください。

Document Intelligence Studio でディレクトリまたはサブスクリプションを変更するにはどうすればよいですか?

Document Intelligence Studio でディレクトリを変更するには、[設定] (歯車) ボタンを選択します。 [ディレクトリ] で、一覧からディレクトリを選択してから [ディレクトリの切り替え] を選択します。 ディレクトリを切り替えた後、もう一度サインインするよう求められます。

サブスクリプションまたはリソースを変更するには、[設定] の下にある [リソース] タブに移動します。

ストレージ アカウント リソースがファイアウォールまたは仮想ネットワークと共に構成されている場合、プロジェクト共有、自動ラベル付け、または OCR アップグレード操作でストレージ エラーが発生するのはなぜですか?

Azure リソースを設定するには、「Document Intelligence のマネージド ID」を参照してください。

Document Intelligence リソースがファイアウォールまたは仮想ネットワークと共に構成されている場合、自動ラベル付けまたは OCR アップグレード操作で "仮想ネットワーク/ファイアウォール規則が原因でアクセスが拒否されました" というエラーが発生するのはなぜですか?

Document Intelligence リソースのファイアウォール許可リストに専用の IP アドレス 20.3.165.95 を追加する必要があります。

Document Intelligence Studio のラベル付けエクスペリエンスを再利用またはカスタマイズし、それを独自のアプリケーション内に構築できますか?

はい。 Document Intelligence Studio のラベル付けエクスペリエンスは、Toolkit リポジトリでオープン ソース化されています。

カスタム プロジェクトを開いたときに "Form Recognizer が見つかりません" というエラーが発生するのはなぜですか?

このカスタム プロジェクトにバインドされている Document Intelligence リソースは削除されたか、または別のリソース グループに移動されました。 この問題を解決するには、次の 2 つの方法があります。

  • 同じサブスクリプションとリソース グループのもとに、同じ名前を持つ Document Intelligence リソースを再作成します。

  • 移行された Document Intelligence リソースを使用してカスタム プロジェクトを再作成し、同じストレージ アカウントを指定してください。

Containers

Document Intelligence コンテナーを使用するにはインターネット接続が必要ですか?

はい。 Document Intelligence コンテナーには、課金情報を Azure に送信するためのインターネット接続が必要です。 Azure コンテナーのセキュリティの詳細を確認してください。

切断されたコンテナーと接続されたコンテナーの違いは何ですか?

接続されたコンテナーは、Azure アカウント上の Document Intelligence リソースを使用して課金情報を Azure に送信します。 接続されたコンテナーでは、課金情報を Azure に送信するためにインターネット接続が必要です。

切断されたコンテナーを使用すると、インターネットから切断された API を使用できます。 課金情報は、インターネット経由で送信されません。 代わりに、購入されているコミットメント レベルに基づいて課金されます。 現在、切断されたコンテナーの使用は、Document Intelligence のカスタムと請求書のモデルで利用できます。

接続されたコンテナーと切断されたコンテナーで提供されるモデル機能は同じであり、Document Intelligence v2.1 によってサポートされます。

接続されたコンテナーはクラウドにどのようなデータを送信しますか?

Document Intelligence に接続されたコンテナーは、Azure アカウントの Document Intelligence リソースを使用して Azure に課金情報を送信します。 接続されたコンテナーによって、お客様のデータ (解析対象の画像やテキストなど) が Microsoft に送信されることはありません。

接続されたコンテナーが課金のために Microsoft に送信する情報の例については、Azure AI コンテナーに関する FAQ を参照してください。

"コンテナーが有効な状態ではありません。 'OutOfQuota' API キーの状態がクォータ不足でサブスクリプションの検証に失敗しました"というエラーが発生するのはなぜですか?

Document Intelligence に接続されたコンテナーは、Azure アカウントの Document Intelligence リソースを使用して Azure に課金情報を送信します。 このメッセージは、コンテナーが課金エンドポイントと通信できない場合に表示される可能性があります。

Document Intelligence サンプル ラベル付けツール (FOTT) のコンテナーにローカル ストレージを使用できますか?

FOTT には、ローカル ストレージを使うバージョンがあります。 このバージョンは、Windows コンピューターにインストールする必要があります。 この場所からそれをインストールできます。

ラベル付けファイルがサブディレクトリにある場合は、プロジェクト ページで、ラベル フォルダーの URI を /shared または /shared/sub-dir として指定します。 Document Intelligence サンプル ラベル付けツールのその他の動作はすべて、ホストされているサービスと同じです。

スケールアップのベスト プラクティスはどのようなものですか?

非同期呼び出しの場合は、共有ストレージを使用して複数のコンテナーを実行できます。 POST 分析呼び出しを処理しているコンテナーは、出力をストレージに格納します。 その後、他のコンテナーがストレージから結果をフェッチし、GET 呼び出しを実行できるようになります。 要求 ID はコンテナーに関連付けられません。

同期呼び出しの場合は、複数のコンテナーを実行できますが、要求を処理するのは 1 つのコンテナーだけです。 これはブロック呼び出しであるため、プールのすべてのコンテナーが要求を処理し、応答を送信できます。 ここでは、一度に 1 つのコンテナーだけが要求に関連付けられるため、ポーリングは必要ありません。

共有ストレージを使ってコンテナーを設定するにはどうすればよいですか?

コンテナーでは、処理ファイルを格納する共有ストレージを指定するために、起動中に Mounts:Shared プロパティを使用します。 このプロパティの使用を確認するには、コンテナーのドキュメントを参照してください。

セキュリティとプライバシー

Azure AI サービスへの要求を認証するための方法と要件はどのようなものですか?

Azure サービスに対する各要求には、認証ヘッダーが含まれている必要があります。 要求は、次のいくつかの方法を使用して認証できます。

Document Intelligence は自分のデータを格納しますか?

すべての機能について、Document Intelligence では、データと結果を要求と同じリージョン内の Azure Storage に一時的に格納します。 その後、データは分析要求が送信された時刻から 24 時間以内に削除されます。

Document Intelligence のデータ、プライバシー、セキュリティに関する詳細を確認してください。

トレーニング済みカスタム モデルは Document Intelligence でどのように格納および使用されますか?

分析とラベル付けの後の中間出力は、トレーニング データを格納するのと同じ Azure Storage の場所に格納されます。 トレーニング済みカスタム モデルは同じリージョン内の Azure Storage に格納され、Azure サブスクリプションと API 資格情報を使用して論理的に分離されます。

その他のヘルプとサポート

Azure AI Document Intelligence に関する疑問に対して、より多くの解決策が見つかる場所はどこですか?

Microsoft Q&A は、Microsoft での技術的な質問と回答のためのホームです。 Document Intelligence に固有のクエリをフィルター処理できます。

ドキュメントにラベル付けしているときに、サービスで特定のテキストが認識されないか、または誤って認識される場合はどうすればよいですか?

Document Intelligence OCR モデルは、継続的に更新および改良されています。 Document Intelligence チームにメールを送信できます。 可能であれば、問題箇所を強調したサンプル ドキュメントを添付してください。