ドキュメント処理に関する FAQ

この記事は、AI Builder のドキュメント処理モデルに関するよくある質問から構成されます。ここで質問が見つからない場合は、ドキュメント処理 AI モデルの概要を確認するか、AI Builder の Power Automate コミュニティに質問を送信してください。

機能

ドキュメント処理で何ができますか?

ドキュメント処理を使用すると、カスタム AI モデルを構築して、さまざまな種類のドキュメントから情報を抽出できます。

固定テンプレートドキュメント オプションは、ドキュメントの要素が同じような場所にある場合に最適です。通常、請求書、発注書、配送注文書、納税申告書などの場合です。
汎用ドキュメント オプションは、最初のオプションでサポートされているものだけでなく、契約書、作業明細書、手紙など、あらゆる種類のドキュメントに最適です。このオプションは、より強力にデータを抽出できますが、トレーニング時間が長くなります。

詳細情報については、ドキュメント処理モデルの概要を参照してください。

ドキュメント処理でハンドル可能なドキュメントのタイプは何ですか?

サポートされているファイルの種類は、PDF、JPG、PNG です。

ドキュメント処理を使用して、ドキュメントからどのようなデータを抽出できますか?

ドキュメント処理では、ドキュメントからフィールド、テーブル、およびチェックボックスを抽出できます。

詳細情報については、抽出する情報を定義するを参照してください。

ドキュメントから手書きのテキストを抽出できますか?

はいドキュメント処理では、独自のドキュメントから印刷および手書きのテキストを抽出できます。

ドキュメント処理モデルをトレーニングするには、いくつのサンプルが必要ですか?

同じレイアウトを使用する高品質のドキュメントの場合、5 つのサンプルドキュメントで十分です。低品質のドキュメント (例: 低品質のスキャン) の場合は、より多くのサンプルドキュメントが必要になることがあります。結果を改善するには、15〜20 のサンプルドキュメントを使用します。

ベストプラクティス

テンプレートドキュメントの場合
- コレクションごとに 1 つのレイアウト。
- レイアウトは、同じコレクション内で同一である必要があります。
- コレクションごとに最小 5 つ、最大 20 個のドキュメント (この制限を超えないようにしてください)。
汎用ドキュメントの場合
- 構造化ドキュメントと非構造化ドキュメントの両方を含む、ドキュメントタイプのすべてのバリエーションに対して 1 つのモデルを作成します。
- 抽出精度を高めるために、値に関連するフィールドにラベルを付けます。
  
  たとえば、サプライヤー ID には "supplier_id" を使用します。フィールド名は文書の言語と一致している必要があります。
- コレクションごとに最小 5 つ、最大 20 個のドキュメント (この制限を超えないようにしてください)。

私のモデルは現在v3.1(GA)で公開されており、v4.0(GA)を使用して再トレーニングする予定です。すべての書類にタグを付け直す必要がありますか?

新しいフィールド、チェックボックス、テーブル、データ抽出用の署名、または新しいドキュメントをコレクションに追加する場合を除き、すべてのドキュメントにタグを付け直す必要はありません。

モデルを発行する前に、1 つ以上のサンプルを使用してモデルをすばやくテストし、必要なすべてのフィールドが適切に抽出されていることを確認することをお勧めします。

あるドキュメントタイプから別のドキュメントタイプに切り替えることはできますか?

はい、モデルを編集するときに、固定テンプレートドキュメントタイプと一般ドキュメントタイプを切り替えることができます。ただし、このスイッチは請求書ではサポートされていません。

単一のフォーム処理モデルで、レイアウトやテンプレートが異なるドキュメントから情報を抽出できますか?

はいコレクション機能を使用して、異なるレイアウトのドキュメントを処理する単一のフォーム処理モデルをトレーニングします。

詳細情報については、コレクションごとにドキュメントをグループ化するを参照してください。

ドキュメント処理は多数のフォームを単一ドキュメントでハンドルできますか?

各フォームは別々のファイルにある必要があります。たとえば、複数の請求書が含まれる PDF ドキュメントがある場合は、ドキュメント処理モデルに送信する前に、請求書ごとに個別のファイルを作成します。

ハンドルするドキュメント処理モデルのページを指定することもできます。このようにして、モデルの機能を利用してページごとにループし、一度に 1 つのフォームを処理できます。

詳細情報については、ページ範囲を参照してください。

ドキュメント処理モデルをトレーニングしましたが、抽出されたデータに関しては良い結果が得られていません。モデルを改善するにはどうすればよいですか?

モデルをトレーニングした後に悪い結果を返す場合は、モデルを編集して、トレーニング用のサンプルを追加してください。提供するサンプルが多いほど、AI モデルはドキュメントからデータを抽出する方法を学習します。

詳細情報については、ドキュメント処理モデルのパフォーマンスを向上するを参照してください。

制限事項

処理できるドキュメントの最大数はいくつですか?

環境ごとに、60 秒ごとに最大 360 のドキュメントを処理できます。

一部の文字が正しく認識されないのはなぜですか?

0 (数字) とO (文字)、1 (数字) とl (文字)、4 (数字) と A (文字) など、いくつかの文字が混同されることがあります。
他の文字の上または近くにある一部の文字が誤って認識される場合があります。縦線の上の O (文字) は 0 (数字) になり、縦線の上の 5 (数字) は $ (米国のドル記号)、l_ (小文字、アンダースコア) は L (大文字) になります。
品質の低い文書上の一部の文字が誤って認識されたり、まったく認識されなかったりする場合があります。

これまでのケースでは、AI Builder で認識を向上させるためにできることは何もありません。同様の問題を解決するには、ソースドキュメントの品質とレイアウトを改善することをお勧めします。

注意

マイクロソフトは、文字を検出するための OCR (光学式文字認識) テクノロジーを常に改善しているため、このような問題はあまり発生しません。

多くのコレクションを含むモデルを作成できますか?

モデルごとに最大 200 のコレクションを作成できます。ただし、数十のコレクションを含む 汎用ドキュメント モデルのトレーニングには数時間かかり、まれにタイムアウトになることもあります。モデルに多数のコレクションがある場合は、モデルのトレーニングが完了するまでに最大 24 時間かかることを想定してください。

ソリューションでモデルを作成することができますか?

現在、ソリューションでモデルを作成することはできません。

ドキュメント処理モデルで契約書や手紙を使用できますか?

はい、契約書や手紙などの構造化されていないドキュメントは、汎用ドキュメント オプションを使用して、ドキュメント処理でサポートされています。

比較

文書処理、請求書処理、領収書処理、身分証明書閲覧者、名刺閲覧者、およびテキスト認識間の違いは何ですか?

状況によっては、特定のモデルまたはそれらの組み合わせを使用する必要がある場合があります。

画像または PDF に存在するすべてのテキストを抽出する場合は、テキスト認識を使用します。次に、たとえば、抽出されたテキスト内のキーワードを検索したり、特定のアイテムを抽出するための固定ルールを作成したりできます。

請求書、領収書、パスポート、運転免許証、または名刺から情報を抽出する場合は、対応する構築済みモデルから始めます:

新しいモデルを作成しなくても、これらのビルド済みモデルをすぐに使用できます。これらのモデルは、対応するドキュメントタイプにある共通情報を抽出できます。

その他のドキュメントタイプの場合は、カスタムドキュメント処理モデルを作成して、必要なフィールドとテーブルを抽出できます。これは、ビルド済みモデルで提供されていない追加情報が必要な場合にも当てはまります。

詳細情報については、カスタムドキュメント処理モデルを参照してください。

AI Builder ドキュメント処理と Azure Form Recognizer の違いは何ですか?

AI Builder ドキュメント処理は、Azure Form Recognizer の上に構築されています。これにより、両製品に Microsoft AI の最新の進歩がもたらされます。

AI Builder は Microsoft Power Platform の一部です。これにより、誰でも使いやすいインターフェースでアプリや自動化に AI を追加できます。 開発者やデータ科学者である必要はありません。
Azure Form Recognizer は プロの開発者を対象 としています。シンプルな REST API を使用して、カスタムコードソリューションに AI 機能を追加できます。

コストオプション

AI Builder ドキュメントの処理コストはいくらですか?

トライアルを始めることで、無料でドキュメント処理を試すことができます。評価後、ドキュメント処理を使用するには AI Builder クレジットを購入する必要があります。ページに抽出するデータが含まれていない場合でも、ドキュメント処理で処理するすべてのページは AI Builder クレジットを消費します。 AI Builder クレジットは、AI Builder アドオンから購入できます。

詳細情報については、AI Builder のライセンスを参照してください。

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-01-14