ドキュメント処理に関する FAQ
[アーティクル] 2024/04/22
4 人の共同作成者
フィードバック
この記事の内容
機能
制限
比較
コスト オプション
この記事は、AI Builder のドキュメント処理モデルに関するよくある質問から構成されます。 ここで質問が見つからない場合は、ドキュメント処理 AI モデルの概要 を確認するか、AI Builder の Power Automate コミュニティ に質問を送信してください。
ドキュメント処理を使用すると、カスタム AI モデルを構築して、さまざまな種類のドキュメントから情報を抽出できます。
固定テンプレート ドキュメント オプションは、ドキュメントの要素が同じような場所にある場合に最適です。 通常、請求書、発注書、配送注文書、納税申告書などの場合です。
汎用ドキュメント オプションは、最初のオプションでサポートされているものだけでなく、契約書、作業明細書、手紙など、あらゆる種類のドキュメントに最適です。 このオプションは、より強力にデータを抽出できますが、トレーニング時間が長くなります。
詳細: ドキュメント処理モデルの概要
ドキュメント処理でハンドル可能なドキュメントのタイプは何ですか?
サポートされているファイルの種類は、PDF、JPG、PNG です。
ドキュメント処理では、ドキュメントからフィールド、テーブル、およびチェックボックスを抽出できます。
詳細: 抽出する情報を定義する
ドキュメントから手書きのテキストを抽出できますか?
はい。 ドキュメント処理では、独自のドキュメントから印刷および手書きのテキストを抽出できます。
ドキュメント処理モデルをトレーニングするには、いくつのサンプルが必要ですか?
同じレイアウトを使用する高品質のドキュメントの場合、5 つのサンプル ドキュメントで十分です。 低品質のドキュメント (例: 低品質のスキャン) の場合は、より多くのサンプル ドキュメントが必要になることがあります。 結果を改善するには、15〜20 のサンプル ドキュメントを使用します。
有効。 コレクション機能を使用して、異なるレイアウトのドキュメントを処理する単一のフォーム処理モデルをトレーニングします。
詳細情報: コレクションごとにドキュメントをグループ化する
各フォームは別々のファイルにある必要があります。 たとえば、複数の請求書が含まれる PDF ドキュメントがある場合は、ドキュメント処理モデルに送信する前に、請求書ごとに個別のファイルを作成します。
ハンドルするドキュメント処理モデルのページを指定することもできます。 このようにして、モデルの機能を利用してページごとにループし、一度に 1 つのフォームを処理できます。
詳細情報: ページ範囲
モデルをトレーニングした後に悪い結果を返す場合は、モデルを編集して、トレーニング用のサンプルを追加してください。 提供するサンプルが多いほど、AI モデルはドキュメントからデータを抽出する方法を学習します。
詳細: ドキュメント処理モデルのパフォーマンスを向上する
環境ごとに、60 秒ごとに最大 360 のドキュメントを処理できます。
0 (数字) とO (文字)、1 (数字) とl (文字)、4 (数字) と A (文字) など、いくつかの文字が混同されることがあります。
他の文字の上または近くにある一部の文字が誤って認識される場合があります。縦線の上の O (文字) は 0 (数字) になり、縦線の上の 5 (数字) は $ (米国のドル記号)、l_ (小文字、アンダースコア) は L (大文字) になります。
品質の低い文書上の一部の文字が誤って認識されたり、まったく認識されなかったりする場合があります。
上記の場合、AI Builder で認識を改善するためにできることは何もありません。 同様の問題を解決するには、ソース ドキュメントの品質とレイアウトを改善することをお勧めします。
注意
文字を検出する OCR テクノロジは Microsoft によって常に改良されているため、このような問題が発生する頻度は低くなります。
モデルごとに最大 200 のコレクションを作成できます。 ただし、数十のコレクションを含む 汎用ドキュメント モデルのトレーニングには数時間かかり、まれにタイムアウトになることもあります。モデルに多数のコレクションがある場合は、モデルのトレーニングが完了するまでに最大 24 時間かかることを想定してください。
ソリューションでモデルを作成することができますか?
現在、ソリューションでモデルを作成することはできません。
ドキュメント処理モデルで契約書や手紙を使用できますか?
はい、契約書や手紙などの構造化されていないドキュメントは、汎用ドキュメント オプションを使用して、ドキュメント処理でサポートされています。
文書処理、請求書処理、領収書処理、身分証明書閲覧者、名刺閲覧者、およびテキスト認識間の違いは何ですか?
状況によっては、特定のモデルまたはそれらの組み合わせを使用する必要がある場合があります。
画像または PDF に存在するすべてのテキストを抽出する場合は、テキスト認識 を使用します。 次に、たとえば、抽出されたテキスト内のキーワードを検索したり、特定のアイテムを抽出するために固定ルールを作成したりできます。
請求書、領収書、パスポート、運転免許証、または名刺から情報を抽出する場合は、対応する構築済みモデルから始めます:
新しいモデルを作成しなくても、これらのビルド済みモデルをすぐに使用できます。 これらのモデルは、対応するドキュメント タイプにある共通情報を抽出できます。
その他のドキュメント タイプの場合は、カスタム ドキュメント処理モデルを作成して、必要なフィールドとテーブルを抽出できます。 これは、ビルド済みモデルで提供されていない追加情報が必要な場合にも当てはまります。
詳細: カスタム ドキュメント処理モデル
AI Builder ドキュメント処理は、Azure Form Recognizer の上に構築されています。 これにより、両製品に Microsoft AI の最新の進歩がもたらされます。
AI Builder ドキュメントの処理コストはいくらですか?
トライアル を始めることで、無料でドキュメント処理を試すことができます。 評価後、ドキュメント処理を使用するには AI Builder クレジットを購入する必要があります。 ページに抽出するデータが含まれていない場合でも、ドキュメント処理で処理するすべてのページは AI Builder クレジットを消費します。 AI Builder クレジットは、AI Builder アドオンから購入できます。
詳細: AI Builder のライセンス