ドキュメント インテリジェンスの機能を確認する

完了

ドキュメント インテリジェンスは、テキスト内のデータを認識するようにトレーニングされた機械学習モデルに依存しています。 テキスト、レイアウト、キーと値のペアを抽出する機能は、"ドキュメント分析" と呼ばれます。 ドキュメント分析では、ページ上のテキストの場所が境界ボックス座標によって特定され、提供されます。

A screenshot of a scanned receipt for the purchase of a Surface Pro and a Surface Pen.

たとえば、領収書 123 Main Street の情報は、key, address および value, 123 Main Street として保存されます。 ドキュメント分析では、フィールド値の場所を境界ボックス座標 [4.1, 2.2]、[ 4.3, 2.2]、[4.3, 2.4]、[4.1, 2.4] として記録できます。 機械学習モデルは、境界ボックス座標の場所とテキストのパターンを認識するようにトレーニングされているため、ドキュメントまたはフォーム内のデータを解釈することができます。

ドキュメント分析プロセス自動化するときに課題となるのは、フォームとドキュメントがさまざまな形式で提供されるということです。 たとえば、税フォームと運転免許証のドキュメントにはどちらも個人の名前が含まれますが、名前の境界ボックス座標は異なります。 さまざまなフォームやドキュメントで高品質の結果を実現するには、別々の機械学習モデルをトレーニングする必要があります。 このように、場合によっては、一般的に使用されるドキュメント形式でトレーニングされた、事前構築済み機械学習モデルを使用できることがあります。 機械学習モデルを、一意のドキュメント形式を認識するようにカスタマイズしなければならない場合もあります。

テキストを読み取りデータを記録するプロセスを自動化することで、操作の高速化、カスタマー エクスペリエンスの向上、意思決定の改善などが実現します。 次に、Azure AI サービスを使用してドキュメント インテリジェンスを実装する方法について説明します。