Azure ドキュメント インテリジェンスとは

完了

Azure Document Intelligence は、OCR とディープ ラーニング モデルを使用してドキュメントからテキスト、キーと値のペア、選択マーク、テーブルを抽出する Microsoft Foundry のクラウドベースの AI サービスです。

OCR を使用すると、画像内で検出されたオブジェクトの周囲に境界ボックスを作成することで、ドキュメントの構造をキャプチャできます。 境界ボックスの位置は、ページの他の部分との相対座標として記録されます。 Azure ドキュメント インテリジェンスは、元のドキュメントからのリレーションシップを保持する構造化された JSON 形式で境界ボックス データとその他の情報を返します。

抽出されたフィールドと境界ボックスを含むサンプル ドキュメントを分析するドキュメント インテリジェンスを示すスクリーンショット。

ゼロから高精度のドキュメント抽出モデルを構築するには、ディープ ラーニングの専門知識、大量のコンピューティング、および長いトレーニング時間が必要です。 Azure Document Intelligence には、何千ものフォーム例で既にトレーニングされている基になるモデルが用意されているため、最小限の労力で高精度のデータ抽出を実現できます。

ドキュメント インテリジェンス サービス コンポーネント

Azure ドキュメント インテリジェンスは、次の 3 つのカテゴリのモデルで構成されます。

  • ドキュメント分析モデル: ドキュメントからテキスト、構造、テーブル、および選択マークを抽出します。 読み取りモデルではテキストが抽出され、言語が検出されますが、レイアウト モデルではテーブルと構造の抽出が追加されます。 これらのモデルの詳細については、「 事前構築済みモデルの使用 」ユニットを参照してください。

  • 事前構築済みモデル: トレーニングを必要とせずに、請求書、領収書、税フォーム、ID ドキュメントなどの一般的なドキュメントの種類から情報を抽出します。 使用可能な事前構築済みモデルの完全な一覧は、「事前構築済 みモデルの使用 」ユニットに表示されます。

  • カスタム モデル: 独自のラベル付きデータセットを使用して、ビジネスに固有のフォームからデータを抽出します。 オプションには、カスタム テンプレート モデル (固定レイアウトの場合は高速でコスト効率が高い)、カスタム ニューラル モデル (さまざまなレイアウトの場合は高い精度)、構成済みモデル、およびカスタム分類子が含まれます。 カスタムモデルのトレーニングおよび使用について、カスタムモデルユニットで学びます。

ドキュメント インテリジェンス サービスにアクセスする

Azure ドキュメント インテリジェンスには、いくつかの方法でアクセスできます。

  • REST API: HTTP 要求を使用してサービスを直接呼び出します。
  • クライアント ライブラリ SDK: Python、C#、Java、JavaScript 用の SDK を使用します。
  • ドキュメント インテリジェンス スタジオ: ドキュメント インテリジェンス ソリューションを視覚的に調査、テスト、構築するためのオンライン ツール。
  • Microsoft Foundry ポータル: ドキュメント インテリジェンスを他の Foundry ツールと統合します。

ヒント

このモジュールの演習では、Python SDK に焦点を当てます。 基盤となる REST サービスは、どの言語でも使用できます。

Document Intelligence リソースを作成する

Azure ドキュメント インテリジェンスを使用するには、Azure リソースが必要です。 以下のいずれかを使用できます。

  • Foundry リソース: 1 つのエンドポイントとキーで複数の AI サービスへのアクセスを提供するマルチサービス サブスクリプション。
  • Azure ドキュメント インテリジェンス リソース: ドキュメント インテリジェンスでのみ使用される単一サービス リソース。

1 つのエンドポイントとキーで複数の Foundry ツールにアクセスする場合は、Foundry リソースを作成します。 ドキュメント インテリジェンスアクセスの場合のみ、専用のドキュメント インテリジェンス リソースを作成します。

入力の要件

Azure ドキュメント インテリジェンスは、次の要件を満たす入力ドキュメントで動作します。

  • 形式は、JPEG、PNG、BMP、PDF (テキストまたはスキャン)、または TIFF である必要があります。 読み取りモデルでは、Microsoft Office ファイル形式も受け入れられます。
  • ファイル サイズは、Standard レベルでは 500 MB 未満、Free レベルでは 4 MB 未満である必要があります。
  • 画像の寸法は、50 x 50 ピクセルから 10,000 x 10,000 ピクセルの間である必要があります。
  • PDF ドキュメントのサイズが 17 x 17 インチ (A3 用紙サイズ) 未満である必要があります。
  • PDF ドキュメントはパスワードで保護しないでください。

詳細情報