Azure Document Intelligence の概要

完了

Azure Document Intelligence サービスを使用してプロジェクトを開始するには、データ抽出用の Azure リソースとフォーム ファイルの選択が必要です。

リソースをサブスクライブする

Azure ドキュメント インテリジェンス サービスには、次の方法でアクセスできます。

  • Foundry Tools リソース: 複数の Foundry Tools で使用されるサブスクリプション キー

又は

  • Azure ドキュメント インテリジェンス リソース: 単一サービスサブスクリプション キー (特定の Azure AI サービスでのみ使用)

1 つのエンドポイント/キーで複数の Foundry Tools にアクセスする予定の場合は、Foundry Tools リソースを作成します。 Azure ドキュメント インテリジェンスアクセスの場合のみ、Azure ドキュメント インテリジェンス リソースを作成します。 Microsoft Entra 認証を使用する場合は、単一サービス リソースが必要であることに注意してください。

Azure portal または Azure コマンド ライン インターフェイス (CLI) を使用して、サービスをサブスクライブできます。 CLI コマンドの詳細については、 こちらをご覧ください

Azure ドキュメント インテリジェンス ファイルの入力要件について

Azure ドキュメント インテリジェンスは、次の要件を満たす入力ドキュメントで動作します。

  • 形式は、JPG、PNG、BMP、PDF (テキストまたはスキャン)、または TIFF である必要があります。
  • ファイル サイズは、Paid (S0) レベルの場合は 500 MB 未満、Free (F0) レベルの場合は 4 MB 未満である必要があります。
  • 画像の寸法は、50 x 50 ピクセルから 10,000 x 10,000 ピクセルの間である必要があります。
  • トレーニング データ セットの合計サイズは 500 ページ以下にする必要があります。

詳細な入力要件については、特定のモデルの ドキュメント を参照してください。

使用する Azure ドキュメント インテリジェンスのコンポーネントを決定する

ファイルを収集したら、実行する必要がある内容を決定します。

ユース ケース 使用する推奨機能
OCR 機能を使用してドキュメント分析をキャプチャする レイアウト モデル読み取りモデル、または一般ドキュメント モデルを使用します
W-2s、請求書、領収書、ID ドキュメント、医療保険、ワクチン接種、名刺からデータを抽出するアプリケーションを作成する 事前構築済みモデルを使用します。 これらのモデルをトレーニングする必要はありません。 Azure ドキュメント インテリジェンス サービスはドキュメントを分析し、JSON 出力を返します。
業界固有のフォームからデータを抽出するアプリケーションを作成する カスタム モデルを作成します。 このモデルは、サンプル ドキュメントでトレーニングする必要があります。 カスタム モデルをトレーニングした後、新しいドキュメントを分析し、JSON 出力を返すことができます。