コンテナーのインストールと実行

[アーティクル]
01/17/2024

現在、すべてのモデルについてコンテナーがサポートされているのは Document Intelligence バージョン 2022-08-31 (GA) です。2023-07-31 (GA) は読み取りとレイアウトのみです。

✔️ サポートされているコンテナーのドキュメントについては、Document Intelligence v3.0 コンテナーのインストールと実行に関する記事を参照してください。

このコンテンツの適用対象:v3.0 (GA)v3.1 (GA)

Azure AI ドキュメントインテリジェンスは、機械学習テクノロジを利用して自動データ処理ソフトウェアを構築できる Azure AI サービスです。ドキュメントインテリジェンスを使用すると、ドキュメントからテキスト、キーと値のペア、選択マーク、テーブルデータなどを識別して抽出できます。結果は、元のファイル内の関係を含む構造化データとして出力されます。

この記事では、ドキュメントインテリジェンスコンテナーをダウンロード、インストール、実行する方法について説明します。コンテナーを使用すると、独自の環境でドキュメントインテリジェンスサービスを実行できます。コンテナーは、特定のセキュリティ要件とデータガバナンス要件に適しています。

読み取り、レイアウトの各モデルは、Document Intelligence v3.1 コンテナーでサポートされています。
ドキュメントインテリジェンス v3.0 コンテナーでは、読み取り、レイアウト、一般ドキュメント、ID ドキュメント、領収書、請求書、名刺、カスタムの各モデルがサポートされています。
現在、名刺モデルは v2.1 コンテナーでのみサポートされています。

前提条件

開始するには、アクティブな Azure アカウントが必要です。アカウントがない場合は、無料アカウントを作成できます。

ドキュメントインテリジェンスコンテナーを使用するには、次のものも必要です。

必須	目的
Docker に関する知識	レジストリ、リポジトリ、コンテナー、コンテナーイメージなど、Docker の概念の基本的な理解に加えて、基本的な `docker`用語とコマンドの知識が必要です。
Docker Engine がインストールされている	ホストコンピューターに Docker エンジンをインストールしておく必要があります。 Docker には、macOS、Windows、Linux 上で Docker 環境の構成を行うパッケージが用意されています。 Docker やコンテナーの基礎に関する入門情報については、「Docker overview」(Docker の概要) を参照してください。コンテナーが Azure に接続して課金データを送信できるように、Docker を構成する必要があります。 Windows では、Linux コンテナーをサポートするように Docker を構成することも必要です。
ドキュメントインテリジェンスリソース	Azure portal のシングルサービス Azure AI ドキュメントインテリジェンスまたはマルチサービスリソース。コンテナーを使用するには、関連付けられているキーとエンドポイント URI が必要です。どちらの値も、Azure portal の Document Intelligence の [キーとエンドポイント] ページで入手できます。 {FORM_RECOGNIZER_API_KEY}: 利用可能な 2 つのリソースキーのどちらか一方。 {FORM_RECOGNIZER_ENDPOINT_URI} : 課金情報を追跡するために使用されるリソースのエンドポイント。

オプション	目的
Azure CLI (コマンドラインインターフェイス)	Azure CLI を使用すると、一連のオンラインコマンドを使用して Azure リソースを作成および管理できます。 Windows、macOS、Linux 環境にインストールが可能で、Docker コンテナーと Azure Cloud Shell で実行できます。

ホストコンピューターの要件

ホストとは、Docker コンテナーを実行する x64 ベースのコンピューターのことです。お客様のオンプレミス上のコンピューターを使用できるほか、次のような Azure 内の Docker ホスティングサービスを使用することもできます。

Azure Kubernetes Service。
Azure Container Instances。
Azure Stack にデプロイされた Kubernetes クラスター。詳しくは、「Kubernetes を Azure Stack にデプロイする」をご覧ください。

コンテナーの要件と推奨事項

必要なサポートコンテナー

次の表に、ダウンロードする各ドキュメントインテリジェンスコンテナーのサポートコンテナーを示します。詳細については、「請求先」セクションを参照してください。

機能コンテナー	サポートコンテナー
読み取り	必要なし
レイアウト	必要なし
名刺	読み取り
一般的なドキュメント	レイアウト
請求書	レイアウト
Receipt	読み取りまたはレイアウト
身分証明書	読み取り
カスタムテンプレート	レイアウト

推奨される CPU コア数とメモリ

注意

最小値と推奨値は、Docker の制限に基づくもので、ホストマシンのリソースに基づくものではありません。

ドキュメントインテリジェンスコンテナー

コンテナー	最小値	推奨
`Read`	`8` コア、10 GB のメモリ	`8` コア、24 GB のメモリ
`Layout`	`8` コア、16 GB のメモリ	`8` コア、24 GB のメモリ
`Business Card`	`8` コア、16 GB のメモリ	`8` コア、24 GB のメモリ
`General Document`	`8` コア、12 GB のメモリ	`8` コア、24 GB のメモリ
`ID Document`	`8` コア、8 GB のメモリ	`8` コア、24 GB のメモリ
`Invoice`	`8` コア、16 GB のメモリ	`8` コア、24 GB のメモリ
`Receipt`	`8` コア、11 GB のメモリ	`8` コア、24 GB のメモリ
`Custom Template`	`8` コア、16 GB のメモリ	`8` コア、24 GB のメモリ

各コアは少なくとも 2.6 ギガヘルツ (GHz) 以上にする必要があります。
コアとメモリは、docker compose または docker run コマンドの一部として使用される --cpus と --memory の設定に対応します。

ヒント

docker images コマンドを使用して、ダウンロードしたコンテナーイメージを一覧表示できます。たとえば、次のコマンドは、ダウンロードした各コンテナーイメージの ID、リポジトリ、およびタグが表として書式設定されて表示されます。

docker images --format "table {{.ID}}\t{{.Repository}}\t{{.Tag}}"

IMAGE ID         REPOSITORY                TAG
<image-id>       <repository-path/name>    <tag-name>

docker-compose up コマンドを使用してコンテナーを実行する

{ENDPOINT_URI} と {API_KEY} の値を、Azure リソースページのリソースエンドポイント URI とキーに置き換えます。
EULA 値が accept に設定されていることを確認します。
EULA、Billing、ApiKey の各値が指定されている必要があります。指定されてない場合、コンテナーは起動できません。

重要

キーは、ドキュメントインテリジェンスリソースにアクセスするために使用されます。キーを共有しないでください。 Azure Key Vault を使用するなどして、安全に保管してください。これらのキーを定期的に再生成することもお勧めします。 API 呼び出しを行うために必要なキーは 1 つだけです。最初のキーを再生成するときに、2 番目のキーを使用してサービスに継続的にアクセスすることができます。

次のコードサンプルは、ドキュメントインテリジェンスレイアウトコンテナーを実行する自己完結 docker compose 型の例です。 docker compose では、YAML ファイルを使用してアプリケーションのサービスを構成します。次に、docker-compose up コマンドを使用して、構成からすべてのサービスを作成し、開始します。レイアウトコンテナーインスタンスの {FORM_RECOGNIZER_ENDPOINT_URI} と {FORM_RECOGNIZER_KEY} の値を入力します。

version: "3.9"
services:
  azure-form-recognizer-read:
    container_name: azure-form-recognizer-read
    image: mcr.microsoft.com/azure-cognitive-services/form-recognizer/read-3.0
    environment:
      - EULA=accept
      - billing={FORM_RECOGNIZER_ENDPOINT_URI}
      - apiKey={FORM_RECOGNIZER_KEY}
    ports:
      - "5000:5000"
    networks:
      - ocrvnet
networks:
  ocrvnet:
    driver: bridge