カスタム モデルをトレーニングする
Azure の Azure Document Intelligence サービスは、教師あり機械学習をサポートしています。 カスタム モデルをトレーニングし、ラベル付きフィールドを含むフォーム ドキュメント および JSON ドキュメントを使用して複合モデルを作成できます。
カスタム モデルをトレーニングするには:
- レイアウトおよびラベル フィールド情報を含む JSON ファイルと共に、サンプル フォームを Azure BLOB コンテナーに格納します。
- Azure ドキュメント インテリジェンスの Analyze ドキュメント 関数を使用して、サンプル フォームごとに ocr.json ファイルを生成できます。 さらに、抽出するフィールドを記述する 1 つの fields.json ファイルと、フィールドをそのフォーム内の場所にマッピングする各サンプル フォームの labels.json ファイルが必要です。
- コンテナーの共有アクセス セキュリティ (SAS) URL を生成します。
- REST API 関数 (または同等の SDK メソッド) ビルド モデルを使用します。
- REST API 関数 モデルの取得 (または同等の SDK メソッド) を使用して、トレーニング済みの モデル IDを取得します。
又は
- Azure Document Intelligence Studio を使用して、ラベル付けとトレーニングを行います。 カスタム フォームの基になるモデルには、カスタム テンプレート モデル またはカスタム ニューラル モデル の 2 種類があります。
- カスタム テンプレート モデル、ラベル付きのキーと値のペア、選択マーク、テーブル、領域、署名をドキュメントから正確に抽出できます。 トレーニングには数分しかかかりません。100 を超える言語がサポートされています。
- カスタム ニューラル モデル は、レイアウト機能と言語機能を組み合わせてドキュメントからラベル付けされたフィールドを正確に抽出する、詳細な学習モデルです。このモデルは、半構造化ドキュメントまたは非構造化ドキュメントに最適です。