カスタムモデルをトレーニングする

3 分

Azure の Azure Document Intelligence サービスは、教師あり機械学習をサポートしています。カスタムモデルをトレーニングし、ラベル付きフィールドを含むフォームドキュメント および JSON ドキュメントを使用して複合モデルを作成できます。

カスタムモデルのトレーニングに必要なサンプルフォームドキュメントのスクリーンショット。

カスタムモデルをトレーニングするには:

レイアウトおよびラベルフィールド情報を含む JSON ファイルと共に、サンプルフォームを Azure BLOB コンテナーに格納します。
- Azure ドキュメントインテリジェンスの Analyze ドキュメント 関数を使用して、サンプルフォームごとに ocr.json ファイルを生成できます。さらに、抽出するフィールドを記述する 1 つの fields.json ファイルと、フィールドをそのフォーム内の場所にマッピングする各サンプルフォームの labels.json ファイルが必要です。
コンテナーの共有アクセスセキュリティ (SAS) URL を生成します。
REST API 関数 (または同等の SDK メソッド) ビルドモデルを使用します。
REST API 関数 モデルの取得 (または同等の SDK メソッド) を使用して、トレーニング済みの モデル IDを取得します。

又は

Azure Document Intelligence Studio を使用して、ラベル付けとトレーニングを行います。カスタムフォームの基になるモデルには、カスタムテンプレートモデルまたはカスタムニューラルモデルの 2 種類があります。
- カスタムテンプレートモデル、ラベル付きのキーと値のペア、選択マーク、テーブル、領域、署名をドキュメントから正確に抽出できます。トレーニングには数分しかかかりません。100 を超える言語がサポートされています。
- カスタムニューラルモデル は、レイアウト機能と言語機能を組み合わせてドキュメントからラベル付けされたフィールドを正確に抽出する、詳細な学習モデルです。このモデルは、半構造化ドキュメントまたは非構造化ドキュメントに最適です。

フィードバック

このページはお役に立ちましたか?