カスタムモデルのトレーニングと使用

8 分

事前構築済みモデルが特定のドキュメントの種類に対応していない場合は、独自のフォームからデータを抽出するカスタムモデルをトレーニングできます。 Azure Document Intelligence では、教師あり機械学習がサポートされています。ここでは、抽出するフィールドでサンプルドキュメントにラベルを付け、新しいドキュメント内のこれらのフィールドを認識するようにモデルをトレーニングします。

カスタムモデルの種類

Azure ドキュメントインテリジェンスには、次の 2 種類のカスタム抽出モデルと分類モデルが用意されています。

カスタムテンプレートモデル

カスタムテンプレートモデルは、ラベル付きデータを抽出するために一貫したビジュアルテンプレートに依存します。これらは、アンケート、アプリケーション、標準の政府機関向けフォームなど、あるドキュメントインスタンスから次のドキュメントインスタンスにレイアウトが静的である構造化フォームに最適です。

テンプレートモデルでは、ラベル付きのキーと値のペア、選択マーク、テーブル、領域、署名が正確に抽出されます。トレーニングには数分しかかかりません。100 を超える言語がサポートされています。テンプレートモデルはトレーニングが速く、実行にコスト効率が高いため、ドキュメントの視覚的なレイアウトが統一されている場合の出発点として適しています。

カスタムニューラルモデル

カスタムニューラルモデルではディープラーニングが使用され、ラベル付けされたデータで微調整されます。レイアウト機能と言語機能を組み合わせて、構造化ドキュメント、半構造化ドキュメント、非構造化ドキュメントからフィールドを抽出します。ニューラルモデルのサポート:

重複するフィールド
署名の検出
テーブル、行、およびセルレベルの信頼度

ニューラルモデルは、テンプレートモデルよりも高い精度を提供します。特に、インスタンス間でレイアウトが異なる半構造化ドキュメントまたは非構造化ドキュメントの場合です。ただし、トレーニングに時間がかかり、より多くのリソースを消費します。

テンプレートモデルとニューラルモデルを選択する

使用するカスタムモデルの種類を決定するときは、次のトレードオフを検討してください。

要因	カスタムテンプレート	カスタムニューラル
最適な用途	一貫性のある視覚的レイアウトを持つ構造化フォーム	レイアウトが異なる半構造化ドキュメントまたは非構造化ドキュメント
トレーニング時間	議事録	長い (データセットのサイズによって異なります)
トレーニングコスト	下	より高い
精度	固定レイアウトフォームの場合は高い。レイアウトが変化すると減少する	全体的に高い (特に形式のバリエーションがあるドキュメントの場合)
言語サポート	100 以上の言語	言語の数を減らします (現在のサポートについてはドキュメントを参照してください)
機能のサポート	キーと値のペア、選択マーク、テーブル、領域、署名	重複するフィールド、署名の検出、テーブル/行/セルの信頼度

ヒント

フォームに一貫したビジュアルレイアウトがある場合は、カスタムテンプレートモデルから始めます。トレーニングの時間が短縮され、コストが削減されます。精度が不十分な場合、またはドキュメントの形式が異なる場合は、カスタムニューラルモデルに切り替えます。

カスタム分類子

カスタム分類モデルは、抽出モデルを呼び出す前にドキュメントの種類を識別します。分類子を使用すると、複数のフォームの種類を処理するときに、受信ドキュメントを適切な抽出モデルにルーティングできます。

カスタムモデルをトレーニングする

カスタム抽出モデルをトレーニングするには:

レイアウトとラベルフィールド情報を含む JSON ファイルと共に、Azure BLOB コンテナーにサンプルフォームを格納します。
- 各サンプルフォームの ocr.json ファイル (ドキュメント分析関数を使用して生成されます)。
- 抽出するフィールドを記述する 1 つの fields.json ファイル。
- 各サンプルフォームの labels.json ファイル。フィールドをフォーム内の場所にマッピングします。
コンテナーの Shared Access Signature (SAS) URL を生成します。
ビルドモデル REST API 関数または同等の SDK メソッドを使用します。
トレーニング済みのモデル ID を取得するには、 Get model REST API 関数を使用します。

「ドキュメントインテリジェンススタジオの使用」ユニットで説明されているように、Document Intelligence Studio を 使用して カスタムモデルを視覚的にトレーニングすることもできます。

ヒント

トレーニングには、少なくとも 5 ~ 6 個のサンプルフォームを使用します。より大規模で多様なデータセットを使用すると、より正確なモデルが生成されます。

カスタムモデルを使用する

カスタムモデルを使用してフォームデータを抽出するには、モデル ID で Analyze ドキュメント 関数を呼び出します。サポートされている SDK または REST API を使用できます。

string endpoint = "<endpoint>";
string apiKey = "<apiKey>";
AzureKeyCredential credential = new AzureKeyCredential(apiKey);
DocumentAnalysisClient client = new DocumentAnalysisClient(new Uri(endpoint), credential);

string modelId = "<modelId>";
Uri fileUri = new Uri("<fileUri>");

AnalyzeDocumentOperation operation = await client.AnalyzeDocumentFromUriAsync(WaitUntil.Completed, modelId, fileUri);
AnalyzeResult result = operation.Value;

Python

endpoint = "YOUR_DOC_INTELLIGENCE_ENDPOINT"
key = "YOUR_DOC_INTELLIGENCE_KEY"

model_id = "YOUR_CUSTOM_BUILT_MODEL_ID"
formUrl = "YOUR_DOCUMENT"

document_analysis_client = DocumentAnalysisClient(
    endpoint=endpoint, credential=AzureKeyCredential(key)
)

task = document_analysis_client.begin_analyze_document_from_url(model_id, formUrl)
result = task.result()

成功した応答には、抽出されたコンテンツを含む analyzeResult オブジェクトと、ドキュメントに関する情報を含むページの配列が含まれます。

作成済みモデル

複数のカスタムモデルを 1 つの構成済み モデルに結合できます。構成済みモデルにドキュメントを送信すると、ドキュメントインテリジェンスによって分類され、最も適切なコンポーネントモデルが決定され、そのモデルからの抽出結果が返されます。この方法は、それぞれが独自の抽出モデルを必要とする複数のフォーム型を処理する場合に便利です。

詳細情報

フィードバック

このページはお役に立ちましたか?

カスタム モデルのトレーニングと使用

カスタム モデルの種類

カスタム テンプレート モデル

カスタム ニューラル モデル

テンプレート モデルとニューラル モデルを選択する