Share via


Document Intelligence 結婚証明書モデル

このコンテンツの適用対象: checkmarkv4.0 (プレビュー)checkmark

Document Intelligence 結婚証明書モデルでは、強力な光学式文字認識 (OCR) 機能を使用して、結婚証明書の主要なフィールドを分析して抽出します。 携帯電話でキャプチャされた画像、スキャンされたドキュメント、デジタル PDF など、さまざまな形式や品質の結婚証明書を使用できます。 API によってドキュメントのテキストが分析され、配偶者の名前、発行日、結婚場所などの主要な情報が抽出されて、構造化された JSON データ表現が返されます。 このモデルでは現在、英語のドキュメント形式がサポートされています。

結婚証明書の自動処理

結婚証明書の自動処理は、結婚証明書から主要なフィールドを抽出するプロセスです。 これまで、結婚証明書の分析プロセスは手動で行われてきたため、非常に時間がかかっていました。 結婚証明書からキー データを正確に抽出することは、通常、結婚証明書の自動化プロセスの最初に行われる最も重要な手順の 1 つです。

開発オプション

Document Intelligence v4.0 (2024-02-29-preview) では、次のツール、アプリケーション、ライブラリがサポートされています。

機能 リソース モデル ID
prebuilt-marriageCertificate.us Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-marriageCertificate.us

入力の要件

  • 最適な結果を得るには、ドキュメントごとに 1 つの鮮明な写真または高品質のスキャンを提供してください。

  • サポートされているファイル形式:

    モデル PDF 画像:
    JPEG/JPG、PNG、BMP、TIFF、HEIF
    Microsoft Office:
    Word (DOCX)、Excel (XLS)、PowerPoint (PPT)、HTML
    既読
    Layout ✔ (2024-02-29-preview、2023-10-31-preview)
    一般的なドキュメント
    事前構築済み
    カスタム抽出
    カスタム分類 ✔ (2024-02-29-preview)
  • PDF および TIFF の場合、最大 2000 ページを処理できます (Free レベルのサブスクリプションでは、最初の 2 ページのみが処理されます)。

  • ドキュメントを分析するためのファイル サイズは、有料 (S0) レベルでは 500 MB、無料 (F0) レベルでは 4 MB です。

  • 画像のディメンションは、50 x 50 ピクセルから 10,000 x 10,000 ピクセルの間である必要があります。

  • PDF がパスワードでロックされている場合は、送信前にロックを解除する必要があります。

  • 抽出するテキストの最小の高さは、1024 x 768 ピクセルのイメージの場合は 12 ピクセルです。 このディメンションは、150 DPI (1 インチあたりのドット数) で約 8 ポイントのテキストに相当します。

  • カスタム モデル トレーニングにおけるトレーニング データの最大ページ数は、カスタム テンプレート モデルの場合は 500、カスタム ニューラル モデルの場合は 50,000 です。

    • カスタム抽出モデル トレーニングにおけるトレーニング データの合計サイズは、テンプレート モデルの場合は 50 MB、ニューラル モデルの場合は 1GB です。

    • カスタム分類モデル トレーニングの場合、トレーニング データの合計サイズは 1GB で、最大 10,000 ページです。

結婚証明書ドキュメント データの抽出を試みる

結婚証明書カード サービスのデータ抽出のしくみを確認するには、次のリソースが必要です。

Azure portal のキーとエンドポイントの場所のスクリーンショット。

Document Intelligence Studio

  1. Document Intelligence Studio ホーム ページで、[Marriage Certificate] (結婚証明書) を選択します。

  2. サンプルの結婚証明書を分析したり、自身のファイルをアップロードしたりできます。

  3. 分析実行 ボタンを選択し、必要に応じて 分析オプション を構成します:

    Document Intelligence Studio の [分析の実行] と [分析オプション] ボタンのスクリーンショット。

サポートされている言語とロケール

以下の参照、サポートされている言語の完全なリストについては、 語サポート—の事前構築済みモデル ページをご覧ください。

フィールドの抽出

JSON 出力応答で結婚証明書から抽出されたフィールドを次に示します。

名前 種類 説明 出力例
Spouse1FirstName String 配偶者 1 の名 Wesley
Spouse1MiddleName String 配偶者 1 のミドル ネーム M.
Spouse1LastName String 配偶者 1 の姓 Perry
Spouse1Age 整数型 配偶者 1 の年齢 26
Spouse1BirthDate 配偶者 1 の生年月日 Nov. 16, 1997
Spouse1Address 番地 配偶者 1 の住所 4292 Don Jackson Lane, Bloomfield Township, Michigan 48302
Spouse1BirthPlace String 配偶者 1 の出生地 ミシガン
Spouse2FirstName String 配偶者 2 の名 Beth
Spouse2MiddleName String 配偶者 2 のミドル ネーム R.
Spouse2LastName String 配偶者 2 の姓 Mason
Spouse2Age 整数型 配偶者 2 の年齢 23
Spouse2BirthDate 配偶者 2 の生年月日 Jul.22, 2000
Spouse2Address 番地 配偶者 2 の住所 2671 Comfort Court, Madison, Wisconsin 53704
Spouse2BirthPlace String 配偶者 2 の出生地 ウィスコンシン
DocumentNumber String ドキュメント番号 01976/202
IssueDate 証明書の発行日 Oct. 10, 2023
IssuePlace String 証明書の発行場所 2398 Echo Lane, Hastings, Michigan 49058
MarriageDate 結婚日 Oct. 10, 2023
MarriagePlace String 結婚場所 105 Coal Street, Galloway, Wisconsin 54432

抽出された結婚証明書のキーと値のペアと行項目は、JSON 出力の documentResults セクションにあります。

次のステップ