Document Intelligence 結婚証明書モデル
このコンテンツの適用対象: v4.0 (プレビュー)
Document Intelligence 結婚証明書モデルでは、強力な光学式文字認識 (OCR) 機能を使用して、結婚証明書の主要なフィールドを分析して抽出します。 携帯電話でキャプチャされた画像、スキャンされたドキュメント、デジタル PDF など、さまざまな形式や品質の結婚証明書を使用できます。 API によってドキュメントのテキストが分析され、配偶者の名前、発行日、結婚場所などの主要な情報が抽出されて、構造化された JSON データ表現が返されます。 このモデルでは現在、英語のドキュメント形式がサポートされています。
結婚証明書の自動処理
結婚証明書の自動処理は、結婚証明書から主要なフィールドを抽出するプロセスです。 これまで、結婚証明書の分析プロセスは手動で行われてきたため、非常に時間がかかっていました。 結婚証明書からキー データを正確に抽出することは、通常、結婚証明書の自動化プロセスの最初に行われる最も重要な手順の 1 つです。
開発オプション
Document Intelligence v4.0 (2024-07-31-preview) は、次のツール、アプリケーション、ライブラリをサポートします。
機能 | リソース | モデル ID |
---|---|---|
prebuilt-marriageCertificate.us | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-marriageCertificate.us |
入力の要件
サポートされているファイル形式:
モデル PDF 画像: JPEG/JPG
、PNG
、BMP
、TIFF
、HEIF
Microsoft Office:
Word (DOCX
)、Excel (XLSX
)、PowerPoint (PPTX
)、HTML読み込み ✔ ✔ ✔ Layout ✔ ✔ ✔ (2024-07-31-preview、2024-02-29-preview、2023-10-31-preview) 一般的なドキュメント ✔ ✔ 事前構築済み ✔ ✔ カスタム抽出 ✔ ✔ カスタム分類 ✔ ✔ ✔ (2024-07-31-preview、2024-02-29-preview) 最適な結果を得るには、ドキュメントごとに 1 つの鮮明な写真または高品質のスキャンを提供してください。
PDF および TIFF の場合、最大 2,000 ページを処理できます (Free レベルのサブスクリプションでは、最初の 2 ページのみが処理されます)。
ドキュメントを分析するためのファイル サイズは、有料 (S0) レベルでは 500 MB、無料 (F0) レベルでは
4
MB です。画像のディメンションは、50 ピクセル x 50 ピクセルから 10,000 ピクセル x 10,000 ピクセルの間である必要があります。
PDF がパスワードでロックされている場合は、送信前にロックを解除する必要があります。
抽出するテキストの最小の高さは、1024 x 768 ピクセルのイメージの場合は 12 ピクセルです。 このディメンションは、150 DPI (1 インチあたりのドット数) で約
8
ポイントのテキストに相当します。カスタム モデル トレーニングにおけるトレーニング データの最大ページ数は、カスタム テンプレート モデルの場合は 500、カスタム ニューラル モデルの場合は 50,000 です。
カスタム抽出モデル トレーニングにおけるトレーニング データの合計サイズは、テンプレート モデルの場合は 50 MB、ニューラル モデルの場合は
1
GB です。カスタム分類モデル トレーニングの場合、トレーニング データの合計サイズは
1
GB で、最大 10,000 ページです。 2024-07-31-preview 以降の場合、トレーニング データの合計サイズは2
GB で、最大 10,000 ページです。
結婚証明書ドキュメント データの抽出を試みる
結婚証明書カード サービスのデータ抽出のしくみを確認するには、次のリソースが必要です。
Azure サブスクリプション - 無料で作成できます。
Azure portal の Document Intelligence Studio インスタンス。 Free 価格レベル (
F0
) を利用して、サービスを試用できます。 リソースがデプロイされたら、[リソースに移動] を選択してキーとエンドポイントを取得します。
Document Intelligence Studio
Document Intelligence Studio ホーム ページで、[Marriage Certificate] (結婚証明書) を選択します。
サンプルの結婚証明書を分析したり、自身のファイルをアップロードしたりできます。
分析実行 ボタンを選択し、必要に応じて 分析オプション を構成します:
サポートされている言語とロケール
以下の参照、サポートされている言語の完全なリストについては、 語サポート—の事前構築済みモデル ページをご覧ください。
フィールドの抽出
JSON 出力応答で結婚証明書から抽出されたフィールドを次に示します。
名前 | 種類 | 説明 | 出力例 |
---|---|---|---|
Spouse1FirstName |
String | 配偶者 1 の名 | Wesley |
Spouse1MiddleName |
String | 配偶者 1 のミドル ネーム | M. |
Spouse1LastName |
String | 配偶者 1 の姓 | Perry |
Spouse1Age |
整数型 | 配偶者 1 の年齢 | 26 |
Spouse1BirthDate |
日 | 配偶者 1 の生年月日 | Nov. 16, 1997 |
Spouse1Address |
番地 | 配偶者 1 の住所 | 4292 Don Jackson Lane, Bloomfield Township, Michigan 48302 |
Spouse1BirthPlace |
String | 配偶者 1 の出生地 | ミシガン |
Spouse2FirstName |
String | 配偶者 2 の名 | Beth |
Spouse2MiddleName |
String | 配偶者 2 のミドル ネーム | R. |
Spouse2LastName |
String | 配偶者 2 の姓 | Mason |
Spouse2Age |
整数型 | 配偶者 2 の年齢 | 23 |
Spouse2BirthDate |
日 | 配偶者 2 の生年月日 | Jul.22, 2000 |
Spouse2Address |
番地 | 配偶者 2 の住所 | 2671 Comfort Court, Madison, Wisconsin 53704 |
Spouse2BirthPlace |
String | 配偶者 2 の出生地 | ウィスコンシン |
DocumentNumber |
String | ドキュメント番号 | 01976/202 |
IssueDate |
日 | 証明書の発行日 | Oct. 10, 2023 |
IssuePlace |
String | 証明書の発行場所 | 2398 Echo Lane, Hastings, Michigan 49058 |
MarriageDate |
日 | 結婚日 | Oct. 10, 2023 |
MarriagePlace |
String | 結婚場所 | 105 Coal Street, Galloway, Wisconsin 54432 |
抽出された結婚証明書のキーと値のペアと行項目は、JSON 出力の documentResults
セクションにあります。
次のステップ
Document Intelligence Studio を使用して独自のフォームとドキュメントの処理を試す。
Document Intelligence クイックスタートを完了し、選択した開発言語でドキュメント処理アプリの作成を開始します。