Document Intelligence 結婚証明書モデル
このコンテンツの適用対象: v4.0 (プレビュー)
Document Intelligence 結婚証明書モデルでは、強力な光学式文字認識 (OCR) 機能を使用して、結婚証明書の主要なフィールドを分析して抽出します。 携帯電話でキャプチャされた画像、スキャンされたドキュメント、デジタル PDF など、さまざまな形式や品質の結婚証明書を使用できます。 API によってドキュメントのテキストが分析され、配偶者の名前、発行日、結婚場所などの主要な情報が抽出されて、構造化された JSON データ表現が返されます。 このモデルでは現在、英語のドキュメント形式がサポートされています。
結婚証明書の自動処理
結婚証明書の自動処理は、結婚証明書から主要なフィールドを抽出するプロセスです。 これまで、結婚証明書の分析プロセスは手動で行われてきたため、非常に時間がかかっていました。 結婚証明書からキー データを正確に抽出することは、通常、結婚証明書の自動化プロセスの最初に行われる最も重要な手順の 1 つです。
開発オプション
Document Intelligence v4.0 (2024-02-29-preview) では、次のツール、アプリケーション、ライブラリがサポートされています。
機能 | リソース | モデル ID |
---|---|---|
prebuilt-marriageCertificate.us | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-marriageCertificate.us |
入力の要件
最適な結果を得るには、ドキュメントごとに 1 つの鮮明な写真または高品質のスキャンを提供してください。
サポートされているファイル形式:
モデル PDF 画像:
JPEG/JPG、PNG、BMP、TIFF、HEIFMicrosoft Office:
Word (DOCX)、Excel (XLS)、PowerPoint (PPT)、HTML既読 ✔ ✔ ✔ Layout ✔ ✔ ✔ (2024-02-29-preview、2023-10-31-preview) 一般的なドキュメント ✔ ✔ 事前構築済み ✔ ✔ カスタム抽出 ✔ ✔ カスタム分類 ✔ ✔ ✔ (2024-02-29-preview) PDF および TIFF の場合、最大 2000 ページを処理できます (Free レベルのサブスクリプションでは、最初の 2 ページのみが処理されます)。
ドキュメントを分析するためのファイル サイズは、有料 (S0) レベルでは 500 MB、無料 (F0) レベルでは 4 MB です。
画像のディメンションは、50 x 50 ピクセルから 10,000 x 10,000 ピクセルの間である必要があります。
PDF がパスワードでロックされている場合は、送信前にロックを解除する必要があります。
抽出するテキストの最小の高さは、1024 x 768 ピクセルのイメージの場合は 12 ピクセルです。 このディメンションは、150 DPI (1 インチあたりのドット数) で約
8
ポイントのテキストに相当します。カスタム モデル トレーニングにおけるトレーニング データの最大ページ数は、カスタム テンプレート モデルの場合は 500、カスタム ニューラル モデルの場合は 50,000 です。
カスタム抽出モデル トレーニングにおけるトレーニング データの合計サイズは、テンプレート モデルの場合は 50 MB、ニューラル モデルの場合は 1GB です。
カスタム分類モデル トレーニングの場合、トレーニング データの合計サイズは
1GB
で、最大 10,000 ページです。
結婚証明書ドキュメント データの抽出を試みる
結婚証明書カード サービスのデータ抽出のしくみを確認するには、次のリソースが必要です。
Azure サブスクリプション - 無料で作成できます。
Azure portal の Document Intelligence Studio インスタンス。 Free 価格レベル (
F0
) を利用して、サービスを試用できます。 リソースがデプロイされたら、[リソースに移動] を選択してキーとエンドポイントを取得します。
Document Intelligence Studio
Document Intelligence Studio ホーム ページで、[Marriage Certificate] (結婚証明書) を選択します。
サンプルの結婚証明書を分析したり、自身のファイルをアップロードしたりできます。
分析実行 ボタンを選択し、必要に応じて 分析オプション を構成します:
サポートされている言語とロケール
以下の参照、サポートされている言語の完全なリストについては、 語サポート—の事前構築済みモデル ページをご覧ください。
フィールドの抽出
JSON 出力応答で結婚証明書から抽出されたフィールドを次に示します。
名前 | 種類 | 説明 | 出力例 |
---|---|---|---|
Spouse1FirstName |
String | 配偶者 1 の名 | Wesley |
Spouse1MiddleName |
String | 配偶者 1 のミドル ネーム | M. |
Spouse1LastName |
String | 配偶者 1 の姓 | Perry |
Spouse1Age |
整数型 | 配偶者 1 の年齢 | 26 |
Spouse1BirthDate |
日 | 配偶者 1 の生年月日 | Nov. 16, 1997 |
Spouse1Address |
番地 | 配偶者 1 の住所 | 4292 Don Jackson Lane, Bloomfield Township, Michigan 48302 |
Spouse1BirthPlace |
String | 配偶者 1 の出生地 | ミシガン |
Spouse2FirstName |
String | 配偶者 2 の名 | Beth |
Spouse2MiddleName |
String | 配偶者 2 のミドル ネーム | R. |
Spouse2LastName |
String | 配偶者 2 の姓 | Mason |
Spouse2Age |
整数型 | 配偶者 2 の年齢 | 23 |
Spouse2BirthDate |
日 | 配偶者 2 の生年月日 | Jul.22, 2000 |
Spouse2Address |
番地 | 配偶者 2 の住所 | 2671 Comfort Court, Madison, Wisconsin 53704 |
Spouse2BirthPlace |
String | 配偶者 2 の出生地 | ウィスコンシン |
DocumentNumber |
String | ドキュメント番号 | 01976/202 |
IssueDate |
日 | 証明書の発行日 | Oct. 10, 2023 |
IssuePlace |
String | 証明書の発行場所 | 2398 Echo Lane, Hastings, Michigan 49058 |
MarriageDate |
日 | 結婚日 | Oct. 10, 2023 |
MarriagePlace |
String | 結婚場所 | 105 Coal Street, Galloway, Wisconsin 54432 |
抽出された結婚証明書のキーと値のペアと行項目は、JSON 出力の documentResults
セクションにあります。
次のステップ
Document Intelligence Studio を使用して独自のフォームとドキュメントの処理を試す。
Document Intelligence クイックスタートを完了し、選択した開発言語でドキュメント処理アプリの作成を開始します。