ドキュメント インテリジェンス ID ドキュメント モデル

重要

  • Document Intelligence パブリック プレビュー リリースは、開発中の機能への早期アクセスを提供します。
  • 機能、アプローチ、およびプロセスは、一般提供 (GA) の前に、ユーザーからのフィードバックに基づいて変更される可能性があります。
  • Document Intelligence クライアント ライブラリのパブリック プレビュー バージョンは、REST API バージョン2024-02-29-preview にデフォルトで設定されます。
  • パブリック プレビュー バージョン 2024-02-29-preview は、現在、次の Azure リージョンでのみ使用できます。
  • 米国東部
  • 米国西部 2
  • "西ヨーロッパ"

このコンテンツの適用対象:checkmarkv4.0 (プレビュー) | 以前のバージョン:青のチェックマークv3.1 (GA)青のチェックマークv3.0 (GA)青のチェックマークv2.1 (GA)

このコンテンツの対象:checkmarkv3.1 (GA) | 最新バージョン:紫のチェックマークv4.0 (プレビュー) | 以前のバージョン:青のチェックマークv3.0青のチェックマークv2.1

このコンテンツの対象:checkmarkv3.0 (GA) | 最新バージョン:紫のチェックマークv4.0 (プレビュー)紫のチェックマークv3.1 | 以前のバージョン:青のチェックマークv2.1

このコンテンツの適用対象:checkmarkv2.1 | 最新バージョン:青のチェックマークv4.0 (プレビュー)

ドキュメント インテリジェンス ID ドキュメント (ID) モデルは、光学式文字認識 (OCR) とディープ ラーニング モデルを組み合わせて、ID ドキュメントから重要な情報を分析および抽出します。 API により、身分証明書 (以下を含む) を分析し、構造化された JSON データ表現を返します。

  • パスポートブック、世界中のパスポート カード
  • 米国、ヨーロッパ、インド、カナダ、オーストラリアの運転免許証
  • 米国の身分証明書、居住許可証 (グリーンカード)、社会保障カード、軍 ID
  • 欧州の身分証明書、居住許可証
  • インド PAN カード、アーダー カード
  • カナダの身分証明書、居住許可証(メープルカード)
  • オーストラリアの写真カード、キーパス ID (デジタル バージョンを含む)

ドキュメント インテリジェンスでは、 ドキュメント インテリジェンスの事前構築済み ID モデルを使用して、政府発行の身分証明書 (ID) から情報を分析および抽出できます。 強力な光学式文字認識 (OCR) 機能と ID 認識機能を組み合わせて、世界各国のパスポートと米国の運転免許証 (50 州すべてとワシントン D.C.) から重要な情報を抽出することができます。 ID API により、これらの ID ドキュメントから、名、姓、生年月日、ドキュメント番号などの重要な情報が抽出されます。 この API は、 ドキュメント インテリジェンス v2.1 でクラウド サービスとして使用できます。

身分証明書処理

身分証明書の処理では、本人確認書類からデータを手動または OCR ベースの技術で抽出します。 身分証明書の処理は、ID の証明を必要とするビジネス オペレーションの重要なステップです。 例としては、銀行やその他の金融機関での顧客検証、住宅ローンの申請、医療機関の受診、クレーム処理、サービス業などがあります。 個人は運転免許証、パスポート、その他の同様の書類を通じて本人確認を行うことで、企業がサービスや特典を提供する前に効率的に検証できるようにします。

ドキュメント インテリジェンス スタジオ処理された米国の運転免許証のサンプル

サンプルの運転免許証の画像。

データの抽出

事前構築済み ID サービスにより、世界各国のパスポートと米国の運転免許証から主要な値が抽出され、整理され、構造化された JSON 応答で返されます。

運転免許証の例

運転免許証のサンプル

パスポートの例

パスポートのサンプル

開発オプション

Document Intelligence v4.0 (2024-02-29-preview、2023-10-31-preview) では、次のツール、アプリケーション、ライブラリがサポートされています。

機能 リソース モデル ID
身分証明書モデル Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-idDocument

Document Intelligence v3.1 では、次のツール、アプリケーション、ライブラリがサポートされています。

機能 リソース モデル ID
身分証明書モデル Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-idDocument

ドキュメント インテリジェンス v3.0 では、次のツール、アプリケーション、およびライブラリがサポートされています:

機能 リソース モデル ID
身分証明書モデル Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-idDocument

Document Intelligence v2.1 では、次のツール、アプリケーション、ライブラリがサポートされています。

機能 リソース
身分証明書モデル Document Intelligence ラベル付けツール
REST API
クライアント ライブラリ SDK
Document Intelligence Docker コンテナー

入力の要件

  • 最適な結果を得るには、ドキュメントごとに 1 つの鮮明な写真または高品質のスキャンを提供してください。

  • サポートされているファイル形式:

    モデル PDF 画像:
    JPEG/JPG、PNG、BMP、TIFF、HEIF
    Microsoft Office:
    Word (DOCX)、Excel (XLS)、PowerPoint (PPT)、HTML
    既読
    Layout ✔ (2024-02-29-preview、2023-10-31-preview)
    一般的なドキュメント
    事前構築済み
    カスタム抽出
    カスタム分類 ✔ (2024-02-29-preview)
  • PDF および TIFF の場合、最大 2000 ページを処理できます (Free レベルのサブスクリプションでは、最初の 2 ページのみが処理されます)。

  • ドキュメントを分析するためのファイル サイズは、有料 (S0) レベルでは 500 MB、無料 (F0) レベルでは 4 MB です。

  • 画像のディメンションは、50 x 50 ピクセルから 10,000 x 10,000 ピクセルの間である必要があります。

  • PDF がパスワードでロックされている場合は、送信前にロックを解除する必要があります。

  • 抽出するテキストの最小の高さは、1024 x 768 ピクセルのイメージの場合は 12 ピクセルです。 このディメンションは、150 DPI (1 インチあたりのドット数) で約 8 ポイントのテキストに相当します。

  • カスタム モデル トレーニングにおけるトレーニング データの最大ページ数は、カスタム テンプレート モデルの場合は 500、カスタム ニューラル モデルの場合は 50,000 です。

    • カスタム抽出モデル トレーニングにおけるトレーニング データの合計サイズは、テンプレート モデルの場合は 50 MB、ニューラル モデルの場合は 1GB です。

    • カスタム分類モデル トレーニングの場合、トレーニング データの合計サイズは 1GB で、最大 10,000 ページです。

  • サポートされているファイル形式: JPEG、PNG、PDF、TIFF。

  • PDF および TIFF ファイルのサポートされるページ数: 最大 2,000 ページ、または Free レベルのサブスクライバーの場合は最初の 2 ページのみ。

  • サポートされるファイル サイズ: 合計 50 MB 未満、最小ピクセル数: 50 x 50 px、最大ピクセル数: 10,000 x 10,000 px。

ID ドキュメント モデルのデータ抽出

名前、生年月日、有効期限などのデータを身分証明書から抽出します。 以下のリソースが必要です。

Azure portal のキーとエンドポイントの場所のスクリーンショット。

Note

ドキュメント インテリジェンス スタジオは、v3.1 および v3.0 API 以降のバージョンで使用できます。

  1. Document Intelligence Studio ホーム ページで、[Identity documents] (身分証明書) を選択します。

  2. サンプル請求書を分析したり、独自のファイルをアップロードしたりできます。

  3. 分析実行 ボタンを選択し、必要に応じて 分析オプション を構成します:

    Document Intelligence Studio の [分析の実行] と [分析オプション] ボタンのスクリーンショット。

ドキュメント インテリジェンス サンプル ラベル付けツール

  1. Document Intelligence サンプル ツールに移動します。

  2. サンプル ツールのホーム ページで、[事前構築済みモデルを使用してデータを取得する] タイルを選択します。

    レイアウト モデルの分析結果操作のスクリーンショット。

  3. ドロップダウン メニューから、分析する [フォームの種類] を選択します。

  4. 次のオプションを使用して、分析するファイルの URL を選択します。

  5. [ソース] フィールドで、ドロップダウン メニューから [URL] を選択し、選択した URL を貼り付けて、[フェッチ] ボタンを選択します。

    ソースの場所ドロップダウン メニューのスクリーンショット。

  6. [Document Intelligence サービス エンドポイント] フィールドに、Document Intelligence サブスクリプションで取得したエンドポイントを貼り付けます。

  7. [キー] フィールドに、Document Intelligence リソースから取得したキーを貼り付けます。

    [ドキュメントの種類を選択] ドロップダウン メニューのスクリーンショット。

  8. [Run analysis](解析の実行) を選択します。 ドキュメント インテリジェンス サンプル ラベル付けツールは Analyze Prebuilt API を呼び出してドキュメントを分析します。

  9. 結果を表示する - 抽出されたキーと値のペア、行項目、抽出された強調表示テキスト、および検出されたテーブルを確認します。

    身分証明モデルの分析結果操作のスクリーンショット。

  10. JSON 出力ファイルをダウンロードして、詳細なレイアウト結果を表示します。

    • "readResults" ノードには、あらゆるテキスト行が、ページ上の対応する境界ボックスの配置と共に表示されます。
    • "selectionMarks" ノードには、すべての選択マーク (チェック ボックス、ラジオ マーク) と、その状態が選択済み未選択のどちらであるかが示されます。
    • 抽出された表は、"pageResults" セクションに含まれています。 ドキュメント インテリジェンスでは、各テーブルについて、テキスト、行インデックス、列インデックス、行スパン、列スパン、境界ボックスなどが抽出されます。
    • "documentResults" フィールドには、キーと値のペアの情報と、ドキュメントの最も関連性の高い部分の行項目の情報が含まれます。

Note

サンプル ラベル付けツールでは、BMP ファイル形式はサポートされていません。 これは、Document Intelligence サービスではなくツールの制限です。

[サポートされているドキュメントの種類]

リージョン ドキュメント タイプ
世界全域 旅券手帳、パスポート カード
アメリカ合衆国 運転免許証、ID カード、居住許可証 (グリーン カード)、社会保障カード、軍 ID
ヨーロッパ 運転免許証、ID カード、居住許可証
インド 運転免許証、PAN カード、Aadhaar カード
カナダ 運転免許証、ID カード、居住許可証 (Maple カード)
オーストラリア 運転免許証、フォト カード、Key-pass ID (デジタル版を含む)

フィールドの抽出

ドキュメントの種類ごとに抽出されるフィールドを次に示します。 ドキュメント インテリジェンス ID モデル prebuilt-idDocument では、documents.*.fields 内の次のフィールドが抽出されます。 json 出力には、ドキュメントから抽出されたすべてのテキスト、単語、行、スタイルが含まれます。

idDocument.driverLicense

フィールド タイプ 説明設定
CountryRegion countryRegion 国またはリージョン コード 米国
Region string 都道府県 ワシントン
DocumentNumber string 運転免許証番号 WDLABCD456DG
DocumentDiscriminator string 運転免許証のドキュメント識別子 12645646464554646456464544
FirstName string 該当する場合は、名とミドル ネームのイニシャル LIAM R.
LastName string Surname TALBOT
Address address Address 123 番地、市区町村、WA 99999-1234
DateOfBirth date 生年月日 1958/06/01
DateOfExpiration date 有効期限 2020/12/08
DateOfIssue date 発行日 2012/12/08
EyeColor string 目の色
HairColor string 髪の色 ブラウン
Height string Height 5'11"
Weight string Weight 185LB
Sex string Sex M
Endorsements string 保証 L
Restrictions string 制限 B
VehicleClassifications string 車両分類 D

idDocument.passport

フィールド タイプ 説明設定
DocumentNumber string Passport number 340020013
FirstName string 該当する場合は、名とミドル ネームのイニシャル JENNIFER
MiddleName string 名と姓の間の名前 REYES
LastName string Surname BROOKS
Aliases array
Aliases.* string 別名 MAT LIN
DateOfBirth date 生年月日 1980-01-01
DateOfExpiration date 有効期限 2019-05-05
DateOfIssue date 発行日 2014-05-06
Sex string Sex F
CountryRegion countryRegion 発行元の国または組織 米国
DocumentType string ドキュメントの種類 P
Nationality countryRegion Nationality 米国
PlaceOfBirth string 出生地 マサチューセッツ州 (米国)
PlaceOfIssue string 発行地 LISBON
IssuingAuthority string 発行機関 米国国務省
PersonalNumber string 個人 ID。 いいえ。 A234567893
MachineReadableZone object 機械読み取り可能ゾーン (MRZ) P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816
MachineReadableZone.FirstName string 該当する場合は、名とミドル ネームのイニシャル JENNIFER
MachineReadableZone.LastName string Surname BROOKS
MachineReadableZone.DocumentNumber string Passport number 340020013
MachineReadableZone.CountryRegion countryRegion 発行元の国または組織 米国
MachineReadableZone.Nationality countryRegion Nationality 米国
MachineReadableZone.DateOfBirth date 生年月日 1980-01-01
MachineReadableZone.DateOfExpiration date 有効期限 2019-05-05
MachineReadableZone.Sex string Sex F

idDocument.nationalIdentityCard

フィールド タイプ 説明設定
CountryRegion countryRegion 国またはリージョン コード 米国
Region string 都道府県 ワシントン
DocumentNumber string 国民身分証明書番号 WDLABCD456DG
DocumentDiscriminator string 国民身分証明書番号ドキュメントの識別子 12645646464554646456464544
FirstName string 該当する場合は、名とミドル ネームのイニシャル LIAM R.
LastName string Surname TALBOT
Address address Address 123 番地、市区町村、WA 99999-1234
DateOfBirth date 生年月日 1958/06/01
DateOfExpiration date 有効期限 2020/12/08
DateOfIssue date 発行日 2012/12/08
EyeColor string 目の色
HairColor string 髪の色 BROWN
Height string Height 5'11"
Weight string Weight 185LB
Sex string Sex M

idDocument.residencePermit

フィールド タイプ 説明設定
CountryRegion countryRegion 国またはリージョン コード 米国
DocumentNumber string 居住許可番号 WDLABCD456DG
FirstName string 該当する場合は、名とミドル ネームのイニシャル LIAM R.
LastName string Surname TALBOT
DateOfBirth date 生年月日 1958/06/01
DateOfExpiration date 有効期限 2020/12/08
DateOfIssue date 発行日 2012/12/08
Sex string Sex M
PlaceOfBirth string 出生地 ドイツ
Category string 許可カテゴリ DV2
Address string アドレス 123 番地、市区町村、WA 99999-1234

idDocument.usSocialSecurityCard

フィールド タイプ 説明設定
DocumentNumber string 社会保障カード番号 WDLABCD456DG
FirstName string 該当する場合は、名とミドル ネームのイニシャル LIAM R.
LastName string Surname TALBOT
DateOfIssue date 発行日 2012/12/08

idDocument

フィールド タイプ 説明設定
Address address Address 123 番地、市区町村、WA 99999-1234
DocumentNumber string 運転免許証番号 WDLABCD456DG
FirstName string 該当する場合は、名とミドル ネームのイニシャル LIAM R.
LastName string Surname TALBOT
DateOfBirth date 生年月日 1958/06/01
DateOfExpiration date 有効期限 2020/12/08

サポート ドキュメントの種類

ID ドキュメント モデルは現在、米国の運転免許証と、国際パスポート (ビザやその他の渡航書類を除く) の抽出からの経歴ページをサポートしています。

抽出されるフィールド

名前 種類 説明
country ISO 3166 標準に準拠した国番号 "USA"
DateOfBirth date YYYY-MM-DD 形式の DOB "1980-01-01"
DateOfExpiration date YYYY-MM-DD 形式の有効期限日 "2019-05-05"
DocumentNumber string 関連するパスポート番号、運転免許証番号など "340020013"
FirstName string 該当する場合は、抽出された名とミドルネームのイニシャル "JENNIFER"
LastName string 抽出された姓 "BROOKS"
Nationality country ISO 3166 標準に準拠した国番号 "USA"
Sex 性別 抽出される可能性がある値には、"M"、"F"、"X" が含まれます "F"
MachineReadableZone object それぞれ 44 文字の 2 行を含む抽出されたパスポート MRZ "P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816"
DocumentType string ドキュメントの種類 (例: パスポート、運転免許証) "passport"
Address string 抽出された住所 (運転免許証) "123 STREET ADDRESS YOUR CITY WA 99999-1234"
リージョン string 抽出された地域、州、都道府県など (運転免許証のみ) "Washington"

移行ガイド

次のステップ