共用方式為


文件智慧服務身分證文件模型

重要

  • 文件智慧服務公開預覽版本可供您搶先試用在開發期間的功能。
  • 根據使用者意見反應,功能、方法和流程在正式發行 (GA) 前可能有所變更。
  • 文件智慧服務用戶端程式庫的公開預覽版本預設為 REST API 版本 2024-02-29-preview
  • 公開預覽版本 2024-02-29-preview 目前僅適用於下列 Azure 區域:
  • 美國東部
  • 美國西部 2
  • 西歐

此內容適用於: 勾選記號 v4.0 (預覽版) | 舊版: blue-checkmark v3.1 (GA) blue-checkmark v3.0 (GA) blue-checkmark v2.1 (GA)

此內容適用於: 勾選記號 v3.1 (GA) | 最新版本: 紫色-核取記號 v4.0 (預覽版) | 舊版: blue-checkmark v3.0 blue-checkmark v2.1

此內容適用於: 勾選記號 v3.0 (GA) | 最新版本: 紫色-核取記號 v4.0 (預覽版) 紫色-核取記號 v3.1 | 舊版: blue-checkmark v2.1

此內容適用於: 勾選記號 v2.1 | 最新版本: blue-checkmark v4.0 (預覽版)

文件智慧服務身分證文件 (ID) 模型將光學字元辨識 (OCR) 與深度學習模型結合,從身分識別文件中分析和擷取重要的資訊。 API 分析身分識別文件 (包括以下內容) 並傳回結構化 JSON 資料表示:

  • 全球護照本、護照卡
  • 美國、歐洲、印度、加拿大、澳洲的駕照
  • 美國身分證、居留證 (綠卡)、社會安全卡、軍警證件
  • 歐洲身分證、居留證
  • 印度 PAN 卡、Aadhaar 卡
  • 加拿大身分證、居留證 (楓葉卡)
  • 澳洲身分證、key-pass ID (包括數位版)

文件智慧服務可以使用預建的證件模型,分析和擷取政府核發的身分識別文件 (ID) 資訊。 其結合了強大的光學字元辨識 (OCR) 功能與 ID 辨識功能,可擷取全球護照和美國駕照 (全部 50 個州和哥倫比亞特區) 上的重要資訊。 ID API 會從這些身分證明文件中擷取重要的資訊,例如名字、姓氏、出生日期、文件編號等。 此 API 在文件智慧服務 v2.1 中作為雲端服務提供。

身分識別文件處理

身分識別文件處理需手動擷取或使用 OCR 型技術來擷取身分識別文件中的資料。 ID 文件處理是任何需要身分證明的商務作業中一個重要的步驟。 例如銀行和其他金融機構中的客戶驗證、抵押申請、就醫、索賠處理、餐旅業等。 人們會透過駕照、護照及其他類似文件提供身分證明,讓企業可以在有效率地驗證後提供服務和權益。

美國樣本透過文件智慧服務工作室處理的駕照

駕照樣本的影像。

資料擷取

預先建置的 ID 服務會從全球護照和美國駕照中擷取機碼值,並在有組織的結構化 JSON 回應中傳回這些值。

駕照範例

駕照樣本

護照範例

護照樣本

開發選項

文件智慧服務 v4.0 (2024-02-29-preview、2023-10-31-preview) 支援下列工具、應用程式和程式庫:

功能 資源 Model ID
識別碼文件模型 文件智慧服務工作室
REST API
C# SDK
Python SDK
JAVA SDK
JavaScript SDK
prebuilt-idDocument

文件智慧服務 v3.1 支援下列工具、應用程式和程式庫:

功能 資源 Model ID
識別碼文件模型 文件智慧服務工作室
REST API
C# SDK
Python SDK
JAVA SDK
JavaScript SDK
prebuilt-idDocument

文件智慧服務 v3.0 支援下列工具、應用程式和程式庫:

功能 資源 Model ID
識別碼文件模型 文件智慧服務工作室
REST API
C# SDK
Python SDK
JAVA SDK
JavaScript SDK
prebuilt-idDocument

文件智慧服務 v2.1 支援下列工具、應用程式和程式庫:

功能 資源
識別碼文件模型 文件智慧服務標記工具
REST API
用戶端-程式庫 SDK
文件智慧服務 Docker 容器

輸入需求

  • 若要得到最佳結果,請為每個文件提供一張清晰的照片或高畫質的掃描檔案。

  • 支援的檔案格式:

    模型 PDF 影像:
    JPEG/JPG、PNG、BMP、TIFF、HEIF
    Microsoft Office:
    Word (DOCX)、Excel (XLSX)、PowerPoint (PPTX)、HTML
    參閱
    版面配置 ✔ (2024-02-29-preview、2023-10-31-preview)
    一般文件
    預建
    自訂擷取
    自訂分類 ✔ (2024-02-29-preview)
  • 若使用 PDF 和 TIFF,最多可處理 2000 頁 (若使用免費層訂閱,則只會處理前兩頁)。

  • 分析文件的檔案大小付費 (S0) 服務層級為 500 MB,而免費 (F0) 服務層級為 4 MB。

  • 影像維度必須介於 50 x 50 像素和 10,000 x 10,000 像素之間。

  • 如果您的 PDF 有密碼鎖定,則必須先移除鎖定才能提交。

  • 針對 1024 x 768 像素影像的擷取文字高度下限為 12 像素。 此尺寸在 150 點/英吋 (DPI) 時大約相當於 8 點文字。

  • 針對自訂模型定型,自訂範本模型的定型資料頁數上限為 500,而自訂神經網路模型的上限則為 50,000。

    • 針對自訂擷取模型定型,範本模型的定型資料大小總計為 50 MB,而神經模型的大小總計則為 1G-MB。

    • 針對自訂分類模型定型,定型資料的大小總計為 1GB (上限為 10,000 頁)。

  • 支援的檔案格式有:JPEG、PNG、PDF、TIFF。

  • PDF 和 TIFF 檔案支援的頁數:最多 2,000 頁,或免費服務層級訂閱者只有前兩頁。

  • 支援的檔案大小:總計小於 50 MB; 最小像素:50 x 50 像素; 最大像素 10,000 x 10,000 像素。

ID 文件模型資料擷取

擷取 ID 文件中的資料,包括姓名、出生日期以及到期日。 您需要下列資源:

Azure 入口網站中金鑰與端點位置的螢幕擷取畫面。

注意

文件智慧服務工作室有 v3.1 和 v3.0 API 及更高版本可供使用。

  1. 在 [文件智慧服務工作室] 首頁上,選取 [身分識別文件]

  2. 您可以分析範例發票,或上傳您自己的檔案。

  3. 選取 [執行分析] 按鈕,並視需要設定 [分析選項]

    螢幕擷取畫面顯示在文件智慧服務工作室中的 [執行分析] 和 [分析選項] 按鈕。

文件智慧服務範例標籤工具

  1. 瀏覽至 Document Intelligence 範例工具

  2. 在範例工具首頁上,選取 [使用預建模型來取得資料] 圖格。

    版面配置模型分析結果作業的螢幕擷取畫面。

  3. 從下拉式功能表選取要分析的 [表單類型]

  4. 從下列選項中選擇您想要分析的檔案 URL:

  5. 在 [來源] 欄位中,從下拉式功能表中選取 [URL],貼上選取的 URL,然後選取 [擷取] 按鈕。

    來源位置下拉式功能表的螢幕擷取畫面。

  6. 在 [文件智慧服務端點] 欄位中,貼上您透過文件智慧服務訂用帳戶取得的端點。

  7. 在 [金鑰] 欄位中,貼上您從文件智慧服務資源取得的金鑰。

    選取文件類型下拉式功能表的螢幕擷取畫面。

  8. 選取 [Run analysis] (執行分析)。 文件智慧範例標籤工具會呼叫分析預建 API 並分析文件。

  9. 檢視結果:查看擷取的索引鍵/值組、明細項目、擷取的醒目提示文字和偵測到的資料表。

    螢幕擷取畫面顯示身分識別模型分析結果作業。

  10. 下載 JSON 輸出檔案以檢視詳細結果。

    • [readResults] 節點包含每一行文字,以及各自的周框方塊在頁面上的位置。
    • [selectionMarks] 節點顯示每個選取標記 (核取方塊、選項標記),以及其狀態是已選取未選取
    • [pageResults] 區段包含擷取的資料表。 針對每個資料表,文件智慧服務擷取文字、資料列和欄索引、資料列和資料行跨度、週框方塊等。
    • [documentResults] 欄位包含文件最相關部分的索引鍵/值組資訊和明細項目資訊。

注意

範例標記工具不支援 BMP 檔案格式。 這是工具的限制,而不是 Document Intelligence 服務的限制。

支援的文件類型

區域 文件類型
全球 護照本、護照卡
美國 駕照、身分證、居留證 (綠卡)、社會安全號碼、軍警證件
歐洲 駕照、身分證、居留證
印度 駕照、PAN 卡、Aadhaar 卡片
Canada 駕照、身分證、居留證 (楓葉卡)
澳大利亞 駕照、身分證、Key-pass ID (包括數位版)

欄位擷取

以下是每個文件類型擷取的欄位。 文件智慧服務身分證模型 prebuilt-idDocument 擷取 documents.*.fields 中的以下欄位。 json 輸出包括文件中擷取的所有文字、字組、行和樣式。

idDocument.driverLicense

欄位 類型 描述 範例
CountryRegion countryRegion 國家或地區代碼 USA
Region string 縣/市 華盛頓州
DocumentNumber string 駕照號碼 WDLABCD456DG
DocumentDiscriminator string 駕照文件鑑別子 12645646464554646456464544
FirstName string 名字和中間名 (如適用) LIAM R.
LastName string Surname TALBOT
Address address 位址 123 STREET ADDRESS YOUR CITY WA 99999-1234
DateOfBirth date 生日 01/06/1958
DateOfExpiration date 到期日 08/12/2020
DateOfIssue date 核發日期 08/12/2012
EyeColor string 眼球色彩 藍色
HairColor string 頭髮顏色 棕色
Height string 5'11"
Weight string Weight 185LB
Sex string 性別
Endorsements string 認可 L
Restrictions string 限制 B
VehicleClassifications string 車輛分類 D

idDocument.passport

欄位 類型 描述 範例
DocumentNumber string 護照號碼 340020013
FirstName string 名字和中間名 (如適用) JENNIFER
MiddleName string 名字和姓氏之間的名稱 REYES
LastName string Surname BROOKS
Aliases array
Aliases.* string 也稱為 MAT LIN
DateOfBirth date 生日 1980-01-01
DateOfExpiration date 到期日 2019-05-05
DateOfIssue date 核發日期 2014-05-06
Sex string 性別 F
CountryRegion countryRegion 核發國家或組織 USA
DocumentType string Document type P
Nationality countryRegion 國籍 USA
PlaceOfBirth string 出生地 MASSACHUSETTS, U.S.A.
PlaceOfIssue string 核發地點 里斯本
IssuingAuthority string 核發單位 美國國務院
PersonalNumber string 個人身分證 否。 A234567893
MachineReadableZone object 可由電腦判讀的區域 (MRZ) P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816
MachineReadableZone.FirstName string 名字和中間名 (如適用) JENNIFER
MachineReadableZone.LastName string Surname BROOKS
MachineReadableZone.DocumentNumber string 護照號碼 340020013
MachineReadableZone.CountryRegion countryRegion 核發國家或組織 USA
MachineReadableZone.Nationality countryRegion 國籍 USA
MachineReadableZone.DateOfBirth date 生日 1980-01-01
MachineReadableZone.DateOfExpiration date 到期日 2019-05-05
MachineReadableZone.Sex string 性別 F

idDocument.nationalIdentityCard

欄位 類型 描述 範例
CountryRegion countryRegion 國家或地區代碼 USA
Region string 縣/市 華盛頓州
DocumentNumber string 國家身分證字號 WDLABCD456DG
DocumentDiscriminator string 國家身分證文件鑑別子 12645646464554646456464544
FirstName string 名字和中間名 (如適用) LIAM R.
LastName string Surname TALBOT
Address address 位址 123 STREET ADDRESS YOUR CITY WA 99999-1234
DateOfBirth date 生日 01/06/1958
DateOfExpiration date 到期日 08/12/2020
DateOfIssue date 核發日期 08/12/2012
EyeColor string 眼球色彩 藍色
HairColor string 頭髮顏色 褐色
Height string 5'11"
Weight string Weight 185LB
Sex string 性別

idDocument.residencePermit

欄位 類型 描述 範例
CountryRegion countryRegion 國家或地區代碼 USA
DocumentNumber string 居留證號碼 WDLABCD456DG
FirstName string 名字和中間名 (如適用) LIAM R.
LastName string Surname TALBOT
DateOfBirth date 生日 01/06/1958
DateOfExpiration date 到期日 08/12/2020
DateOfIssue date 核發日期 08/12/2012
Sex string 性別
PlaceOfBirth string 出生地 德國
Category string 許可類別 DV2
Address string 位址 123 STREET ADDRESS YOUR CITY WA 99999-1234

idDocument.usSocialSecurityCard

欄位 類型 描述 範例
DocumentNumber string 社會安全卡號碼 WDLABCD456DG
FirstName string 名字和中間名 (如適用) LIAM R.
LastName string Surname TALBOT
DateOfIssue date 核發日期 08/12/2012

idDocument

欄位 類型 描述 範例
Address address 位址 123 STREET ADDRESS YOUR CITY WA 99999-1234
DocumentNumber string 駕照號碼 WDLABCD456DG
FirstName string 名字和中間名 (如適用) LIAM R.
LastName string Surname TALBOT
DateOfBirth date 生日 01/06/1958
DateOfExpiration date 到期日 08/12/2020

支援的文件類型

身份證文件模型目前支援從國際護照 (不包括簽證和其他旅行證件) 中擷取美國駕照和個人資料頁。

擷取的欄位

名稱 類型​​ 描述
國家/地區 國家/地區 符合 ISO 3166 標準的國碼 (地區碼) "USA"
DateOfBirth date YYYY-MM-DD 格式的 DOB "1980-01-01"
DateOfExpiration date YYYY-MM-DD 格式的到期日 "2019-05-05"
DocumentNumber string 相關的護照號碼、駕照號碼等等 "340020013"
FirstName string 擷取的名字和中間名 (如適用) "JENNIFER"
LastName string 擷取的姓氏 "BROOKS"
國籍 國家/地區 符合 ISO 3166 標準的國碼 (地區碼) "USA"
性別 性別 可能的擷取值包括「M」「F」「X」 "F"
MachineReadableZone object 擷取的護照 MRZ 包含兩行,各 44 個字元 "P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816"
DocumentType string 文件類型,例如,護照、駕照 "passport"
位址 string 擷取的地址 (僅限駕照) "123 STREET ADDRESS YOUR CITY WA 99999-1234"
區域 string 擷取區域、州、省等(僅限駕照) "Washington"

移轉指南

下一步