文件智慧服務身分證文件模型

發行項
10/17/2024

重要

文件智慧服務公開預覽版本可讓您搶先存取正在積極開發的功能。根據使用者意見反應，功能、方法和流程在正式發行 (GA) 前可能有所變更。
文件智慧服務用戶端程式庫的公開預覽版預設為 REST API 版本 2024-07-31-preview。
公開預覽版 2024-07-31-preview 目前僅適用於下列 Azure 地區。請注意，AI Studio 中的自訂生成 (文件欄位擷取) 模型僅適用美國中北部地區：
- 美國東部
- 美國西部 2
- 西歐
- 美國中北部

此內容適用於： v4.0 (預覽版) | 舊版： v3.1 (GA) v3.0 (GA) v2.1 (GA)

此內容適用於： v3.1 (GA) | 最新版本： v4.0 (預覽版) | 舊版： v3.0 v2.1

此內容適用於： v3.0 (GA) | 最新版本： v4.0 (預覽版) v3.1 | 舊版： v2.1

此內容適用於： v2.1 | 最新版本： v4.0 (預覽版)

文件智慧服務身分證文件 (ID) 模型將光學字元辨識 (OCR) 與深度學習模型結合，從身分識別文件中分析和擷取重要的資訊。 API 分析身分識別文件 (包括以下內容) 並傳回結構化 JSON 資料表示：

全球護照本、護照卡
美國、歐洲、印度、加拿大、澳洲的駕照
美國身分證、居留證 (綠卡)、社會安全卡、軍警證件
歐洲身分證、居留證
印度 PAN 卡、Aadhaar 卡
加拿大身分證、居留證 (楓葉卡)
澳洲身分證、key-pass ID (包括數位版)

文件智慧服務可以使用預建的證件模型，分析和擷取政府核發的身分識別文件 (ID) 資訊。其結合了強大的光學字元辨識 (OCR) 功能與 ID 辨識功能，可擷取全球護照和美國駕照 (全部 50 個州和哥倫比亞特區) 上的重要資訊。 ID API 會從這些身分證明文件中擷取重要的資訊，例如名字、姓氏、出生日期、文件編號等。此 API 在文件智慧服務 v2.1 中作為雲端服務提供。

身分識別文件處理

身分識別文件處理需手動擷取或使用 OCR 型技術來擷取身分識別文件中的資料。 ID 文件處理是任何需要身分證明的商務作業中一個重要的步驟。例如銀行和其他金融機構中的客戶驗證、抵押申請、就醫、索賠處理、餐旅業等。人們會透過駕照、護照及其他類似文件提供身分證明，讓企業可以在有效率地驗證後提供服務和權益。

美國樣本透過文件智慧服務工作室處理的駕照

駕照樣本的影像。

資料擷取

預先建置的 ID 服務會從全球護照和美國駕照中擷取機碼值，並在有組織的結構化 JSON 回應中傳回這些值。

駕照範例

駕照樣本

護照範例

護照樣本

開發選項

文件智慧服務 v4.0 (2024-07-31-preview) 支援以下工具、應用程式和程式庫：

功能	資源	Model ID
識別碼文件模型	• 文件智慧服務工作室 • REST API • C# SDK • Python SDK • JAVA SDK • JavaScript SDK	prebuilt-idDocument

文件智慧服務 v3.1 支援下列工具、應用程式和程式庫：

功能	資源	Model ID
識別碼文件模型	• 文件智慧服務工作室 • REST API • C# SDK • Python SDK • JAVA SDK • JavaScript SDK	prebuilt-idDocument

文件智慧服務 v3.0 支援下列工具、應用程式和程式庫：

功能	資源	Model ID
識別碼文件模型	• 文件智慧服務工作室 • REST API • C# SDK • Python SDK • JAVA SDK • JavaScript SDK	prebuilt-idDocument

文件智慧服務 v2.1 支援下列工具、應用程式和程式庫：

功能	資源
識別碼文件模型	• 文件智慧服務標記工具 • REST API • 用戶端-程式庫 SDK • 文件智慧服務 Docker 容器

輸入需求

支援的檔案格式：

模型	PDF	影像： `JPEG/JPG`、`PNG`、`BMP`、`TIFF`、`HEIF`	Microsoft Office： Word (`DOCX`)、Excel (`XLSX`)、PowerPoint (`PPTX`)、HTML
參閱	✔	✔	✔
版面配置	✔	✔	✔ (2024-07-31-preview、2024-02-29-preview、2023-10-31-preview)
一般文件	✔	✔
預建	✔	✔
自訂擷取	✔	✔
自訂分類	✔	✔	✔ (2024-07-31-preview、2024-02-29-preview)

若要得到最佳結果，請為每個文件提供一張清晰的照片或高畫質的掃描檔案。
若使用 PDF 和 TIFF，最多可處理 2,000 頁 (若使用免費層訂閱，則只會處理前兩頁)。
付費 (S0) 層分析文件的檔案大小為 500 MB，免費 (F0) 層則為 4 MB。
影像維度必須介於 50 像素 x 50 像素和 10,000 像素 x 10,000 像素之間。
如果您的 PDF 有密碼鎖定，則必須先移除鎖定才能提交。
針對 1024 x 768 像素影像的擷取文字高度下限為 12 像素。此維度在 150 點/英吋 (DPI) 時大約相當於 8 點文字。
針對自訂模型定型，自訂範本模型的定型資料頁數上限為 500，而自訂神經網路模型的上限則為 50,000。
- 對於自訂擷取模型定型，範本模型的定型資料大小總計為 50 MB，而神經模型的大小總計則為 1 GB。
- 針對自訂分類模型定型，定型資料的大小總計為 1 GB (上限為 10,000 頁)。對於 2024-07-31-preview 和更新版本，定型資料的大小總計為 2 GB，最多 10,000 頁。

支援的檔案格式有：JPEG、PNG、PDF、TIFF。
PDF 和 TIFF 檔案支援的頁數：最多 2,000 頁，或免費服務層級訂閱者只有前兩頁。
支援的檔案大小：總計小於 50 MB; 最小像素：50 x 50 像素; 最大像素 10,000 x 10,000 像素。

ID 文件模型資料擷取

擷取 ID 文件中的資料，包括姓名、出生日期以及到期日。您需要下列資源：

一個 Azure 訂用帳戶 - 您可以建立一個免費訂用帳戶。
Azure 入口網站中的 Document Intelligence 執行個體。您可以使用免費定價層 (F0) 來試用服務。部署資源後，選取 [前往資源] 以取得金鑰和端點。

Azure 入口網站中金鑰與端點位置的螢幕擷取畫面。

注意

文件智慧服務工作室有 v3.1 和 v3.0 API 及更高版本可供使用。

在文件智慧服務工作室首頁上，選取 [身分識別文件]。
您可以分析範例發票，或上傳您自己的檔案。
選取 [執行分析] 按鈕，並視需要設定 [分析選項]：

試用文件智慧服務工作室。

文件智慧服務範例標籤工具

瀏覽至 Document Intelligence 範例工具。
在範例工具首頁上，選取 [使用預建模型來取得資料] 圖格。
從下拉式功能表選取要分析的 [表單類型]。
從下列選項中選擇您想要分析的檔案 URL：
- 範例發票文件。
- 範例身分證明文件。
- 範例收據影像。
- 範例名片影像。
在 [來源] 欄位中，從下拉式功能表中選取 [URL]，貼上選取的 URL，然後選取 [擷取] 按鈕。
在 [文件智慧服務端點] 欄位中，貼上您透過文件智慧服務訂用帳戶取得的端點。
在 [金鑰] 欄位中，貼上您從文件智慧服務資源取得的金鑰。
選取 [Run analysis] (執行分析)。文件智慧範例標籤工具會呼叫分析預建 API 並分析文件。
檢視結果：查看擷取的索引鍵/值組、明細項目、擷取的醒目提示文字和偵測到的資料表。
下載 JSON 輸出檔案以檢視詳細結果。
- [readResults] 節點包含每一行文字，以及各自的周框方塊在頁面上的位置。
- [selectionMarks] 節點顯示每個選取標記 (核取方塊、選項標記)，以及其狀態是已選取或未選取。
- [pageResults] 區段包含擷取的資料表。針對每個資料表，文件智慧服務擷取文字、資料列和欄索引、資料列和資料行跨度、週框方塊等。
- [documentResults] 欄位包含文件最相關部分的索引鍵/值組資訊和明細項目資訊。

注意

範例標記工具不支援 BMP 檔案格式。這是工具的限制，而不是 Document Intelligence 服務的限制。

支援的文件類型

區域	文件類型
全球	護照本、護照卡
美國	駕照、身分證、居留證 (綠卡)、社會安全號碼、軍警證件
歐洲	駕照、身分證、居留證
印度	駕照、PAN 卡、Aadhaar 卡片
Canada	駕照、身分證、居留證 (楓葉卡)
澳大利亞	駕照、身分證、Key-pass ID (包括數位版)

欄位擷取

如需支持的檔擷取欄位，請參閱 GitHub 範例存放庫中的標識碼檔模型架構頁面。

支援的文件類型

身份證文件模型目前支援從國際護照 (不包括簽證和其他旅行證件) 中擷取美國駕照和個人資料頁。

擷取的欄位

名稱	類型	描述	值
國家/地區	國家/地區	符合 ISO 3166 標準的國碼 (地區碼)	"USA"
DateOfBirth	date	YYYY-MM-DD 格式的 DOB	"1980-01-01"
DateOfExpiration	date	YYYY-MM-DD 格式的到期日	"2019-05-05"
DocumentNumber	string	相關的護照號碼、駕照號碼等等	"340020013"
FirstName	string	擷取的名字和中間名 (如適用)	"JENNIFER"
LastName	string	擷取的姓氏	"BROOKS"
國籍	國家/地區	符合 ISO 3166 標準的國碼 (地區碼)	"USA"
性別	性別	可能的擷取值包括「M」「F」「X」	"F"
MachineReadableZone	object	擷取的 Passport `MRZ` 包含兩行 44 個字元	"P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816"
DocumentType	string	文件類型，例如，護照、駕照	"passport"
位址	string	擷取的地址 (僅限駕照)	"123 STREET ADDRESS YOUR CITY WA 99999-1234"
區域	string	擷取區域、州、省等(僅限駕照)	"Washington"

移轉指南

請遵循我們的文件智慧服務 v3.1 移轉指南，了解如何在應用程式和工作流程中使用 v3.0 版本。

下一步

使用文件智慧服務工作室嘗試處理您自己的表單和文件。
完成 Document Intelligence 快速入門，並開始以您選擇的開發語言來建立文件處理應用程式。

在 GitHub 上尋找更多範例 (英文)。

在 GitHub 上尋找更多範例 (英文)。

使用文件智慧服務範例標記工具嘗試處理您自己的表單和文件。
完成 Document Intelligence 快速入門，並開始以您選擇的開發語言來建立文件處理應用程式。

共用方式為

文件智慧服務身分證文件模型

身分識別文件處理

資料擷取

駕照範例

護照範例

開發選項

輸入需求

ID 文件模型資料擷取

文件智慧服務範例標籤工具

支援的文件類型

欄位擷取

支援的文件類型

擷取的欄位

移轉指南

下一步

意見反應

其他資源