Document Intelligence 名片模型
重要
從 Document Intelligence v4.0 (預覽版)開始,即將開始,名片模型 (prebuilt-businessCard) 已被取代。 若要從名片格式擷取數據,請使用下列專案:
功能 | version | Model ID |
---|---|---|
名片模型 | • v3.1:2023-07-31 (GA) • v3.0:2022-08-31 (GA) • v2.1 (GA) |
prebuilt-businessCard |
此內容適用於:v3.1(GA) | 舊版:v3.0v2.1
此內容適用於:v2.1 | 最新版本:v4.0(預覽)
Document Intelligence 名片模型結合了功能強大的光學字元辨識 (OCR) 功能,以及深度學習模型,以便分析和擷取名片影像中的資料。 API 會分析列印的名片;擷取重要資訊,例如名字、姓氏、公司名稱、電子郵件地址和電話號碼;和會傳回結構化 JSON 數據表示。
名片資料擷取
名片是代表商務或專業人員的絕佳方式。 在名片中找到的公司標誌、字型和背景影像,有助於推廣公司商標,並將其與其他品牌區別開來。 應用 OCR 和機器學習技術來自動掃描名片是常見的影像處理案例。 銷售與行銷小組所使用的企業系統通常會整合名片資料擷取功能,讓使用者受益。
使用 Document Intelligence Studio 處理的名片範例
使用 Document Intelligence 範例標籤工具處理的名片範例
開發選項
Document Intelligence v3.1:2023-07-31 (GA) 支援下列工具、應用程式和連結庫:
功能 | 資源 | Model ID |
---|---|---|
名片模型 | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-businessCard |
檔案智慧 v3.0:2022-08-31 (GA) 支援下列工具、應用程式和連結庫:
功能 | 資源 | Model ID |
---|---|---|
名片模型 | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-businessCard |
Document Intelligence v2.1 (GA) 支援下列工具、應用程式和連結庫:
功能 | 資源 |
---|---|
名片模型 | • 檔案智慧標籤工具 • REST API • 客戶端連結庫 SDK • 文件智慧 Docker 容器 |
試用名片資料擷取
查看如何從名片擷取資料,包括姓名、職稱、地址、電子郵件和公司名稱。 您需要下列資源:
Azure 訂用帳戶 - 您可建立一個免費訂用帳戶
Azure 入口網站中的 Document Intelligence 執行個體。 您可以使用免費定價層 (
F0
) 來試用服務。 部署資源後,選取 [前往資源] 以取得金鑰和端點。
Document Intelligence Studio
注意
Document Intelligence Studio 有 v3.1 和 v3.0 API 可供使用。
在 Document Intelligence Studio 首頁上,選取 [名片]。
您可以分析範例名片或上傳您自己的檔案。
選取 [ 執行分析] 按鈕,並視需要設定 [分析] 選項 :
試用文件智慧服務工作室 (英文)
文件智慧服務範例標籤工具
在範例工具首頁上,選取 [使用預建模型來取得資料] 圖格。
從下拉式功能表選取要分析的 [表單類型]。
從下列選項中選擇您想要分析的檔案 URL:
在 [來源] 欄位中,從下拉式功能表中選取 [URL],貼上選取的 URL,然後選取 [擷取] 按鈕。
在 [文件智慧服務端點] 欄位中,貼上您透過文件智慧服務訂用帳戶取得的端點。
在 [金鑰] 欄位中,貼上您從文件智慧服務資源取得的金鑰。
選取 [Run analysis] (執行分析)。 Document Intelligence 範例標籤工具會呼叫分析預建 API 並分析文件。
檢視結果 - 查看擷取的索引鍵/值組、行專案、已擷取的醒目提示文字,以及偵測到的數據表。
注意
範例標記工具不支援 BMP 檔案格式。 這是工具的限制,而不是 Document Intelligence 服務的限制。
輸入需求
若要得到最佳結果,請為每個文件提供一張清晰的照片或高畫質的掃描檔案。
支援的檔案格式:
模型 PDF 圖片:
JPEG/JPG、PNG、BMP、TIFF、HEIFMicrosoft Office:
Word(DOCX)、Excel(XLSX)、PowerPoint(PPTX)和 HTML參閱 ✔ ✔ ✔ 版面配置 ✔ ✔ ✔ (2024-02-29-preview, 2023-10-31-preview) 一般文件 ✔ ✔ 預建 ✔ ✔ 自訂擷取 ✔ ✔ 自訂分類 ✔ ✔ ✔ (2024-02-29-preview) 若使用 PDF 和 TIFF,最多可處理 2000 頁 (若使用免費層訂閱,則只會處理前兩頁)。
用於分析文件的檔案大小是付費 (S0) 層的 500 MB,免費 #F0 層為 4 MB。
影像維度必須介於 50 x 50 像素和 10,000 x 10,000 像素之間。
如果您的 PDF 有密碼鎖定,則必須先移除鎖定才能提交。
針對 1024 x 768 像素影像的擷取文字高度下限為 12 像素。 此尺寸在 150 點/英吋 (DPI) 時大約相當於
8
點文字。針對自訂模型定型,自訂範本模型的定型資料頁數上限為 500,而自訂神經網路模型的上限則為 50,000。
針對自訂擷取模型定型,範本模型的定型資料大小總計為 50 MB,而神經模型的大小總計則為 1G-MB。
針對自訂分類模型定型,定型資料的大小總計為
1GB
(上限為 10,000 頁)。
- 支援的檔案格式:JPEG、PNG、PDF 和 TIFF
- PDF 和 TIFF,最多處理 2,000 頁。 若是免費層訂閱者,只會處理前兩頁。
- 檔案大小必須小於 50 MB,尺寸至少 50 x 50 像素,最大可到 10000 x 10000 像素。
支援的語言和地區設定
如需支持語言的完整清單,請參閱 我們的 語言支持 頁面。
欄位擷取
名稱 | 類型 | 描述 | 標準化輸出 |
---|---|---|---|
ContactNames | 物件陣列 | 連絡人名稱 | |
FirstName | String | 連絡人名字 | |
LastName | String | 連絡人姓氏 | |
ContactNames | 字串陣列 | 公司名稱 | |
部門 | 字串陣列 | 部門或連絡人組織 | |
JobTitles | 字串陣列 | 連絡人所列職稱 | |
電子郵件 | 字串陣列 | 連絡人電子郵件地址 | |
網站 | 字串陣列 | 公司網站 | |
地址 | 字串陣列 | 地址 (擷取自名片) | |
MobilePhones | 電話號碼陣列 | 名片中的行動電話號碼 | +1 xxx xxx xxxx |
傳真 | 電話號碼陣列 | 名片的傳真電話號碼 | +1 xxx xxx xxxx |
職務電話 | 電話號碼陣列 | 名片的工作電話號碼 | +1 xxx xxx xxxx |
OtherPhones | 電話號碼陣列 | 名片的其他電話號碼 | +1 xxx xxx xxxx |
擷取的欄位
名稱 | 類型 | 描述 | Text |
---|---|---|---|
ContactNames | 物件陣列 | 連絡人名稱 (擷取自名片) | [{ "FirstName": "John", "LastName": "Doe" }] |
FirstName | string | 連絡人名字 | "John" |
LastName | string | 連絡人姓氏 | "Doe" |
ContactNames | 字串陣列 | 公司名稱 (擷取自名片) | ["Contoso"] |
部門 | 字串陣列 | 部門或連絡人組織 | [“R&D”] |
JobTitles | 字串陣列 | 連絡人所列職稱 | ["Software Engineer"] |
電子郵件 | 字串陣列 | 從名片擷取的連絡人電子郵件 | [“”johndoe@contoso.com] |
網站 | 字串陣列 | 網站 (擷取自名片) | [“https://www.contoso.com"] |
地址 | 字串陣列 | 地址 (擷取自名片) | [“123 Main Street, Redmond, Washington 98052”] |
MobilePhones | 電話號碼陣列 | 行動電話號碼 (擷取自名片) | ["+19876543210"] |
傳真 | 電話號碼陣列 | 傳真電話號碼 (擷取自名片) | ["+19876543211"] |
職務電話 | 電話號碼陣列 | 公司電話號碼 (擷取自名片) | ["+19876543231"] |
OtherPhones | 電話號碼陣列 | 其他電話號碼 (擷取自名片) | ["+19876543233"] |
支援的地區設定
預建名片 v2.1 支援下列地區設定:
- en-us
- en-au
- en-ca
- en-gb
- en-in
移轉指南和 REST API v3.1
- 請遵循我們的 Document Intelligence v3.1 移轉指南,了解如何在應用程式和工作流程中使用 v3.0 版本。
下一步
使用 Document Intelligence Studio 嘗試處理自己的表單和文件
完成 Document Intelligence 快速入門,然後開始使用您選擇的開發語言來建立文件處理應用程式。
請使用 Document Intelligence 範例標籤工具嘗試處理您自己的表單和文件
完成 Document Intelligence 快速入門,並開始以您選擇的開發語言來建立文件處理應用程式。
意見反應
https://aka.ms/ContentUserFeedback。
即將登場:在 2024 年,我們將逐步淘汰 GitHub 問題作為內容的意見反應機制,並將它取代為新的意見反應系統。 如需詳細資訊,請參閱:提交並檢視相關的意見反應