事件
Document Intelligence 名片模型
重要
從 Document Intelligence v4.0 開始,未來會淘汰名片模型(預建-businessCard)。 若要從名片格式中擷取資料,請使用以下版本:
功能 | version | Model ID |
---|---|---|
名片模型 | • v3.1:2023-07-31 (GA) • v3.0:2022-08-31 (GA) • v2.1 (GA) |
prebuilt-businessCard |
[!INCLUDE [適用於 v2.1]。。/(includes/applies-to-v21.md)]
Document Intelligence 名片模型結合了功能強大的光學字元辨識 (OCR) 功能,以及深度學習模型,以便分析和擷取名片影像中的資料。 API 會分析印刷名片;擷取重要資訊,例如名字、姓氏、公司名稱、電子郵件地址和電話號碼,並傳回結構化的 JSON 資料表示法。
名片是代表商務或專業人員的絕佳方式。 名片中的公司標誌、字型和背景影像有助於推廣公司商標,並與其他品牌區別。 應用 OCR 和機器學習技術來自動掃描名片是常見的影像處理案例。 銷售與行銷小組所使用的企業系統通常會整合名片資料擷取功能,讓使用者受益。
使用 Document Intelligence Studio 處理的名片範例
使用 Document Intelligence 範例標籤工具處理的名片範例
文件智慧服務 v3.1:2023-07-31 (GA) 支援下列工具、應用程式和程式庫:
功能 | 資源 | Model ID |
---|---|---|
名片模型 | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-businessCard |
文件智慧服務 v3.0:2022-08-31 (GA) 支援下列工具、應用程式和程式庫:
功能 | 資源 | Model ID |
---|---|---|
名片模型 | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-businessCard |
文件智慧服務 v2.1 (GA) 支援下列工具、應用程式和程式庫:
功能 | 資源 |
---|---|
名片模型 | • 文件智慧服務標記工具 • REST API • 用戶端程式庫 SDK • 文件智慧服務 Docker 容器 |
查看如何從名片擷取資料,包括姓名、職稱、地址、電子郵件和公司名稱。 您需要下列資源:
Azure 訂用帳戶 - 您可建立一個免費訂用帳戶
Azure 入口網站中的 Document Intelligence 執行個體。 您可以使用免費定價層 (
F0
) 來試用服務。 部署資源後,選取 [前往資源] 以取得金鑰和端點。
注意
Document Intelligence Studio 有 v3.1 和 v3.0 API 可供使用。
在文件智慧服務工作室首頁上,選取 [名片]。
您可以分析範例名片或上傳您自己的檔案。
選取 [執行分析] 按鈕,並視需要設定 [分析選項]:
試用文件智慧服務工作室 (英文)
在範例工具首頁上,選取 [使用預建模型來取得資料] 圖格。
從下拉式功能表選取要分析的 [表單類型]。
從下列選項中選擇您想要分析的檔案 URL:
在 [來源] 欄位中,從下拉式功能表中選取 [URL],貼上選取的 URL,然後選取 [擷取] 按鈕。
在 [文件智慧服務端點] 欄位中,貼上您透過文件智慧服務訂用帳戶取得的端點。
在 [金鑰] 欄位中,貼上您從文件智慧服務資源取得的金鑰。
選取 [Run analysis] (執行分析)。 Document Intelligence 範例標籤工具會呼叫分析預建 API 並分析文件。
檢視結果 - 查看擷取的索引鍵/值組、明細行項目、擷取的反白顯示文字,以及偵測到的資料表。
注意
範例標記工具不支援 BMP 檔案格式。 這是工具的限制,而不是 Document Intelligence 服務的限制。
支援的檔案格式:
模型 | 影像:JPEG/JPG 、PNG 、BMP 、TIFF 、HEIF |
Microsoft Office: Word ( DOCX )、Excel (XLSX )、PowerPoint (PPTX )、HTML |
|
---|---|---|---|
參閱 | ✔ | ✔ | ✔ |
版面配置 | ✔ | ✔ | ✔ |
一般文件 | ✔ | ✔ | |
預建 | ✔ | ✔ | |
自訂擷取 | ✔ | ✔ | |
自訂分類 | ✔ | ✔ | ✔ |
若要得到最佳結果,請為每個文件提供一張清晰的照片或高畫質的掃描檔案。
若使用 PDF 和 TIFF,最多可處理 2,000 頁 (若使用免費層訂閱,則只會處理前兩頁)。
付費 (S0) 層分析文件的檔案大小為 500 MB,免費 (F0) 層則為
4
MB。影像維度必須介於 50 像素 x 50 像素和 10,000 像素 x 10,000 像素之間。
如果您的 PDF 有密碼鎖定,則必須先移除鎖定才能提交。
針對 1024 x 768 像素影像的擷取文字高度下限為 12 像素。 此維度在 150 點/英吋 (DPI) 時大約相當於
8
點文字。針對自訂模型定型,自訂範本模型的定型資料頁數上限為 500,而自訂神經網路模型的上限則為 50,000。
對於自訂擷取模型定型,範本模型的定型資料大小總計為 50 MB,而神經模型的大小總計則為
1
GB。針對自訂分類模型定型,定型資料的大小總計為
1
GB (上限為 10,000 頁)。 對於 2024-11-30 (GA),訓練數據的總大小為2
GB,最多 10,000 頁。
- 受支援的檔案格式:JPEG、PNG、PDF 和 TIFF
- PDF 和 TIFF,最多可以處理 2,000 頁。 若是免費層訂閱者,只會處理前兩頁。
- 檔案大小必須小於 50 MB,尺寸至少 50 x 50 像素,最大可到 10000 x 10000 像素。
名稱 | 類型 | 描述 | Text |
---|---|---|---|
ContactNames | 物件陣列 | 連絡人名稱 (擷取自名片) | [{ "FirstName": "John", "LastName": "Doe" }] |
FirstName | string | 連絡人名字 | "John" |
LastName | string | 連絡人姓氏 | "Doe" |
ContactNames | 字串陣列 | 公司名稱 (擷取自名片) | ["Contoso"] |
部門 | 字串陣列 | 部門或連絡人組織 | ["R&D"] |
JobTitles | 字串陣列 | 連絡人所列職稱 | ["Software Engineer"] |
電子郵件 | 字串陣列 | 從名片擷取的連絡人電子郵件 | [“”johndoe@contoso.com] |
網站 | 字串陣列 | 網站 (擷取自名片) | [“https://www.contoso.com"] |
地址 | 字串陣列 | 地址 (擷取自名片) | ["123 Main Street, Redmond, Washington 98052"] |
MobilePhones | 電話號碼陣列 | 行動電話號碼 (擷取自名片) | ["+19876543210"] |
傳真 | 電話號碼陣列 | 傳真電話號碼 (擷取自名片) | ["+19876543211"] |
職務電話 | 電話號碼陣列 | 公司電話號碼 (擷取自名片) | ["+19876543231"] |
OtherPhones | 電話號碼陣列 | 其他電話號碼 (擷取自名片) | ["+19876543233"] |
預建名片 v2.1 支援下列地區設定:
- en-us
- en-au
- en-ca
- en-gb
- en-in
- 請遵循我們的 Document Intelligence v3.1 移轉指南,了解如何在應用程式和工作流程中使用 v3.0 版本。
使用 Document Intelligence Studio 嘗試處理自己的表單和文件
完成 Document Intelligence 快速入門,然後開始使用您選擇的開發語言來建立文件處理應用程式。
請使用 Document Intelligence 範例標籤工具嘗試處理您自己的表單和文件
完成 Document Intelligence 快速入門,並開始以您選擇的開發語言來建立文件處理應用程式。
其他資源
訓練
模組
Extract information from business cards with AI Builder - Training
Learn about AI Builder Business card reader and how to use it in Microsoft Power Apps and Power Automate.
認證
Microsoft Certified: Azure AI Fundamentals - Certifications
示範與 Microsoft Azure 軟體和服務開發相關的基本 AI 概念,以建立 AI 解決方案。
文件
-
發票資料擷取 – 文件智慧服務 - Azure AI services
使用文件智慧服務的發票模型自動擷取發票資料。
-
身分識別文件 (ID) 處理 - 文件智慧服務 - Azure AI services
使用文件智慧服務自動處理駕照、護照等的身分識別文件 (ID)。
-
合約資料擷取 – 文件智慧服務 - Azure AI services
使用文件智慧服務的合約模型自動擷取合約資料。