共用方式為


Document Intelligence 名片模型

重要

從文件智慧服務 v4.0 (預覽) 開始,即將淘汰名片模型 (prebuilt-businessCard)。 若要從名片格式中擷取資料,請使用以下版本:

功能 version Model ID
名片模型 • v3.1:2023-07-31 (GA)
• v3.0:2022-08-31 (GA)
• v2.1 (GA)
prebuilt-businessCard

此內容適用於: 勾選記號 v3.1 (GA) | 較舊版本: blue-checkmark v3.0 blue-checkmark v2.1

此內容適用於: 勾選記號 v3.0 (GA) | 最新版本: purple-checkmark v4.0 (預覽版) purple-checkmark v3.1 | 較舊版本: blue-checkmark v2.1

此內容適用於: 勾選記號 v2.1 | 最新版本: blue-checkmark v4.0 (預覽版)

Document Intelligence 名片模型結合了功能強大的光學字元辨識 (OCR) 功能,以及深度學習模型,以便分析和擷取名片影像中的資料。 API 會分析印刷名片;擷取重要資訊,例如名字、姓氏、公司名稱、電子郵件地址和電話號碼,並傳回結構化的 JSON 資料表示法。

名片資料擷取

名片是代表商務或專業人員的絕佳方式。 名片中的公司標誌、字型和背景影像有助於推廣公司商標,並與其他品牌區別。 應用 OCR 和機器學習技術來自動掃描名片是常見的影像處理案例。 銷售與行銷小組所使用的企業系統通常會整合名片資料擷取功能,讓使用者受益。

使用 Document Intelligence Studio 處理的名片範例

Document Intelligence Studio 中分析的名片範例螢幕擷取畫面。

使用 Document Intelligence 範例標籤工具處理的名片範例

使用 Document Intelligence 範例標籤工具分析的名片範例螢幕擷取畫面。

開發選項

文件智慧服務 v3.1:2023-07-31 (GA) 支援下列工具、應用程式和程式庫:

功能 資源 Model ID
名片模型 Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-businessCard

文件智慧服務 v3.0:2022-08-31 (GA) 支援下列工具、應用程式和程式庫:

功能 資源 Model ID
名片模型 Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-businessCard

文件智慧服務 v2.1 (GA) 支援下列工具、應用程式和程式庫:

功能 資源
名片模型 文件智慧服務標記工具
REST API
用戶端程式庫 SDK
文件智慧服務 Docker 容器

試用名片資料擷取

查看如何從名片擷取資料,包括姓名、職稱、地址、電子郵件和公司名稱。 您需要下列資源:

Azure 入口網站中金鑰與端點位置的螢幕擷取畫面。

Document Intelligence Studio

注意

Document Intelligence Studio 有 v3.1 和 v3.0 API 可供使用。

  1. 在 Document Intelligence Studio 首頁上,選取 [名片]。

  2. 您可以分析範例名片或上傳您自己的檔案。

  3. 選取 [執行分析] 按鈕,並視需要設定 [分析選項]

    Document Intelligence Studio 中 [執行分析] 和 [分析選項] 按鈕的螢幕擷取畫面。

文件智慧服務範例標籤工具

  1. 瀏覽至 Document Intelligence 範例工具

  2. 在範例工具首頁上,選取 [使用預建模型來取得資料] 圖格。

    版面配置模型分析結果作業的螢幕擷取畫面。

  3. 從下拉式功能表選取要分析的 [表單類型]

  4. 從下列選項中選擇您想要分析的檔案 URL:

  5. 在 [來源] 欄位中,從下拉式功能表中選取 [URL],貼上選取的 URL,然後選取 [擷取] 按鈕。

    來源位置下拉式功能表的螢幕擷取畫面。

  6. 在 [文件智慧服務端點] 欄位中,貼上您透過文件智慧服務訂用帳戶取得的端點。

  7. 在 [金鑰] 欄位中,貼上您從文件智慧服務資源取得的金鑰。

    [選取表單類型] 下拉式功能表的螢幕擷取畫面。

  8. 選取 [Run analysis] (執行分析)。 Document Intelligence 範例標籤工具會呼叫分析預建 API 並分析文件。

  9. 檢視結果 - 查看擷取的索引鍵/值組、明細行項目、擷取的反白顯示文字,以及偵測到的資料表。

    名片模型分析結果作業的螢幕擷取畫面。

注意

範例標記工具不支援 BMP 檔案格式。 這是工具的限制,而不是 Document Intelligence 服務的限制。

輸入需求

  • 若要得到最佳結果,請為每個文件提供一張清晰的照片或高畫質的掃描檔案。

  • 支援的檔案格式:

    模型 PDF 影像:
    JPEG/JPG、PNG、BMP、TIFF、HEIF
    Microsoft Office:
    Word (DOCX)、Excel (XLSX)、PowerPoint (PPTX) 和 HTML
    參閱
    版面配置 ✔ (2024-02-29-preview、2023-10-31-preview)
    一般文件
    預建
    自訂擷取
    自訂分類 ✔ (2024-02-29-preview)
  • 若使用 PDF 和 TIFF,最多可處理 2000 頁 (若使用免費層訂閱,則只會處理前兩頁)。

  • 付費 (S0) 層用於分析文件的檔案大小為 500 MB,而免費 (F0) 層為 4 MB。

  • 影像維度必須介於 50 x 50 像素和 10,000 x 10,000 像素之間。

  • 如果您的 PDF 有密碼鎖定,則必須先移除鎖定才能提交。

  • 針對 1024 x 768 像素影像的擷取文字高度下限為 12 像素。 此尺寸在 150 點/英吋 (DPI) 時大約相當於 8 點文字。

  • 針對自訂模型定型,自訂範本模型的定型資料頁數上限為 500,而自訂神經網路模型的上限則為 50,000。

    • 針對自訂擷取模型定型,範本模型的定型資料大小總計為 50 MB,而神經模型的大小總計則為 1G-MB。

    • 針對自訂分類模型定型,定型資料的大小總計為 1GB (上限為 10,000 頁)。

  • 受支援的檔案格式:JPEG、PNG、PDF 和 TIFF
  • PDF 和 TIFF,最多可以處理 2,000 頁。 若是免費層訂閱者,只會處理前兩頁。
  • 檔案大小必須小於 50 MB,尺寸至少 50 x 50 像素,最大可到 10000 x 10000 像素。

支援的語言和地區設定

如需支援語言的完整清單,請參閱我們的語言支援頁面。

欄位擷取

名稱 類型​​ 描述 標準化輸出
ContactNames 物件陣列 連絡人名稱
FirstName String 連絡人名字
LastName String 連絡人姓氏
ContactNames 字串陣列 公司名稱
部門 字串陣列 部門或連絡人組織
JobTitles 字串陣列 連絡人所列職稱
電子郵件 字串陣列 連絡人電子郵件地址
網站 字串陣列 公司網站
地址 字串陣列 地址 (擷取自名片)
MobilePhones 電話號碼陣列 名片上的行動電話號碼 +1 xxx xxx xxxx
傳真 電話號碼陣列 名片上的傳真電話號碼 +1 xxx xxx xxxx
職務電話 電話號碼陣列 名片上的公司電話號碼 +1 xxx xxx xxxx
OtherPhones 電話號碼陣列 名片上的其他電話號碼 +1 xxx xxx xxxx

擷取的欄位

名稱 類型​​ 描述 Text
ContactNames 物件陣列 連絡人名稱 (擷取自名片) [{ "FirstName": "John", "LastName": "Doe" }]
FirstName string 連絡人名字 "John"
LastName string 連絡人姓氏 "Doe"
ContactNames 字串陣列 公司名稱 (擷取自名片) ["Contoso"]
部門 字串陣列 部門或連絡人組織 ["R&D"]
JobTitles 字串陣列 連絡人所列職稱 ["Software Engineer"]
電子郵件 字串陣列 從名片擷取的連絡人電子郵件 ["johndoe@contoso.com"]
網站 字串陣列 網站 (擷取自名片) ["https://www.contoso.com"]
地址 字串陣列 地址 (擷取自名片) ["123 Main Street, Redmond, Washington 98052"]
MobilePhones 電話號碼陣列 行動電話號碼 (擷取自名片) ["+19876543210"]
傳真 電話號碼陣列 傳真電話號碼 (擷取自名片) ["+19876543211"]
職務電話 電話號碼陣列 公司電話號碼 (擷取自名片) ["+19876543231"]
OtherPhones 電話號碼陣列 其他電話號碼 (擷取自名片) ["+19876543233"]

支援的地區設定

預建名片 v2.1 支援下列地區設定:

  • en-us
  • en-au
  • en-ca
  • en-gb
  • en-in

移轉指南和 REST API v3.1

下一步