Document Intelligence 名片模型

重要

從 Document Intelligence v4.0 (預覽版)開始,即將開始,名片模型 (prebuilt-businessCard) 已被取代。 若要從名片格式擷取數據,請使用下列專案:

功能 version Model ID
名片模型 • v3.1:2023-07-31 (GA)
• v3.0:2022-08-31 (GA)
• v2.1 (GA)
prebuilt-businessCard

此內容適用於:複選標記v3.1(GA) | 舊版:blue-checkmarkv3.0blue-checkmarkv2.1

此內容適用於:複選標記v3.0 (GA) | 最新版本:紫色複選標記v4.0 (預覽)紫色複選標記v3.1 | 舊版:blue-checkmarkv2.1

此內容適用於:複選標記v2.1 | 最新版本:blue-checkmarkv4.0(預覽)

Document Intelligence 名片模型結合了功能強大的光學字元辨識 (OCR) 功能,以及深度學習模型,以便分析和擷取名片影像中的資料。 API 會分析列印的名片;擷取重要資訊,例如名字、姓氏、公司名稱、電子郵件地址和電話號碼;和會傳回結構化 JSON 數據表示。

名片數據擷取

名片是代表企業或專業人員的絕佳方式。 在名片中找到的公司標誌、字型和背景影像,有助於推廣公司商標,並將其與其他品牌區別開來。 套用 OCR 和機器學習技術來自動掃描名片是常見的影像處理案例。 銷售與行銷小組所使用的企業系統通常會將名片數據擷取功能整合到其中,以利使用者。

使用 Document Intelligence Studio 處理的名片範例

Document Intelligence Studio 中分析的名片範例螢幕擷取畫面。

使用 Document Intelligence 範例標籤工具處理的名片範例

使用 Document Intelligence 範例標籤工具分析的名片範例螢幕擷取畫面。

開發選項

Document Intelligence v3.1:2023-07-31 (GA) 支援下列工具、應用程式和連結庫:

功能 資源 Model ID
名片模型 Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-businessCard

檔案智慧 v3.0:2022-08-31 (GA) 支援下列工具、應用程式和連結庫:

功能 資源 Model ID
名片模型 Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-businessCard

Document Intelligence v2.1 (GA) 支援下列工具、應用程式和連結庫:

功能 資源
名片模型 檔案智慧標籤工具
REST API
客戶端連結庫 SDK
文件智慧 Docker 容器

嘗試擷取名片數據

查看如何從名片擷取數據,包括名稱、職稱、位址、電子郵件和公司名稱。 您需要下列資源:

Azure 入口網站 中金鑰和端點位置的螢幕快照。

Document Intelligence Studio

注意

Document Intelligence Studio 有 v3.1 和 v3.0 API 可供使用。

  1. 在 Document Intelligence Studio 首頁上,選取 [名片]。

  2. 您可以分析範例名片或上傳您自己的檔案。

  3. 選取 [ 執行分析] 按鈕,並視需要設定 [分析] 選項

    Document Intelligence Studio 中 [執行分析和分析選項] 按鈕的螢幕快照。

文件智慧服務範例標籤工具

  1. 瀏覽至 Document Intelligence 範例工具

  2. 在範例工具首頁上,選取 [ 使用預先建置的模型來取得數據 磚]。

    配置模型分析結果作業的螢幕快照。

  3. 從下拉功能表中選取要分析的表單類型

  4. 從下列選項中選擇您想要分析之檔案的 URL:

  5. 在 [ 來源] 欄位中,從下拉功能表中選取 [URL ]、貼上選取的 URL,然後選取 [ 擷取 ] 按鈕。

    來源位置下拉功能表的螢幕快照。

  6. 在 [文件智慧服務端點] 欄位中,貼上您透過文件智慧服務訂用帳戶取得的端點。

  7. 在 [金鑰] 欄位中,貼上您從文件智慧服務資源取得的金鑰。

    select-form-type 下拉功能表的螢幕快照。

  8. 選取 [ 執行分析]。 Document Intelligence 範例標籤工具會呼叫分析預建 API 並分析文件。

  9. 檢視結果 - 查看擷取的索引鍵/值組、行專案、已擷取的文字和偵測到的數據表。

    名片模型分析結果作業的螢幕快照。

注意

範例 標籤工具 不支援 BMP 檔案格式。 這是工具的限制,而不是 Document Intelligence 服務的限制。

輸入需求

  • 若要得到最佳結果,請為每個文件提供一張清晰的照片或高畫質的掃描檔案。

  • 支援的檔案格式:

    模型 PDF 圖片:
    JPEG/JPG、PNG、BMP、TIFF、HEIF
    Microsoft Office:
    Word(DOCX)、Excel(XLSX)、PowerPoint(PPTX)和 HTML
    參閱
    版面配置 ✔ (2024-02-29-preview, 2023-10-31-preview)
    一般文件
    預建
    自訂擷取
    自訂分類 ✔ (2024-02-29-preview)
  • 若使用 PDF 和 TIFF,最多可處理 2000 頁 (若使用免費層訂閱,則只會處理前兩頁)。

  • 用於分析文件的檔案大小是付費 (S0) 層的 500 MB,免費 #F0 層為 4 MB。

  • 影像維度必須介於 50 x 50 像素和 10,000 x 10,000 像素之間。

  • 如果您的 PDF 有密碼鎖定,則必須先移除鎖定才能提交。

  • 針對 1024 x 768 像素影像的擷取文字高度下限為 12 像素。 此尺寸在 150 點/英吋 (DPI) 時大約相當於 8 點文字。

  • 針對自訂模型定型,自訂範本模型的定型資料頁數上限為 500,而自訂神經網路模型的上限則為 50,000。

    • 針對自訂擷取模型定型,範本模型的定型資料大小總計為 50 MB,而神經模型的大小總計則為 1G-MB。

    • 針對自訂分類模型定型,定型資料的大小總計為 1GB (上限為 10,000 頁)。

  • 支援的檔案格式:JPEG、PNG、PDF 和 TIFF
  • 若為 PDF 和 TIFF,最多會處理 2000 頁。 對於免費層訂閱者,只會處理前兩個頁面。
  • 檔案大小必須小於 50 MB,且尺寸至少為 50 x 50 像素,且最多 10,000 x 10,000 像素。

支援的語言和地區設定

如需支持語言的完整清單,請參閱 我們的 語言支持 頁面。

欄位擷取

名稱 類型​​ 描述 標準化輸出
ContactNames 物件陣列 連絡人名稱
FirstName String 第一個(指定)聯繫人名稱
LastName String 聯繫人姓氏
ContactNames 字串陣列 公司名稱(秒)
部門 字串陣列 聯繫人部門(s) 或組織
JobTitles 字串陣列 列出的聯繫人職稱
電子郵件 字串陣列 聯絡人電子郵件地址(es)
網站 字串陣列 公司網站(s)
地址 字串陣列 從名片中擷取的位址
MobilePhones 電話號碼陣列 名片中的行動電話號碼 +1 xxx xxx xxxx
傳真 電話號碼陣列 名片的傳真電話號碼 +1 xxx xxx xxxx
職務電話 電話號碼陣列 名片的工作電話號碼 +1 xxx xxx xxxx
OtherPhones 電話號碼陣列 名片的其他電話號碼 +1 xxx xxx xxxx

已擷取的欄位

名稱 類型​​ 描述 Text
ContactNames 物件陣列 從名片擷取的聯繫人名稱 [{ "FirstName": "John", "LastName": "Doe" }]
FirstName string 第一個(指定)聯繫人名稱 “John”
LastName string 聯繫人姓氏 “Doe”
ContactNames 字串陣列 從名片擷取的公司名稱 [“Contoso”]
部門 字串陣列 聯繫人的部門或組織 [“R&D”]
JobTitles 字串陣列 列出的聯繫人職稱 [「軟體工程師」]
電子郵件 字串陣列 從名片擷取的聯繫人電子郵件 [“”johndoe@contoso.com]
網站 字串陣列 從名片擷取的網站 [“https://www.contoso.com"]
地址 字串陣列 從名片擷取的位址 [“123 Main Street, Redmond, WA 98052”]
MobilePhones 電話號碼陣列 從名片中擷取的行動電話號碼 ["+19876543210"]
傳真 電話號碼陣列 從名片擷取的傳真電話號碼 ["+19876543211"]
職務電話 電話號碼陣列 從名片擷取的工作電話號碼 ["+19876543231"]
OtherPhones 電話號碼陣列 從名片擷取的其他電話號碼 ["+19876543233"]

支援的地區設定

預先建置的名片 v2.1 支援下列地區設定:

  • en-us
  • en-au
  • en-ca
  • en-gb
  • en-in

移轉指南和 REST API v3.1

下一步