共用方式為


Document Intelligence 收據模型

重要

  • 文件智慧服務公開預覽版本可讓您搶先存取正在積極開發的功能。 根據使用者意見反應,功能、方法和流程在正式發行 (GA) 前可能有所變更。
  • 文件智慧服務用戶端程式庫的公開預覽版預設為 REST API 版本 2024-07-31-preview
  • 公開預覽版 2024-07-31-preview 目前僅適用於下列 Azure 地區。 請注意,AI Studio 中的自訂生成 (文件欄位擷取) 模型僅適用美國中北部地區:
    • 美國東部
    • 美國西部 2
    • 西歐
    • 美國中北部

此內容適用於:勾選記號 v4.0 (預覽版) | 舊版:blue-checkmark v3.1 (GA) blue-checkmark v3.0 (GA) blue-checkmark v2.1 (GA)

此內容適用於:勾選記號 v3.1 (GA) | 最新版本:purple-checkmark v4.0 (預覽版) | 舊版:blue-checkmark v3.0 blue-checkmark v2.1

此內容適用於:勾選記號 v3.0 (GA) | 最新版本:purple-checkmark v4.0 (預覽版) purple-checkmark v3.1 | 舊版:blue-checkmark v2.1

此內容適用於:勾選記號 v2.1 | 最新版本:blue-checkmark v4.0 (預覽版)

Document Intelligence 收據模型結合了強大的光學字元辨識 (OCR) 功能與深度學習模型,以分析和擷取銷售收據中的關鍵資訊。 收據可能有各種格式且品質不一,包括列印和手寫的收據。 API 會擷取商家名稱、商家電話號碼、交易日期、稅金和交易總計等重要資訊,並傳回結構化的 JSON 資料。

支援的收據類型:

  • 熱氣
  • 信用卡
  • 汽油
  • 停車
  • 飯店
  • Transportation
  • 通訊
  • 娛樂
  • 搭飛機
  • 訓練
  • 藥局/醫療

收據資料擷取

收據數位化包含不同類型的收據轉換,包括掃描、拍照和列印的複本,以數位格式進行簡化的下游處理。 範例包括費用管理、消費者行為分析、稅務自動化等。使用 Document Intelligence 搭配 OCR (光學字元辨識) 技術可以從這些不同的收據格式擷取及解譯資料。 文件智慧服務處理可簡化轉換流程,也大幅減少所需的時間和精力,進而促進有效率的資料管理和擷取。

使用 Document Intelligence Studio 處理的收據範例

Document Intelligence Studio 中處理的收據範例螢幕擷取畫面。

使用 Document Intelligence 範例標籤工具處理的收據範例:

使用表單範例標記工具處理的收據範例螢幕擷取畫面。

開發選項

文件智慧服務 v4.0 (2024-07-31-preview) 支援以下工具、應用程式和程式庫:

功能 資源 Model ID
收據模型 文件智慧服務工作室
REST API
C# SDK
Python SDK
JAVA SDK
JavaScript SDK
prebuilt-receipt

文件智慧服務 v3.1 支援下列工具、應用程式和程式庫:

功能 資源 Model ID
收據模型 文件智慧服務工作室
REST API
C# SDK
Python SDK
JAVA SDK
JavaScript SDK
prebuilt-receipt

文件智慧服務 v3.0 支援下列工具、應用程式和程式庫:

功能 資源 Model ID
收據模型 文件智慧服務工作室
REST API
C# SDK
Python SDK
JAVA SDK
JavaScript SDK
prebuilt-receipt

文件智慧服務 v2.1 支援下列工具、應用程式和程式庫:

功能 資源
收據模型 文件智慧服務標記工具
REST API
用戶端-程式庫 SDK
文件智慧服務 Docker 容器

輸入需求

  • 支援的檔案格式:

    模型 PDF 影像:
    JPEG/JPGPNGBMPTIFFHEIF
    Microsoft Office:
    Word (DOCX)、Excel (XLSX)、PowerPoint (PPTX)、HTML
    參閱
    版面配置 ✔ (2024-07-31-preview、2024-02-29-preview、2023-10-31-preview)
    一般文件
    預建
    自訂擷取
    自訂分類 ✔ (2024-07-31-preview、2024-02-29-preview)
  • 若要得到最佳結果,請為每個文件提供一張清晰的照片或高畫質的掃描檔案。

  • 若使用 PDF 和 TIFF,最多可處理 2,000 頁 (若使用免費層訂閱,則只會處理前兩頁)。

  • 付費 (S0) 層分析文件的檔案大小為 500 MB,免費 (F0) 層則為 4 MB。

  • 影像維度必須介於 50 像素 x 50 像素和 10,000 像素 x 10,000 像素之間。

  • 如果您的 PDF 有密碼鎖定,則必須先移除鎖定才能提交。

  • 針對 1024 x 768 像素影像的擷取文字高度下限為 12 像素。 此維度在 150 點/英吋 (DPI) 時大約相當於 8 點文字。

  • 針對自訂模型定型,自訂範本模型的定型資料頁數上限為 500,而自訂神經網路模型的上限則為 50,000。

    • 對於自訂擷取模型定型,範本模型的定型資料大小總計為 50 MB,而神經模型的大小總計則為 1 GB。

    • 針對自訂分類模型定型,定型資料的大小總計為 1 GB (上限為 10,000 頁)。 對於 2024-07-31-preview 和更新版本,定型資料的大小總計為 2 GB,最多 10,000 頁。

  • 支援的檔案格式:JPEG、PNG、PDF 和 TIFF。
  • PDF 和 TIFF 支援的頁面允許額度:文件智慧服務最多可為標準層訂閱者處理 2000 頁,或為免費層訂閱者只處理前兩頁。
  • 支援的檔案大小:小於 50 MB;最小像素 50 x 50 像素;最大像素 10,000 x 10,000 像素。

收據模型資料擷取

了解 Document Intelligence 如何從收據擷取包括交易時間和日期、商家資訊和金額總計等資料。 您需要下列資源:

Azure 入口網站中金鑰與端點位置的螢幕擷取畫面。

注意

文件智慧服務工作室有 v3.1 和 v3.0 API 及更高版本可供使用。

  1. 文件智慧服務工作室首頁上,選取收據

  2. 您可以分析範例收據,或上傳您自己的檔案。

  3. 選取 [執行分析] 按鈕,如有必要,設定 [分析選項]

    文件智慧服務工作室中 [執行分析] 和 [分析選項] 按鈕的螢幕擷取畫面。

文件智慧服務範例標籤工具

  1. 瀏覽至 Document Intelligence 範例工具

  2. 在範例工具首頁上,選取 [使用預建模型來取得資料] 圖格。

    版面配置模型分析結果流程的螢幕擷取畫面。

  3. 從下拉式功能表選取要分析的 [表單類型]

  4. 從下列選項中選擇您想要分析的檔案 URL:

  5. 在 [來源] 欄位中,從下拉式功能表中選取 [URL],貼上選取的 URL,然後選取 [擷取] 按鈕。

    來源位置下拉式功能表的螢幕擷取畫面。

  6. 在 [文件智慧服務端點] 欄位中,貼上您透過文件智慧服務訂用帳戶取得的端點。

  7. 在 [金鑰] 欄位中,貼上您從文件智慧服務資源取得的金鑰。

    [選取表單類型] 下拉式功能表的螢幕擷取畫面。

  8. 選取 [Run analysis] (執行分析)。 Document Intelligence 範例標籤工具會呼叫分析預建 API 並分析文件。

  9. 檢視結果 - 查看擷取的索引鍵/值組、明細項目、擷取的醒目提示文字和偵測到的資料表。

    版面配置模型分析結果作業的螢幕擷取畫面。

注意

範例標記工具不支援 BMP 檔案格式。 這是工具的限制,而不是 Document Intelligence 服務的限制。

支援的語言和地區設定

如需支持語言的完整清單, 請參閱 我們 預先建置的模型語言支持 頁面。

欄位擷取

名稱 類型​​ 描述 標準化輸出
ReceiptType String 銷售收據的類型 明細化
MerchantName String 開立收據的商家名稱
MerchantPhoneNumber 電話號碼 商家的所列電話號碼 +1 xxx xxx xxxx
MerchantAddress String 商家的所列地址
TransactionDate Date 收據開立日期 yyyy-mm-dd
TransactionTime Time 收據開立時間 hh-mm-ss (24 小時)
總數 金額 (美元) 收據的完整交易總計 十進位浮點數
小計 金額 (美元) 收據小計,通常為稅金套用之前 十進位浮點數
稅額 金額 (美元) 收據的總稅額 (通常是銷售稅或對等稅額)。 在 2022-06-30 版本中重新命名為「TotalTax」。 十進位浮點數
提示 金額 (美元) 包含買方支付的小費 十進位浮點數
項目 物件陣列 擷取的商品明細,擷取了其名稱、數量、單價及總價格
名稱 String 項目描述。 在 2022-06-30 版本中重新命名為「Description」
數量 數字 每個項目的數量 十進位浮點數
價格 數字 每個項目單位的個別價格 十進位浮點數
TotalPrice 數字 商品明細的總價格 十進位浮點數

如需支持的檔擷取欄位,請參閱 GitHub 範例存放庫中的 收據模型架構 頁面。

移轉指南和 REST API v3.1

下一步