Document Intelligence 收據模型

重要

  • Document Intelligence 公開預覽版本提供早期存取作用中開發的功能。
  • 根據使用者意見反應,功能、方法和流程在正式發行 (GA) 前可能有所變更。
  • Document Intelligence 用戶端連結庫的公開預覽版本預設為 REST API 版本 2024-02-29-preview
  • 公開預覽版本 2024-02-29-preview 目前僅適用於下列 Azure 區域:
  • 美國東部
  • 美國西部 2
  • 西歐

此內容適用於:複選標記v4.0 (預覽) | 舊版:blue-checkmarkv3.1 (GA)blue-checkmarkv3.0 (GA)blue-checkmarkv2.1 (GA)

此內容適用於:複選標記v3.1 (GA) | 最新版本:紫色複選標記v4.0 (預覽) | 舊版:blue-checkmarkv3.0blue-checkmarkv2.1

此內容適用於:複選標記v3.0 (GA) | 最新版本:紫色複選標記v4.0 (預覽)紫色複選標記v3.1 | 舊版:blue-checkmarkv2.1

此內容適用於:複選標記v2.1 | 最新版本:blue-checkmarkv4.0(預覽)

Document Intelligence 收據模型結合了強大的光學字元辨識 (OCR) 功能與深度學習模型,以分析和擷取銷售收據中的關鍵資訊。 收據可以是各種格式和品質,包括印刷和手寫收據。 API 會擷取商家名稱、商家電話號碼、交易日期、稅務和交易總計等重要資訊,並傳回結構化 JSON 數據。

支援的收據類型:

  • 信用卡
  • 汽油
  • 停車
  • 飯店
  • Transportation
  • 通訊
  • 娛樂
  • 搭飛機
  • 訓練
  • 藥房/醫療

收據數據擷取

收據數位化包含不同類型的收據轉換,包括掃描、拍照和列印的複本,以數位格式進行簡化的下游處理。 範例包括費用管理、消費者行為分析、稅務自動化等。使用 Document Intelligence 搭配 OCR (光學字元辨識) 技術可以從這些不同的收據格式擷取及解譯資料。 檔智慧處理可簡化轉換程式,但也大幅減少所需的時間和精力,進而促進高效數據管理和擷取。

使用 Document Intelligence Studio 處理的收據範例

Document Intelligence Studio 中處理的收據範例螢幕擷取畫面。

使用 Document Intelligence 範例標籤工具處理的收據範例:

使用表單範例卷標工具處理的範例收據螢幕快照。

開發選項

Document Intelligence v4.0 (2024-02-29-preview, 2023-10-31-preview) 支援下列工具、應用程式和連結庫:

功能 資源 Model ID
收據模型 Document Intelligence Studio
REST API
C# SDK• Python SDK
Java SDK
JavaScript SDK
prebuilt-receipt

Document Intelligence v3.1 支援下列工具、應用程式和連結庫:

功能 資源 Model ID
收據模型 Document Intelligence Studio
REST API
C# SDK• Python SDK
Java SDK
JavaScript SDK
prebuilt-receipt

Document Intelligence v3.0 支援下列工具、應用程式和連結庫:

功能 資源 Model ID
收據模型 Document Intelligence Studio
REST API
C# SDK• Python SDK
Java SDK
JavaScript SDK
prebuilt-receipt

Document Intelligence v2.1 支援下列工具、應用程式和連結庫:

功能 資源
收據模型 文件智慧標籤工具
REST API
• 用戶端連結庫 SDK
Document Intelligence Docker 容器

輸入需求

  • 若要得到最佳結果,請為每個文件提供一張清晰的照片或高畫質的掃描檔案。

  • 支援的檔案格式:

    模型 PDF 圖片:
    JPEG/JPG、PNG、BMP、TIFF、HEIF
    Microsoft Office:
    Word(DOCX)、Excel(XLSX)、PowerPoint(PPTX)和 HTML
    參閱
    版面配置 ✔ (2024-02-29-preview, 2023-10-31-preview)
    一般文件
    預建
    自訂擷取
    自訂分類 ✔ (2024-02-29-preview)
  • 若使用 PDF 和 TIFF,最多可處理 2000 頁 (若使用免費層訂閱,則只會處理前兩頁)。

  • 用於分析文件的檔案大小是付費 (S0) 層的 500 MB,免費 #F0 層為 4 MB。

  • 影像維度必須介於 50 x 50 像素和 10,000 x 10,000 像素之間。

  • 如果您的 PDF 有密碼鎖定,則必須先移除鎖定才能提交。

  • 針對 1024 x 768 像素影像的擷取文字高度下限為 12 像素。 此尺寸在 150 點/英吋 (DPI) 時大約相當於 8 點文字。

  • 針對自訂模型定型,自訂範本模型的定型資料頁數上限為 500,而自訂神經網路模型的上限則為 50,000。

    • 針對自訂擷取模型定型,範本模型的定型資料大小總計為 50 MB,而神經模型的大小總計則為 1G-MB。

    • 針對自訂分類模型定型,定型資料的大小總計為 1GB (上限為 10,000 頁)。

  • 支援的檔案格式:JPEG、PNG、PDF 和 TIFF。
  • PDF 和 TIFF 支援的頁面額度:文件智慧可以處理標準層訂閱者最多 2,000 頁,或只有免費層訂閱者的前兩頁。
  • 支持的檔案大小:小於 50 MB;最小圖元 50 x 50 圖元;最大圖元 10,000 x 10,000 像素。

收據模型資料擷取

了解 Document Intelligence 如何從收據擷取包括交易時間和日期、商家資訊和金額總計等資料。 您需要下列資源:

  • Azure 訂用帳戶-您可以 免費建立一個訂用帳戶。

  • Azure 入口網站中的 Document Intelligence 執行個體。 您可以使用免費定價層 (F0) 來試用服務。 部署資源之後,選取 [移至資源 ] 以取得您的金鑰和端點。

Azure 入口網站 中金鑰和端點位置的螢幕快照。

注意

文件智慧服務工作室有 v3.1 和 v3.0 API 及更高版本可供使用。

  1. 在 [Document Intelligence Studio] 首頁上,選取 [ 收據]。

  2. 您可以分析範例收據,或上傳您自己的檔案。

  3. 選取 [ 執行分析] 按鈕,並視需要設定 [分析] 選項

    Document Intelligence Studio 中 [執行分析和分析選項] 按鈕的螢幕快照。

文件智慧服務範例標籤工具

  1. 瀏覽至 Document Intelligence 範例工具

  2. 在範例工具首頁上,選取 [ 使用預先建置的模型來取得數據 磚]。

    配置模型分析結果程序的螢幕快照。

  3. 從下拉功能表中選取要分析的表單類型

  4. 從下列選項中選擇您想要分析之檔案的 URL:

  5. 在 [ 來源] 欄位中,從下拉功能表中選取 [URL ]、貼上選取的 URL,然後選取 [ 擷取 ] 按鈕。

    來源位置下拉功能表的螢幕快照。

  6. 在 [文件智慧服務端點] 欄位中,貼上您透過文件智慧服務訂用帳戶取得的端點。

  7. 在 [金鑰] 欄位中,貼上您從文件智慧服務資源取得的金鑰。

    select-form-type 下拉功能表的螢幕快照。

  8. 選取 [ 執行分析]。 Document Intelligence 範例標籤工具會呼叫分析預建 API 並分析文件。

  9. 檢視結果 - 查看擷取的索引鍵/值組、行專案、已擷取的醒目提示文字,以及偵測到的數據表。

    配置模型分析結果作業的螢幕快照。

注意

範例 標籤工具 不支援 BMP 檔案格式。 這是工具的限制,而不是 Document Intelligence 服務的限制。

支援的語言和地區設定

如需支援語言的完整清單,請參閱 我們的 語言支援 — 預先建置的模型 頁面。

欄位擷

名稱 類型​​ 描述 標準化輸出
ReceiptType String 銷售收據類型 逐項
MerchantName String 發行收據的商家名稱
MerchantPhoneNumber 電話號碼 列出的商家電話號碼 +1 xxx xxx xxxx
MerchantAddress String 已列出的商家位址
TransactionDate Date 收到日期 yyyy-mm-dd
TransactionTime Time 發出收據的時間 hh-mm-ss (24 小時)
總數 數位(美元) 收據的完整交易總計 雙十進位浮點數
小計 數位(美元) 小計收據,通常套用稅前 雙十進位浮點數
稅額 數位(美元) 收據總稅(通常為營業稅或對等)。 在 2022-06-30 版本中重新命名為 “TotalTax”。 雙十進位浮點數
提示 數位(美元) 買家包含的提示 雙十進位浮點數
項目 物件陣列 擷取的明細專案,其名稱、數量、單價和總價格已擷取
名稱 String 專案描述。 在 2022-06-30 版本中重新命名為「描述」。
數量 數字 每個項目的數量 雙十進位浮點數
價格 數字 每個項目單位的個別價格 雙十進位浮點數
TotalPrice 數字 明細專案的總價格 雙十進位浮點數

Document Intelligence v3.0 和更新版本引進數個新功能。 除了熱感紙收據之外,收據模型還支援所有收據類型的單頁旅館收據處理和稅務詳細資料擷取。

Document Intelligence v4.0 和更新版本針對熱和酒店收據的所有價格相關字段引進了貨幣支援。

收據

欄位 類型 描述 範例
MerchantName string 發行收據的商家名稱 Contoso
MerchantPhoneNumber phoneNumber 列出的商家電話號碼 987-654-3210
MerchantAddress address 已列出的商家位址 123 主街雷德蒙德, 華盛頓 98052
Total number 收據的完整交易總計 $14.34
TransactionDate date 收到日期 2019 年 6 月 6 日
TransactionTime time 發出收據的時間 下午 4:49
Subtotal number 小計收據,通常套用稅前 $12.34
TotalTax number 收據稅、通常營業稅或對等稅 $2.00
Tip number 買家包含的提示 $1.00
Items array
Items.* object 擷取的明細項目 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number 明細專案的總價格 $999.00
Items.*.Description string 專案描述 Surface Pro 6
Items.*.Quantity number 每個項目的數量 1
Items.*.Price number 每個項目單位的個別價格 $999.00
Items.*.ProductCode string 與特定明細專案相關聯的產品名稱、產品名稱或 SKU A123
Items.*.QuantityUnit string 每個項目的數量單位
TaxDetails array
TaxDetails.* object 擷取的明細項目 1
Surface Pro 6
$999.00
$999.00
TaxDetails.*.Amount currency 稅務金額詳細資料 $999.00

receipt.retailMeal

欄位 類型 描述 範例
MerchantName string 發行收據的商家名稱 Contoso
MerchantPhoneNumber phoneNumber 列出的商家電話號碼 987-654-3210
MerchantAddress address 已列出的商家位址 123 主街雷德蒙德, 華盛頓 98052
Total number 收據的完整交易總計 $14.34
TransactionDate date 收到日期 2019 年 6 月 6 日
TransactionTime time 發出收據的時間 下午 4:49
Subtotal number 小計收據,通常套用稅前 $12.34
TotalTax number 收據稅、通常營業稅或對等稅 $2.00
Tip number 買家包含的提示 $1.00
Items array
Items.* object 擷取的明細項目 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number 明細專案的總價格 $999.00
Items.*.Description string 專案描述 Surface Pro 6
Items.*.Quantity number 每個項目的數量 1
Items.*.Price number 每個項目單位的個別價格 $999.00
Items.*.ProductCode string 與特定明細專案相關聯的產品名稱、產品名稱或 SKU A123
Items.*.QuantityUnit string 每個項目的數量單位
TaxDetails array
TaxDetails.* object 擷取的明細項目 1
Surface Pro 6
$999.00
$999.00
TaxDetails.*.Amount currency 稅務金額詳細資料 $999.00

receipt.creditCard

欄位 類型 描述 範例
MerchantName string 發行收據的商家名稱 Contoso
MerchantPhoneNumber phoneNumber 列出的商家電話號碼 987-654-3210
MerchantAddress address 已列出的商家位址 123 主街雷德蒙德, 華盛頓 98052
Total number 收據的完整交易總計 $14.34
TransactionDate date 收到日期 2019 年 6 月 6 日
TransactionTime time 發出收據的時間 下午 4:49
Subtotal number 小計收據,通常套用稅前 $12.34
TotalTax number 收據稅、通常營業稅或對等稅 $2.00
Tip number 買家包含的提示 $1.00
Items array
Items.* object 擷取的明細項目 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number 明細專案的總價格 $999.00
Items.*.Description string 專案描述 Surface Pro 6
Items.*.Quantity number 每個項目的數量 1
Items.*.Price number 每個項目單位的個別價格 $999.00
Items.*.ProductCode string 與特定明細專案相關聯的產品名稱、產品名稱或 SKU A123
Items.*.QuantityUnit string 每個項目的數量單位
TaxDetails array
TaxDetails.* object 擷取的明細項目 1
Surface Pro 6
$999.00
$999.00
TaxDetails.*.Amount currency 稅務金額詳細資料 $999.00

receipt.gas

欄位 類型 描述 範例
MerchantName string 發行收據的商家名稱 Contoso
MerchantPhoneNumber phoneNumber 列出的商家電話號碼 987-654-3210
MerchantAddress address 已列出的商家位址 123 主街雷德蒙德, 華盛頓 98052
Total number 收據的完整交易總計 $14.34
TransactionDate date 收到日期 2019 年 6 月 6 日
TransactionTime time 發出收據的時間 下午 4:49
Subtotal number 小計收據,通常套用稅前 $12.34
TotalTax number 收據稅、通常營業稅或對等稅 $2.00
Tip number 買家包含的提示 $1.00
Items array
Items.* object 擷取的明細項目 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number 明細專案的總價格 $999.00
Items.*.Description string 專案描述 Surface Pro 6
Items.*.Quantity number 每個項目的數量 1
Items.*.Price number 每個項目單位的個別價格 $999.00
Items.*.ProductCode string 與特定明細專案相關聯的產品名稱、產品名稱或 SKU A123
Items.*.QuantityUnit string 每個項目的數量單位
TaxDetails array
TaxDetails.* object 擷取的明細項目 1
Surface Pro 6
$999.00
$999.00
TaxDetails.*.Amount currency 稅務金額詳細資料 $999.00

receipt.parking

欄位 類型 描述 範例
MerchantName string 發行收據的商家名稱 Contoso
MerchantPhoneNumber phoneNumber 列出的商家電話號碼 987-654-3210
MerchantAddress address 已列出的商家位址 123 主街雷德蒙德, 華盛頓 98052
Total number 收據的完整交易總計 $14.34
TransactionDate date 收到日期 2019 年 6 月 6 日
TransactionTime time 發出收據的時間 下午 4:49
Subtotal number 小計收據,通常套用稅前 $12.34
TotalTax number 收據稅、通常營業稅或對等稅 $2.00
Tip number 買家包含的提示 $1.00
Items array
Items.* object 擷取的明細項目 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number 明細專案的總價格 $999.00
Items.*.Description string 專案描述 Surface Pro 6
Items.*.Quantity number 每個項目的數量 1
Items.*.Price number 每個項目單位的個別價格 $999.00
Items.*.ProductCode string 與特定明細專案相關聯的產品名稱、產品名稱或 SKU A123
Items.*.QuantityUnit string 每個項目的數量單位
TaxDetails array
TaxDetails.* object 擷取的明細項目 1
Surface Pro 6
$999.00
$999.00
TaxDetails.*.Amount currency 稅務金額詳細資料 $999.00

receipt.hotel

欄位 類型 描述 範例
MerchantName string 發行收據的商家名稱 Contoso
MerchantPhoneNumber phoneNumber 列出的商家電話號碼 987-654-310
MerchantAddress address 已列出的商家位址 123 主街雷德蒙德, 華盛頓 98052
Total number 收據的完整交易總計 $14.34
ArrivalDate date 抵達日期 27Mar21
DepartureDate date 出發日期 28Mar21
Currency string 如果找到多個值,則為收據金額的貨幣單位 (ISO 4217) 或 '混合' USD
MerchantAliases array
MerchantAliases.* string 商家的替代名稱 Contoso (R)
Items array
Items.* object 擷取的明細項目 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number 明細專案的總價格 $999.00
Items.*.Description string 專案描述 房間費用
Items.*.Date date 專案日期 27Mar21
Items.*.Category string 項目類別 會議室

移轉指南和 REST API v3.1

下一步