共用方式為


Document Intelligence 收據模型

重要

  • 文件智慧服務公開預覽版本可讓您搶先存取正在積極開發的功能。
  • 根據使用者意見反應,功能、方法和流程在正式發行 (GA) 前可能有所變更。
  • 文件智慧服務用戶端程式庫的公開預覽版本預設為 REST API 版本 2024-02-29-preview
  • 公開預覽版本 2024-02-29-preview 目前僅適用於下列 Azure 區域:
  • 美國東部
  • 美國西部 2
  • 西歐

此內容適用於:勾選記號 v4.0 (預覽版) | 舊版:blue-checkmark v3.1 (GA) blue-checkmark v3.0 (GA) blue-checkmark v2.1 (GA)

此內容適用於:勾選記號 v3.1 (GA) | 最新版本:purple-checkmark v4.0 (預覽版) | 舊版:blue-checkmark v3.0 blue-checkmark v2.1

此內容適用於:勾選記號 v3.0 (GA) | 最新版本:purple-checkmark v4.0 (預覽版) purple-checkmark v3.1 | 舊版:blue-checkmark v2.1

此內容適用於:勾選記號 v2.1 | 最新版本:blue-checkmark v4.0 (預覽版)

Document Intelligence 收據模型結合了強大的光學字元辨識 (OCR) 功能與深度學習模型,以分析和擷取銷售收據中的關鍵資訊。 收據可能有各種格式且品質不一,包括列印和手寫的收據。 API 會擷取商家名稱、商家電話號碼、交易日期、稅金和交易總計等重要資訊,並傳回結構化的 JSON 資料。

支援的收據類型:

  • 熱氣
  • 信用卡
  • 汽油
  • 停車
  • 飯店
  • Transportation
  • 通訊
  • 娛樂
  • 搭飛機
  • 訓練
  • 藥局/醫療

收據資料擷取

收據數位化包含不同類型的收據轉換,包括掃描、拍照和列印的複本,以數位格式進行簡化的下游處理。 範例包括費用管理、消費者行為分析、稅務自動化等。使用 Document Intelligence 搭配 OCR (光學字元辨識) 技術可以從這些不同的收據格式擷取及解譯資料。 文件智慧服務處理可簡化轉換流程,也大幅減少所需的時間和精力,進而促進有效率的資料管理和擷取。

使用 Document Intelligence Studio 處理的收據範例

Document Intelligence Studio 中處理的收據範例螢幕擷取畫面。

使用 Document Intelligence 範例標籤工具處理的收據範例:

使用表單範例標記工具處理的收據範例螢幕擷取畫面。

開發選項

文件智慧服務 v4.0 (2024-02-29-preview、2023-10-31-preview) 支援下列工具、應用程式和程式庫:

功能 資源 Model ID
收據模型 文件智慧服務工作室
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-receipt

文件智慧服務 v3.1 支援下列工具、應用程式和程式庫:

功能 資源 Model ID
收據模型 文件智慧服務工作室
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-receipt

文件智慧服務 v3.0 支援下列工具、應用程式和程式庫:

功能 資源 Model ID
收據模型 文件智慧服務工作室
REST API
C# SDK
Python SDK
JAVA SDK
JavaScript SDK
prebuilt-receipt

文件智慧服務 v2.1 支援下列工具、應用程式和程式庫:

功能 資源
收據模型 文件智慧服務標記工具
REST API
用戶端-程式庫 SDK
文件智慧服務 Docker 容器

輸入需求

  • 若要得到最佳結果,請為每個文件提供一張清晰的照片或高畫質的掃描檔案。

  • 支援的檔案格式:

    模型 PDF 影像:
    JPEG/JPG、PNG、BMP、TIFF、HEIF
    Microsoft Office:
    Word (DOCX)、Excel (XLSX)、PowerPoint (PPTX)、HTML
    參閱
    版面配置 ✔ (2024-02-29-preview、2023-10-31-preview)
    一般文件
    預建
    自訂擷取
    自訂分類 ✔ (2024-02-29-preview)
  • 若使用 PDF 和 TIFF,最多可處理 2000 頁 (若使用免費層訂閱,則只會處理前兩頁)。

  • 對於付費 (S0) 層,分析文件的檔案大小為 500 MB,對於免費 (F0) 層,則為 4 MB。

  • 影像維度必須介於 50 x 50 像素和 10,000 x 10,000 像素之間。

  • 如果您的 PDF 有密碼鎖定,則必須先移除鎖定才能提交。

  • 針對 1024 x 768 像素影像的擷取文字高度下限為 12 像素。 此尺寸在 150 點/英吋 (DPI) 時大約相當於 8 點文字。

  • 針對自訂模型定型,自訂範本模型的定型資料頁數上限為 500,而自訂神經網路模型的上限則為 50,000。

    • 針對自訂擷取模型定型,範本模型的定型資料大小總計為 50 MB,而神經模型的大小總計則為 1G-MB。

    • 針對自訂分類模型定型,定型資料的大小總計為 1GB (上限為 10,000 頁)。

  • 支援的檔案格式:JPEG、PNG、PDF 和 TIFF。
  • PDF 和 TIFF 支援的頁面允許額度:文件智慧服務最多可為標準層訂閱者處理 2000 頁,或為免費層訂閱者只處理前兩頁。
  • 支援的檔案大小:小於 50 MB;最小像素 50 x 50 像素;最大像素 10,000 x 10,000 像素。

收據模型資料擷取

了解 Document Intelligence 如何從收據擷取包括交易時間和日期、商家資訊和金額總計等資料。 您需要下列資源:

Azure 入口網站中金鑰與端點位置的螢幕擷取畫面。

注意

文件智慧服務工作室有 v3.1 和 v3.0 API 及更高版本可供使用。

  1. 在文件智慧服務工作室首頁上,選取 [收據]

  2. 您可以分析範例收據,或上傳您自己的檔案。

  3. 選取 [執行分析] 按鈕,如有必要,設定 [分析選項]

    文件智慧服務工作室中 [執行分析] 和 [分析選項] 按鈕的螢幕擷取畫面。

文件智慧服務範例標籤工具

  1. 瀏覽至 Document Intelligence 範例工具

  2. 在範例工具首頁上,選取 [使用預建模型來取得資料] 圖格。

    版面配置模型分析結果流程的螢幕擷取畫面。

  3. 從下拉式功能表選取要分析的 [表單類型]

  4. 從下列選項中選擇您想要分析的檔案 URL:

  5. 在 [來源] 欄位中,從下拉式功能表中選取 [URL],貼上選取的 URL,然後選取 [擷取] 按鈕。

    來源位置下拉式功能表的螢幕擷取畫面。

  6. 在 [文件智慧服務端點] 欄位中,貼上您透過文件智慧服務訂用帳戶取得的端點。

  7. 在 [金鑰] 欄位中,貼上您從文件智慧服務資源取得的金鑰。

    [選取表單類型] 下拉式功能表的螢幕擷取畫面。

  8. 選取 [Run analysis] (執行分析)。 Document Intelligence 範例標籤工具會呼叫分析預建 API 並分析文件。

  9. 檢視結果 - 查看擷取的索引鍵/值組、明細項目、擷取的醒目提示文字和偵測到的資料表。

    版面配置模型分析結果作業的螢幕擷取畫面。

注意

範例標記工具不支援 BMP 檔案格式。 這是工具的限制,而不是 Document Intelligence 服務的限制。

支援的語言和地區設定

如需支援語言的完整清單,請參閱我們的語言支援 - 預建模型頁面。

欄位擷取

名稱 類型​​ 描述 標準化輸出
ReceiptType String 銷售收據的類型 明細化
MerchantName String 開立收據的商家名稱
MerchantPhoneNumber 電話號碼 商家的所列電話號碼 +1 xxx xxx xxxx
MerchantAddress String 商家的所列地址
TransactionDate Date 收據開立日期 yyyy-mm-dd
TransactionTime Time 收據開立時間 hh-mm-ss (24 小時)
總數 金額 (美元) 收據的完整交易總計 十進位浮點數
小計 金額 (美元) 收據小計,通常為稅金套用之前 十進位浮點數
稅額 金額 (美元) 收據的總稅額 (通常是銷售稅或對等稅額)。 在 2022-06-30 版本中重新命名為「TotalTax」。 十進位浮點數
提示 金額 (美元) 包含買方支付的小費 十進位浮點數
項目 物件陣列 擷取的商品明細,擷取了其名稱、數量、單價及總價格
名稱 String 項目描述。 在 2022-06-30 版本中重新命名為「Description」
數量 數字 每個項目的數量 十進位浮點數
價格 數字 每個項目單位的個別價格 十進位浮點數
TotalPrice 數字 商品明細的總價格 十進位浮點數

Document Intelligence v3.0 和更新版本引進數個新功能。 除了熱感紙收據之外,收據模型還支援所有收據類型的單頁旅館收據處理和稅務詳細資料擷取。

文件智慧服務 v4.0 和更新版本針對熱氣和旅館收據的所有價格相關欄位引進了貨幣支援。

收據

欄位 類型 描述 範例
MerchantName string 開立收據的商家名稱 Contoso
MerchantPhoneNumber phoneNumber 商家的所列電話號碼 987-654-3210
MerchantAddress address 商家的所列地址 123 Main St. Redmond, Washington 98052
Total number 收據的完整交易總計 $14.34
TransactionDate date 收據開立日期 2019 年 6 月 6 日
TransactionTime time 收據開立時間 下午 4:49
Subtotal number 收據小計,通常為稅金套用之前 $12.34
TotalTax number 收據的稅額,通常是銷售稅或對等稅額 $2.00
Tip number 包含買方支付的小費 $1.00
Items array
Items.* object 擷取的明細項目 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number 商品明細的總價格 $999.00
Items.*.Description string 項目描述 Surface Pro 6
Items.*.Quantity number 每個項目的數量 1
Items.*.Price number 每個項目單位的個別價格 $999.00
Items.*.ProductCode string 與特定商品明細相關聯的產品編號、產品名稱或 SKU A123
Items.*.QuantityUnit string 每個項目的數量單位
TaxDetails array
TaxDetails.* object 擷取的明細項目 1
Surface Pro 6
$999.00
$999.00
TaxDetails.*.Amount currency 稅務金額詳細資料 $999.00

receipt.retailMeal

欄位 類型 描述 範例
MerchantName string 開立收據的商家名稱 Contoso
MerchantPhoneNumber phoneNumber 商家的所列電話號碼 987-654-3210
MerchantAddress address 商家的所列地址 123 Main St. Redmond, Washington 98052
Total number 收據的完整交易總計 $14.34
TransactionDate date 收據開立日期 2019 年 6 月 6 日
TransactionTime time 收據開立時間 下午 4:49
Subtotal number 收據小計,通常為稅金套用之前 $12.34
TotalTax number 收據的稅額,通常是銷售稅或對等稅額 $2.00
Tip number 包含買方支付的小費 $1.00
Items array
Items.* object 擷取的明細項目 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number 商品明細的總價格 $999.00
Items.*.Description string 項目描述 Surface Pro 6
Items.*.Quantity number 每個項目的數量 1
Items.*.Price number 每個項目單位的個別價格 $999.00
Items.*.ProductCode string 與特定商品明細相關聯的產品編號、產品名稱或 SKU A123
Items.*.QuantityUnit string 每個項目的數量單位
TaxDetails array
TaxDetails.* object 擷取的明細項目 1
Surface Pro 6
$999.00
$999.00
TaxDetails.*.Amount currency 稅務金額詳細資料 $999.00

receipt.creditCard

欄位 類型 描述 範例
MerchantName string 開立收據的商家名稱 Contoso
MerchantPhoneNumber phoneNumber 商家的所列電話號碼 987-654-3210
MerchantAddress address 商家的所列地址 123 Main St. Redmond, Washington 98052
Total number 收據的完整交易總計 $14.34
TransactionDate date 收據開立日期 2019 年 6 月 6 日
TransactionTime time 收據開立時間 下午 4:49
Subtotal number 收據小計,通常為稅金套用之前 $12.34
TotalTax number 收據的稅額,通常是銷售稅或對等稅額 $2.00
Tip number 包含買方支付的小費 $1.00
Items array
Items.* object 擷取的明細項目 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number 商品明細的總價格 $999.00
Items.*.Description string 項目描述 Surface Pro 6
Items.*.Quantity number 每個項目的數量 1
Items.*.Price number 每個項目單位的個別價格 $999.00
Items.*.ProductCode string 與特定商品明細相關聯的產品編號、產品名稱或 SKU A123
Items.*.QuantityUnit string 每個項目的數量單位
TaxDetails array
TaxDetails.* object 擷取的明細項目 1
Surface Pro 6
$999.00
$999.00
TaxDetails.*.Amount currency 稅務金額詳細資料 $999.00

receipt.gas

欄位 類型 描述 範例
MerchantName string 開立收據的商家名稱 Contoso
MerchantPhoneNumber phoneNumber 商家的所列電話號碼 987-654-3210
MerchantAddress address 商家的所列地址 123 Main St. Redmond, Washington 98052
Total number 收據的完整交易總計 $14.34
TransactionDate date 收據開立日期 2019 年 6 月 6 日
TransactionTime time 收據開立時間 下午 4:49
Subtotal number 收據小計,通常為稅金套用之前 $12.34
TotalTax number 收據的稅額,通常是銷售稅或對等稅額 $2.00
Tip number 包含買方支付的小費 $1.00
Items array
Items.* object 擷取的明細項目 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number 商品明細的總價格 $999.00
Items.*.Description string 項目描述 Surface Pro 6
Items.*.Quantity number 每個項目的數量 1
Items.*.Price number 每個項目單位的個別價格 $999.00
Items.*.ProductCode string 與特定商品明細相關聯的產品編號、產品名稱或 SKU A123
Items.*.QuantityUnit string 每個項目的數量單位
TaxDetails array
TaxDetails.* object 擷取的明細項目 1
Surface Pro 6
$999.00
$999.00
TaxDetails.*.Amount currency 稅務金額詳細資料 $999.00

receipt.parking

欄位 類型 描述 範例
MerchantName string 開立收據的商家名稱 Contoso
MerchantPhoneNumber phoneNumber 商家的所列電話號碼 987-654-3210
MerchantAddress address 商家的所列地址 123 Main St. Redmond, Washington 98052
Total number 收據的完整交易總計 $14.34
TransactionDate date 收據開立日期 2019 年 6 月 6 日
TransactionTime time 收據開立時間 下午 4:49
Subtotal number 收據小計,通常為稅金套用之前 $12.34
TotalTax number 收據的稅額,通常是銷售稅或對等稅額 $2.00
Tip number 包含買方支付的小費 $1.00
Items array
Items.* object 擷取的明細項目 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number 商品明細的總價格 $999.00
Items.*.Description string 項目描述 Surface Pro 6
Items.*.Quantity number 每個項目的數量 1
Items.*.Price number 每個項目單位的個別價格 $999.00
Items.*.ProductCode string 與特定商品明細相關聯的產品編號、產品名稱或 SKU A123
Items.*.QuantityUnit string 每個項目的數量單位
TaxDetails array
TaxDetails.* object 擷取的明細項目 1
Surface Pro 6
$999.00
$999.00
TaxDetails.*.Amount currency 稅務金額詳細資料 $999.00

receipt.hotel

欄位 類型 描述 範例
MerchantName string 開立收據的商家名稱 Contoso
MerchantPhoneNumber phoneNumber 商家的所列電話號碼 987-654-310
MerchantAddress address 商家的所列地址 123 Main St. Redmond, Washington 98052
Total number 收據的完整交易總計 $14.34
ArrivalDate date 抵達日期 27Mar21
DepartureDate date 出發日期 28Mar21
Currency string 如果找到多個值,則為收據金額的貨幣單位 (ISO 4217) 或 '混合' USD
MerchantAliases array
MerchantAliases.* string 商家的別名 Contoso (R)
Items array
Items.* object 擷取的明細項目 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number 商品明細的總價格 $999.00
Items.*.Description string 項目描述 房間費用
Items.*.Date date 項目日期 27Mar21
Items.*.Category string 項目類別 會議室

移轉指南和 REST API v3.1

下一步