Document Intelligence 收據模型
重要
- 文件智慧服務公開預覽版本可讓您搶先存取正在積極開發的功能。
- 根據使用者意見反應,功能、方法和流程在正式發行 (GA) 前可能有所變更。
- 文件智慧服務用戶端程式庫的公開預覽版本預設為 REST API 版本 2024-02-29-preview。
- 公開預覽版本 2024-02-29-preview 目前僅適用於下列 Azure 區域:
- 美國東部
- 美國西部 2
- 西歐
此內容適用於: v3.1 (GA) | 最新版本: v4.0 (預覽版) | 舊版: v3.0 v2.1
此內容適用於: v3.0 (GA) | 最新版本: v4.0 (預覽版) v3.1 | 舊版: v2.1
此內容適用於: v2.1 | 最新版本: v4.0 (預覽版)
Document Intelligence 收據模型結合了強大的光學字元辨識 (OCR) 功能與深度學習模型,以分析和擷取銷售收據中的關鍵資訊。 收據可能有各種格式且品質不一,包括列印和手寫的收據。 API 會擷取商家名稱、商家電話號碼、交易日期、稅金和交易總計等重要資訊,並傳回結構化的 JSON 資料。
支援的收據類型:
- 熱氣
- 信用卡
- 汽油
- 停車
- 飯店
- Transportation
- 通訊
- 娛樂
- 搭飛機
- 訓練
- 藥局/醫療
收據資料擷取
收據數位化包含不同類型的收據轉換,包括掃描、拍照和列印的複本,以數位格式進行簡化的下游處理。 範例包括費用管理、消費者行為分析、稅務自動化等。使用 Document Intelligence 搭配 OCR (光學字元辨識) 技術可以從這些不同的收據格式擷取及解譯資料。 文件智慧服務處理可簡化轉換流程,也大幅減少所需的時間和精力,進而促進有效率的資料管理和擷取。
使用 Document Intelligence Studio 處理的收據範例:
使用 Document Intelligence 範例標籤工具處理的收據範例:
開發選項
文件智慧服務 v4.0 (2024-02-29-preview、2023-10-31-preview) 支援下列工具、應用程式和程式庫:
功能 | 資源 | Model ID |
---|---|---|
收據模型 | • 文件智慧服務工作室 • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-receipt |
文件智慧服務 v3.1 支援下列工具、應用程式和程式庫:
功能 | 資源 | Model ID |
---|---|---|
收據模型 | • 文件智慧服務工作室 • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-receipt |
文件智慧服務 v3.0 支援下列工具、應用程式和程式庫:
功能 | 資源 | Model ID |
---|---|---|
收據模型 | • 文件智慧服務工作室 • REST API • C# SDK • Python SDK • JAVA SDK • JavaScript SDK |
prebuilt-receipt |
文件智慧服務 v2.1 支援下列工具、應用程式和程式庫:
功能 | 資源 |
---|---|
收據模型 | • 文件智慧服務標記工具 • REST API • 用戶端-程式庫 SDK • 文件智慧服務 Docker 容器 |
輸入需求
若要得到最佳結果,請為每個文件提供一張清晰的照片或高畫質的掃描檔案。
支援的檔案格式:
模型 PDF 影像:
JPEG/JPG、PNG、BMP、TIFF、HEIFMicrosoft Office:
Word (DOCX)、Excel (XLSX)、PowerPoint (PPTX)、HTML參閱 ✔ ✔ ✔ 版面配置 ✔ ✔ ✔ (2024-02-29-preview、2023-10-31-preview) 一般文件 ✔ ✔ 預建 ✔ ✔ 自訂擷取 ✔ ✔ 自訂分類 ✔ ✔ ✔ (2024-02-29-preview) 若使用 PDF 和 TIFF,最多可處理 2000 頁 (若使用免費層訂閱,則只會處理前兩頁)。
對於付費 (S0) 層,分析文件的檔案大小為 500 MB,對於免費 (F0) 層,則為 4 MB。
影像維度必須介於 50 x 50 像素和 10,000 x 10,000 像素之間。
如果您的 PDF 有密碼鎖定,則必須先移除鎖定才能提交。
針對 1024 x 768 像素影像的擷取文字高度下限為 12 像素。 此尺寸在 150 點/英吋 (DPI) 時大約相當於
8
點文字。針對自訂模型定型,自訂範本模型的定型資料頁數上限為 500,而自訂神經網路模型的上限則為 50,000。
針對自訂擷取模型定型,範本模型的定型資料大小總計為 50 MB,而神經模型的大小總計則為 1G-MB。
針對自訂分類模型定型,定型資料的大小總計為
1GB
(上限為 10,000 頁)。
- 支援的檔案格式:JPEG、PNG、PDF 和 TIFF。
- PDF 和 TIFF 支援的頁面允許額度:文件智慧服務最多可為標準層訂閱者處理 2000 頁,或為免費層訂閱者只處理前兩頁。
- 支援的檔案大小:小於 50 MB;最小像素 50 x 50 像素;最大像素 10,000 x 10,000 像素。
收據模型資料擷取
了解 Document Intelligence 如何從收據擷取包括交易時間和日期、商家資訊和金額總計等資料。 您需要下列資源:
一個 Azure 訂用帳戶 - 您可以建立一個免費訂用帳戶。
Azure 入口網站中的 Document Intelligence 執行個體。 您可以使用免費定價層 (
F0
) 來試用服務。 部署資源後,選取 [前往資源] 以取得金鑰和端點。
注意
文件智慧服務工作室有 v3.1 和 v3.0 API 及更高版本可供使用。
在文件智慧服務工作室首頁上,選取 [收據]。
您可以分析範例收據,或上傳您自己的檔案。
選取 [執行分析] 按鈕,如有必要,設定 [分析選項]:
文件智慧服務範例標籤工具
在範例工具首頁上,選取 [使用預建模型來取得資料] 圖格。
從下拉式功能表選取要分析的 [表單類型]。
從下列選項中選擇您想要分析的檔案 URL:
在 [來源] 欄位中,從下拉式功能表中選取 [URL],貼上選取的 URL,然後選取 [擷取] 按鈕。
在 [文件智慧服務端點] 欄位中,貼上您透過文件智慧服務訂用帳戶取得的端點。
在 [金鑰] 欄位中,貼上您從文件智慧服務資源取得的金鑰。
選取 [Run analysis] (執行分析)。 Document Intelligence 範例標籤工具會呼叫分析預建 API 並分析文件。
檢視結果 - 查看擷取的索引鍵/值組、明細項目、擷取的醒目提示文字和偵測到的資料表。
注意
範例標記工具不支援 BMP 檔案格式。 這是工具的限制,而不是 Document Intelligence 服務的限制。
支援的語言和地區設定
如需支援語言的完整清單,請參閱我們的語言支援 - 預建模型頁面。
欄位擷取
名稱 | 類型 | 描述 | 標準化輸出 |
---|---|---|---|
ReceiptType | String | 銷售收據的類型 | 明細化 |
MerchantName | String | 開立收據的商家名稱 | |
MerchantPhoneNumber | 電話號碼 | 商家的所列電話號碼 | +1 xxx xxx xxxx |
MerchantAddress | String | 商家的所列地址 | |
TransactionDate | Date | 收據開立日期 | yyyy-mm-dd |
TransactionTime | Time | 收據開立時間 | hh-mm-ss (24 小時) |
總數 | 金額 (美元) | 收據的完整交易總計 | 十進位浮點數 |
小計 | 金額 (美元) | 收據小計,通常為稅金套用之前 | 十進位浮點數 |
稅額 | 金額 (美元) | 收據的總稅額 (通常是銷售稅或對等稅額)。 在 2022-06-30 版本中重新命名為「TotalTax」。 | 十進位浮點數 |
提示 | 金額 (美元) | 包含買方支付的小費 | 十進位浮點數 |
項目 | 物件陣列 | 擷取的商品明細,擷取了其名稱、數量、單價及總價格 | |
名稱 | String | 項目描述。 在 2022-06-30 版本中重新命名為「Description」。 | |
數量 | 數字 | 每個項目的數量 | 十進位浮點數 |
價格 | 數字 | 每個項目單位的個別價格 | 十進位浮點數 |
TotalPrice | 數字 | 商品明細的總價格 | 十進位浮點數 |
Document Intelligence v3.0 和更新版本引進數個新功能。 除了熱感紙收據之外,收據模型還支援所有收據類型的單頁旅館收據處理和稅務詳細資料擷取。
文件智慧服務 v4.0 和更新版本針對熱氣和旅館收據的所有價格相關欄位引進了貨幣支援。
收據
欄位 | 類型 | 描述 | 範例 |
---|---|---|---|
MerchantName |
string |
開立收據的商家名稱 | Contoso |
MerchantPhoneNumber |
phoneNumber |
商家的所列電話號碼 | 987-654-3210 |
MerchantAddress |
address |
商家的所列地址 | 123 Main St. Redmond, Washington 98052 |
Total |
number |
收據的完整交易總計 | $14.34 |
TransactionDate |
date |
收據開立日期 | 2019 年 6 月 6 日 |
TransactionTime |
time |
收據開立時間 | 下午 4:49 |
Subtotal |
number |
收據小計,通常為稅金套用之前 | $12.34 |
TotalTax |
number |
收據的稅額,通常是銷售稅或對等稅額 | $2.00 |
Tip |
number |
包含買方支付的小費 | $1.00 |
Items |
array |
||
Items.* |
object |
擷取的明細項目 | 1 Surface Pro 6 $999.00 $999.00 |
Items.*.TotalPrice |
number |
商品明細的總價格 | $999.00 |
Items.*.Description |
string |
項目描述 | Surface Pro 6 |
Items.*.Quantity |
number |
每個項目的數量 | 1 |
Items.*.Price |
number |
每個項目單位的個別價格 | $999.00 |
Items.*.ProductCode |
string |
與特定商品明細相關聯的產品編號、產品名稱或 SKU | A123 |
Items.*.QuantityUnit |
string |
每個項目的數量單位 | |
TaxDetails |
array |
||
TaxDetails.* |
object |
擷取的明細項目 | 1 Surface Pro 6 $999.00 $999.00 |
TaxDetails.*.Amount |
currency |
稅務金額詳細資料 | $999.00 |
receipt.retailMeal
欄位 | 類型 | 描述 | 範例 |
---|---|---|---|
MerchantName |
string |
開立收據的商家名稱 | Contoso |
MerchantPhoneNumber |
phoneNumber |
商家的所列電話號碼 | 987-654-3210 |
MerchantAddress |
address |
商家的所列地址 | 123 Main St. Redmond, Washington 98052 |
Total |
number |
收據的完整交易總計 | $14.34 |
TransactionDate |
date |
收據開立日期 | 2019 年 6 月 6 日 |
TransactionTime |
time |
收據開立時間 | 下午 4:49 |
Subtotal |
number |
收據小計,通常為稅金套用之前 | $12.34 |
TotalTax |
number |
收據的稅額,通常是銷售稅或對等稅額 | $2.00 |
Tip |
number |
包含買方支付的小費 | $1.00 |
Items |
array |
||
Items.* |
object |
擷取的明細項目 | 1 Surface Pro 6 $999.00 $999.00 |
Items.*.TotalPrice |
number |
商品明細的總價格 | $999.00 |
Items.*.Description |
string |
項目描述 | Surface Pro 6 |
Items.*.Quantity |
number |
每個項目的數量 | 1 |
Items.*.Price |
number |
每個項目單位的個別價格 | $999.00 |
Items.*.ProductCode |
string |
與特定商品明細相關聯的產品編號、產品名稱或 SKU | A123 |
Items.*.QuantityUnit |
string |
每個項目的數量單位 | |
TaxDetails |
array |
||
TaxDetails.* |
object |
擷取的明細項目 | 1 Surface Pro 6 $999.00 $999.00 |
TaxDetails.*.Amount |
currency |
稅務金額詳細資料 | $999.00 |
receipt.creditCard
欄位 | 類型 | 描述 | 範例 |
---|---|---|---|
MerchantName |
string |
開立收據的商家名稱 | Contoso |
MerchantPhoneNumber |
phoneNumber |
商家的所列電話號碼 | 987-654-3210 |
MerchantAddress |
address |
商家的所列地址 | 123 Main St. Redmond, Washington 98052 |
Total |
number |
收據的完整交易總計 | $14.34 |
TransactionDate |
date |
收據開立日期 | 2019 年 6 月 6 日 |
TransactionTime |
time |
收據開立時間 | 下午 4:49 |
Subtotal |
number |
收據小計,通常為稅金套用之前 | $12.34 |
TotalTax |
number |
收據的稅額,通常是銷售稅或對等稅額 | $2.00 |
Tip |
number |
包含買方支付的小費 | $1.00 |
Items |
array |
||
Items.* |
object |
擷取的明細項目 | 1 Surface Pro 6 $999.00 $999.00 |
Items.*.TotalPrice |
number |
商品明細的總價格 | $999.00 |
Items.*.Description |
string |
項目描述 | Surface Pro 6 |
Items.*.Quantity |
number |
每個項目的數量 | 1 |
Items.*.Price |
number |
每個項目單位的個別價格 | $999.00 |
Items.*.ProductCode |
string |
與特定商品明細相關聯的產品編號、產品名稱或 SKU | A123 |
Items.*.QuantityUnit |
string |
每個項目的數量單位 | |
TaxDetails |
array |
||
TaxDetails.* |
object |
擷取的明細項目 | 1 Surface Pro 6 $999.00 $999.00 |
TaxDetails.*.Amount |
currency |
稅務金額詳細資料 | $999.00 |
receipt.gas
欄位 | 類型 | 描述 | 範例 |
---|---|---|---|
MerchantName |
string |
開立收據的商家名稱 | Contoso |
MerchantPhoneNumber |
phoneNumber |
商家的所列電話號碼 | 987-654-3210 |
MerchantAddress |
address |
商家的所列地址 | 123 Main St. Redmond, Washington 98052 |
Total |
number |
收據的完整交易總計 | $14.34 |
TransactionDate |
date |
收據開立日期 | 2019 年 6 月 6 日 |
TransactionTime |
time |
收據開立時間 | 下午 4:49 |
Subtotal |
number |
收據小計,通常為稅金套用之前 | $12.34 |
TotalTax |
number |
收據的稅額,通常是銷售稅或對等稅額 | $2.00 |
Tip |
number |
包含買方支付的小費 | $1.00 |
Items |
array |
||
Items.* |
object |
擷取的明細項目 | 1 Surface Pro 6 $999.00 $999.00 |
Items.*.TotalPrice |
number |
商品明細的總價格 | $999.00 |
Items.*.Description |
string |
項目描述 | Surface Pro 6 |
Items.*.Quantity |
number |
每個項目的數量 | 1 |
Items.*.Price |
number |
每個項目單位的個別價格 | $999.00 |
Items.*.ProductCode |
string |
與特定商品明細相關聯的產品編號、產品名稱或 SKU | A123 |
Items.*.QuantityUnit |
string |
每個項目的數量單位 | |
TaxDetails |
array |
||
TaxDetails.* |
object |
擷取的明細項目 | 1 Surface Pro 6 $999.00 $999.00 |
TaxDetails.*.Amount |
currency |
稅務金額詳細資料 | $999.00 |
receipt.parking
欄位 | 類型 | 描述 | 範例 |
---|---|---|---|
MerchantName |
string |
開立收據的商家名稱 | Contoso |
MerchantPhoneNumber |
phoneNumber |
商家的所列電話號碼 | 987-654-3210 |
MerchantAddress |
address |
商家的所列地址 | 123 Main St. Redmond, Washington 98052 |
Total |
number |
收據的完整交易總計 | $14.34 |
TransactionDate |
date |
收據開立日期 | 2019 年 6 月 6 日 |
TransactionTime |
time |
收據開立時間 | 下午 4:49 |
Subtotal |
number |
收據小計,通常為稅金套用之前 | $12.34 |
TotalTax |
number |
收據的稅額,通常是銷售稅或對等稅額 | $2.00 |
Tip |
number |
包含買方支付的小費 | $1.00 |
Items |
array |
||
Items.* |
object |
擷取的明細項目 | 1 Surface Pro 6 $999.00 $999.00 |
Items.*.TotalPrice |
number |
商品明細的總價格 | $999.00 |
Items.*.Description |
string |
項目描述 | Surface Pro 6 |
Items.*.Quantity |
number |
每個項目的數量 | 1 |
Items.*.Price |
number |
每個項目單位的個別價格 | $999.00 |
Items.*.ProductCode |
string |
與特定商品明細相關聯的產品編號、產品名稱或 SKU | A123 |
Items.*.QuantityUnit |
string |
每個項目的數量單位 | |
TaxDetails |
array |
||
TaxDetails.* |
object |
擷取的明細項目 | 1 Surface Pro 6 $999.00 $999.00 |
TaxDetails.*.Amount |
currency |
稅務金額詳細資料 | $999.00 |
receipt.hotel
欄位 | 類型 | 描述 | 範例 |
---|---|---|---|
MerchantName |
string |
開立收據的商家名稱 | Contoso |
MerchantPhoneNumber |
phoneNumber |
商家的所列電話號碼 | 987-654-310 |
MerchantAddress |
address |
商家的所列地址 | 123 Main St. Redmond, Washington 98052 |
Total |
number |
收據的完整交易總計 | $14.34 |
ArrivalDate |
date |
抵達日期 | 27Mar21 |
DepartureDate |
date |
出發日期 | 28Mar21 |
Currency |
string |
如果找到多個值,則為收據金額的貨幣單位 (ISO 4217) 或 '混合' | USD |
MerchantAliases |
array |
||
MerchantAliases.* |
string |
商家的別名 | Contoso (R) |
Items |
array |
||
Items.* |
object |
擷取的明細項目 | 1 Surface Pro 6 $999.00 $999.00 |
Items.*.TotalPrice |
number |
商品明細的總價格 | $999.00 |
Items.*.Description |
string |
項目描述 | 房間費用 |
Items.*.Date |
date |
項目日期 | 27Mar21 |
Items.*.Category |
string |
項目類別 | 會議室 |
移轉指南和 REST API v3.1
- 請遵循我們的 Document Intelligence v3.1 移轉指南 (部分機器翻譯),了解如何在應用程式和工作流程中使用 v3.1 版本。
下一步
使用文件智慧服務工作室嘗試處理您自己的表單和文件。
完成 Document Intelligence 快速入門,並開始以您選擇的開發語言來建立文件處理應用程式。
- 在 GitHub 上尋找更多範例 (英文)。
- 在 GitHub 上尋找更多範例 (英文)。
使用文件智慧服務範例標記工具嘗試處理您自己的表單和文件。
完成 Document Intelligence 快速入門,並開始以您選擇的開發語言來建立文件處理應用程式。
意見反應
https://aka.ms/ContentUserFeedback。
即將登場:在 2024 年,我們將逐步淘汰 GitHub 問題作為內容的意見反應機制,並將它取代為新的意見反應系統。 如需詳細資訊,請參閱:提交並檢視相關的意見反應