分享方式:


文件智慧服務發票模型

重要

  • 文件智慧服務公開預覽版本可讓您搶先存取正在積極開發的功能。 根據使用者意見反應,功能、方法和流程在正式發行 (GA) 前可能有所變更。
  • 文件智慧服務用戶端程式庫的公開預覽版預設為 REST API 版本 2024-07-31-preview
  • 公開預覽版 2024-07-31-preview 目前僅適用於下列 Azure 地區。 請注意,AI Studio 中的自訂生成 (文件欄位擷取) 模型僅適用美國中北部地區:
    • 美國東部
    • 美國西部 2
    • 西歐
    • 美國中北部

此內容適用於:勾選記號 v4.0 (預覽版) | 舊版:blue-checkmark v3.1 (GA) blue-checkmark v3.0 (GA) blue-checkmark v2.1 (GA)

此內容適用於:勾選記號 v3.1 (GA) | 最新版本:purple-checkmark v4.0 (預覽版) | 舊版:blue-checkmark v3.0 blue-checkmark v2.1

此內容適用於:勾選記號 v3.0 (GA) | 最新版本:purple-checkmark v4.0 (預覽版) purple-checkmark v3.1 | 舊版:blue-checkmark v2.1

此內容適用於:勾選記號 v2.1 | 最新版本:blue-checkmark v4.0 (預覽版)

文件智慧服務發票模型使用功能強大的光學字元辨識 (OCR) 功能,從銷售發票、公用事業帳單和訂購單中分析和擷取索引碼欄位和明細項目。 發票的格式與品質有各種類型,包括手機擷取的影像、掃描文件與數位 PDF。 API 會分析發票文字,擷取如客戶名稱、帳單地址、到期日和到期金額等重要資訊,以及傳回結構化 JSON 資料表示。 此模型目前支援 27 種語言的發票。

支援的文件類型:

  • 發票
  • 公用事業帳單
  • 銷售訂單
  • 採購單

自動化發票處理

自動化發票處理是從計費帳戶檔擷取密鑰 accounts payable 字段的程式。 擷取的資料包括發票的明細項目,這些發票已與應付帳款 (AP) 工作流程整合以供檢閱和付款。 在過去,應付帳款的程序都是手動執行,因此非常耗時。 從發票中精確擷取主要資料通常是發票自動化程序中的第一個且最重要的步驟之一。

使用文件智慧服務工作室處理的發票範例

螢幕擷取畫面顯示文件智慧服務工作室中分析的發票範例。

使用文件智慧服務範例標籤工具處理的發票範例:

發票範例的螢幕擷取畫面。

開發選項

文件智慧服務 v4.0 (2024-07-31-preview) 支援以下工具、應用程式和程式庫:

功能 資源 Model ID
發票模型 文件智慧服務工作室
REST API
C# SDK
Python SDK
JAVA SDK
JavaScript SDK
prebuilt-invoice

文件智慧服務 v3.1 支援下列工具、應用程式和程式庫:

功能 資源 Model ID
發票模型 文件智慧服務工作室
REST API
C# SDK
Python SDK
JAVA SDK
JavaScript SDK
prebuilt-invoice

文件智慧服務 v3.0 支援下列工具、應用程式和程式庫:

功能 資源 Model ID
發票模型 文件智慧服務工作室
REST API
C# SDK
Python SDK
JAVA SDK
JavaScript SDK
prebuilt-invoice

文件智慧服務 v2.1 支援下列工具、應用程式和程式庫:

功能 資源
發票模型 文件智慧服務標記工具
REST API
用戶端-程式庫 SDK
文件智慧服務 Docker 容器

輸入需求

  • 支援的檔案格式:

    模型 PDF 影像:
    JPEG/JPGPNGBMPTIFFHEIF
    Microsoft Office:
    Word (DOCX)、Excel (XLSX)、PowerPoint (PPTX)、HTML
    參閱
    版面配置 ✔ (2024-07-31-preview、2024-02-29-preview、2023-10-31-preview)
    一般文件
    預建
    自訂擷取
    自訂分類 ✔ (2024-07-31-preview、2024-02-29-preview)
  • 若要得到最佳結果,請為每個文件提供一張清晰的照片或高畫質的掃描檔案。

  • 若使用 PDF 和 TIFF,最多可處理 2,000 頁 (若使用免費層訂閱,則只會處理前兩頁)。

  • 付費 (S0) 層分析文件的檔案大小為 500 MB,免費 (F0) 層則為 4 MB。

  • 影像維度必須介於 50 像素 x 50 像素和 10,000 像素 x 10,000 像素之間。

  • 如果您的 PDF 有密碼鎖定,則必須先移除鎖定才能提交。

  • 針對 1024 x 768 像素影像的擷取文字高度下限為 12 像素。 此維度在 150 點/英吋 (DPI) 時大約相當於 8 點文字。

  • 針對自訂模型定型,自訂範本模型的定型資料頁數上限為 500,而自訂神經網路模型的上限則為 50,000。

    • 對於自訂擷取模型定型,範本模型的定型資料大小總計為 50 MB,而神經模型的大小總計則為 1 GB。

    • 針對自訂分類模型定型,定型資料的大小總計為 1 GB (上限為 10,000 頁)。 對於 2024-07-31-preview 和更新版本,定型資料的大小總計為 2 GB,最多 10,000 頁。

  • 支援的檔案格式有:JPEG、PNG、PDF、TIFF。
  • 支援 PDF 和 TIFF,最多可以處理 2,000 頁。 若是免費層訂閱者,只會處理前兩頁。
  • 檔案大小必須小於 50 MB,尺寸至少 50 x 50 像素,最大為 10,000 x 10,000 像素。

發票模型資料擷取

了解如何從發票擷取資料,包括客戶資訊、廠商詳細資料與明細項目。 您需要下列資源:

Azure 入口網站中金鑰與端點位置的螢幕擷取畫面。

  1. 文件智慧服務工作室首頁上,選取 [發票]

  2. 您可以分析範例發票,或上傳您自己的檔案。

  3. 選取 [執行分析] 按鈕,並視需要設定 [分析選項]

    文件智慧服務工作室中 [執行分析] 和 [分析選項] 按鈕的螢幕擷取畫面。

文件智慧服務範例標籤工具

  1. 瀏覽至 Document Intelligence 範例工具

  2. 在範例工具首頁上,選取 [使用預建模型來取得資料] 圖格。

    螢幕擷取畫面顯示版面配置模型分析結果程序。

  3. 從下拉式功能表選取要分析的 [表單類型]

  4. 從下列選項中選擇您想要分析的檔案 URL:

  5. 在 [來源] 欄位中,從下拉式功能表中選取 [URL],貼上選取的 URL,然後選取 [擷取] 按鈕。

    來源位置下拉式功能表的螢幕擷取畫面。

  6. 在 [文件智慧服務端點] 欄位中,貼上您透過文件智慧服務訂用帳戶取得的端點。

  7. 在 [金鑰] 欄位中,貼上您從文件智慧服務資源取得的金鑰。

    螢幕擷取畫面顯示 [選取表單類型] 下拉式功能表。

  8. 選取 [Run analysis] (執行分析)。 Document Intelligence 範例標籤工具會呼叫分析預建 API 並分析文件。

  9. 檢視結果:查看擷取的索引鍵/值組、明細項目、擷取的醒目提示文字和偵測到的資料表。

    螢幕擷取畫面顯示版面配置模型分析結果作業。

注意

範例標記工具不支援 BMP 檔案格式。 這是工具的限制,而不是 Document Intelligence 服務的限制。

支援的語言和地區設定

如需支持語言的完整清單, 請參閱 我們 預先建置的模型語言支持 頁面。

欄位擷取

  • 如需支持的檔擷取欄位,請參閱 GitHub 範例存放庫中的 發票模型架構 頁面。

  • 擷取的發票機碼值組和商品明細位於 JSON 輸出的 documentResults 區段中。

索引鍵/值組

預建的發票 2022-06-30 和更新版本支援選用傳回索引鍵/值組。 根據預設,會停用索引鍵/值組傳回。 機碼值組是發票的特定範圍,可辨別標籤或索引碼,以及與其相關聯的回應或值。 在發票中,這些組可以是標籤,以及使用者針對該欄位或電話號碼輸入的值。 AI 模型已定型,可根據各種不同的檔案類型、格式和結構來擷取可識別的索引碼和值。

若模型偵測到索引鍵存在,且沒有相關聯的值或處理選用欄位時,索引鍵也可以單獨存在。 例如,在某些情況下,表單上的中間名稱欄位可以留空。 索引鍵/值組一律是文件中所包含的文字範圍。 若是文件對相同的值有不同的描述方式,例如客戶/使用者,則相關聯的關鍵為客戶或使用者,視前後文而定。

擷取的欄位

發票服務會擷取文字、資料表和 26 個發票欄位。 以下為從 JSON 輸出回應的發票中所擷取的欄位 (下列輸出會使用此發票範例)。

名稱 類型​​ 描述 Text 值 (標準化輸出)
CustomerName string 被開立發票的客戶 Microsoft Corp
CustomerId string 該客戶的參考識別碼 CID-12345
PurchaseOrder string 購買訂單參考編號 PO-3333
InvoiceId string 此特定發票的識別碼 (通常稱「發票編號」) INV-100
InvoiceDate date 發票發行日期 11/15/2019 2019-11-15
到期日期 date 此發票的付款日期已到期 2019/12/15 2019-12-15
VendorName 字串 建立發票的廠商 CONTOSO
VendorAddress string 廠商的郵寄地址 123 456th St New York, NY, 10001
VendorAddressRecipient string 與 VendorAddress 相關聯的名稱 Contoso Headquarters
CustomerAddress string 客戶的郵寄地址 123 Other Street, Redmond, Washington 98052
BillingAddressRecipient string 與 CustomerAddress 相關聯的名稱 Microsoft Corp
BillingAddress string 客戶的正確帳單位址 123 Bill Street, Redmond, Washington 98052
BillingAddressRecipient string 與 BillingAddress 相關聯的名稱 Microsoft 服務
ShippingAddress string 客戶的正確出貨地址 123 Ship Street, Redmond, Washington 98052
BillingAddressRecipient string 與出貨地址相關聯的名稱 Microsoft Delivery
小計總計 數值 此發票上指明的小計欄位 $100.00 100
TotalTax 數值 此發票上指明的稅金總計欄位 $10.00 10
InvoiceTotal 數值 與此發票相關聯的新費用總計 $110.00 110
AmountDue 數值 因廠商而產生的金額總計 $610.00 610
ServiceAddress string 客戶的正確服務地址或資產地址 123 Service Street, Redmond, Washington 98052
BillingAddressRecipient string 與 ServiceAddress 相關聯的名稱 Microsoft 服務
RemittanceAddress string 客戶的正確匯款或付款地址 123 Remit St New York, NY, 10001
RemittanceAddressRecipient string 與 RemittanceAddress 相關聯的名稱 Contoso Billing
ServiceStartDate date 服務期間的第一個日期 (例如,水電費帳單服務期間) 10/14/2019 2019-10-14
ServiceEndDate date 服務期間的結束日期 (例如,水電費帳單服務期間) 11/14/2019 2019-11-14
PreviousUnpaidBalance 數值 明確的之前未付餘額 $500.00 500

以下為從 JSON 輸出回應的發票中所擷取的明細項目,且使用此發票範例

名稱 類型​​ 描述 文字 (商品明細 #1) 值 (標準化輸出)
項目 string 商品明細的完整字串文字行 3/4/2021 A123 諮詢服務 2 小時 $30.00 10% $60.00
總數 數值 商品明細金額 $60.00 100
描述 string 發票商品明細的文字描述 諮詢服務 諮詢服務
數量 數值 此發票商品明細的數量 2 2
UnitPrice 數值 此商品一個單位的淨價格或總價格 (依據發票的總計發票設定而定) $30.00 30
ProductCode string 與特定商品明細相關聯的產品編號、產品名稱或 SKU A123
單位 string 商品明細的單位,例如 kg、lb 等。 小時
Date date 對應至每個商品明細的日期。 通常是出貨商品明細的日期 3/4/2021 2021-03-04
稅額 數值 與每個商品明細相關聯的稅金。 可能的值包括稅額、稅金 % 與稅金 Y/N 10%

以下是從 JSON 輸出回應中的發票所擷取的複雜欄位:

TaxDetails

稅務詳細資料會定義套用至發票總計的特定稅金。

名稱 類型​​ 描述 文字 (商品明細 #1) 值 (標準化輸出)
項目 字串 稅務項目的完整字串文字行 V.A.T.15% $60.00
總數 數值 稅賦項目的稅額 60.00 60
費率 字串 稅賦項目的稅率 15%

PaymentDetails

列出欄位中偵測到的所有偵測到之付款選項。

名稱 類型​​ 描述 文字 (商品明細 #1) 值 (標準化輸出)
IBAN 字串 內部銀行客戶編碼 GB33BUKB20201555555555
SWIFT 字串 Swift 代碼 BUKBGB22
BankAccountNumber 字串 銀行帳戶號碼,銀行帳戶的唯一識別碼 123456
BPayBillerCode 字串 澳大利亞 B-Pay 帳單代碼 12345
BPayReference 字串 澳大利亞 B-Pay 參考代碼 98765432100

JSON 輸出

JSON 輸出有三個部分:

  • "readResults" 節點包含所有已辨識的文字和選取標記。 文字會透過頁面彙整,然後依文字行,再依個別字組彙整。
  • "pageResults" 節點包含已擷取的資料表和儲存格,以及其週框方塊、信賴度以及對 readResults 中文句和字組的參考。
  • "documentResults" 節點包含模型探索到的發票特定值和明細項目。 您會在這裡找到發票的所有欄位,例如發票識別碼、收件人、付款人、客戶、總計和明細項目等諸多資訊。

移轉指南

下一步