分享方式:


Azure AI 文件智慧服務有哪些新增功能

此內容適用於:勾選記號v4.0 (預覽)勾選記號v3.1 (GA)勾選記號v3.0 (GA)勾選記號v2.1 (GA)

文件智慧服務會持續更新。 將此頁面加入書籤,以掌握最新的版本資訊、功能增強內容,以及我們最新的文件。

重要

一旦發行了 GA API,預覽 API 版本就會淘汰。 2023-02-28-preview API 版本即將淘汰,如果您仍在使用預覽 API 或相關聯的 SDK 版本,請更新您的程式碼,以最新的 API 版本 2023-07-31 (GA) 為目標。

2024 年 8 月

文件智慧服務 2024-07-31-preview REST API 現已推出。 此預覽 API 引進了新功能和更新的功能:

  • 公開預覽版本 2024-07-31-preview 目前僅適用於下列 Azure 區域。 AI Studio 中的 (新文件欄位擷取) 模型僅適用美國中北部區域:

  • 美國東部

  • 美國西部 2

  • 西歐

  • 美國中北部

  • 🆕文件欄位擷取 (自訂生成式模型)

    • 使用生成式 AI,從文件和表單中擷取欄位。 文件智慧服務現在提供新的文件欄位擷取模型,利用大型語言模型 (LLM) 從具有各種視覺效果範本的非結構化文件或結構化表單中擷取欄位。 使用基礎值和信賴度分數,新的 [生成式 AI] 會根據您現有的流程擷取適合您的欄位。
  • 🆕模型使用自訂分類器撰寫

  • 自訂分類模型

    • 自訂分類模型現在也支援模型的就地升級。
    • 自訂分類模型新增支援模型複製作業,以啟用備份和災害復原。
    • 自訂分類模型現在支援明確指定輸入文件分類的頁面。
  • 🆕抵押貸款文件模型

    • 從評鑑 (表單 1004) 擷取資訊。
    • 從員工的驗證 (表單 1005) 擷取資訊。
  • 🆕 支票模型

    • 從支票中擷取收款人、金額、日期和其他相關信息。
  • 🆕 薪資單模型

    • 全新的預建模型,用於處理薪資單,以擷取薪資、時數、扣減、凈工資等。
  • 🆕 銀行對帳單模型

    • 全新的預建模型,以擷取帳戶資訊,包括開始和結束餘額、銀行帳單的交易詳細資料。
  • 🆕 美國稅務模型

    • 全新的統一美國稅務模型,可以從 W-2、1098、1099 和 1040 等表單中擷取。
  • 🆕 可搜尋 PDF。 預建的讀取模型現在支援 PDF 輸出,可從擷取結果下載內嵌文字的 PDF,讓 PDF 可用於搜尋內容副本等場景。

  • 版面配置模型現在支援已改善的圖形偵測,現在可以將文件中的圖文框下載為影像檔,以供進一步瞭解。 版面配置模型也針對單一字元、框內文字和密集文字文件的掃描文字目標改善,以改善 OCR 模型。

  • 🆕 Batch API

    • 文件智慧服務現在新增支援批次分析作業,以支援分析一組文件,簡化開發人員體驗並提高效率。
  • 附加元件功能

    • 使用最新的模型來改善查詢欄位擷取的 AI 品質。

2024 年 5 月

Document Intelligence Studio 新增 Microsoft Entra (舊稱為 Azure Active Directory) 驗證的支援。 如需詳細資訊,請參閱文件智慧服務工作室概觀

2024 年 2 月

文件智慧服務 2024-07-31-preview REST API 現已推出。 此預覽 API 引進了新功能和更新的功能:

  • 公開預覽版本 2024-07-31-preview 目前僅適用於下列 Azure 區域:

    • 美國東部
    • 美國西部 2
    • 西歐
  • 版面配置模型現在支援圖片偵測階層式文件結構分析 (章節和小節)。 讀取順序和邏輯角色偵測的 AI 品質也會得到改善。

  • 自訂擷取模型

  • 自訂分類模型

    • 自訂分類模型現在支援累加式訓練,適用於您需要使用已新增的範例或類別來更新分類器模型的案例。 深入了解累加式定型
    • 自訂分類模型新增了 Office 文件類型 (.docx、.pptx和.xls) 的支援。 深入了解擴充的文件類型支援
  • 發票模型

    • 支援新的地區設定:
    地區設定 代碼
    阿拉伯文 ar
    保加利亞文 bg
    希臘文 el
    希伯來文 he
    馬其頓文 mk
    俄文 (ru) 塞爾維亞斯拉夫文 (sr-cyrl)
    烏克蘭文 uk
    泰文 th
    土耳其文 tr
    越南文 vi
    • 支援新的貨幣代碼:
    貨幣 地區設定 代碼
    BAM 波士尼亞可兌換馬克 ba
    BGN 保加利亞列弗 bg
    ILS 以色列新謝克爾 il
    MKD 馬其頓第納爾 mk
    RUB 俄羅斯盧布 ru
    THB 泰銖 th
    TRY 土耳其里拉 tr
    UAH 烏克蘭格里夫納 ua
    VND 越南盾 vn
    • 稅賦項目支援對德國 (de)、西班牙 (es)、葡萄牙 (pt)、英文加拿大 en-CA 的擴充。
  • 識別碼模型

  • 🆕 抵押貸款文件

    • 從統一住宅貸款申請表 (表單 1003) 中擷取資訊。
    • 從統一承保和傳送摘要或表單 1008 中擷取資訊。
    • 從抵押貸款結算披露中擷取資訊。
  • 🆕 信用卡/轉帳卡模型

    • 從銀行卡擷取資訊。
  • 🆕 結婚證書

    • 要從結婚證書中擷取資訊的新預建項目。

2023 年 12 月

以 REST API 2023-10-31-preview 為目標的文件智慧服務用戶端程式庫現在可供使用!

2023 年 11 月

文件智慧服務 2023-10-31-preview REST API 現已推出。 此預覽 API 引進了新功能和更新的功能:

  • 公開預覽版本 2023-10-31-preview 目前僅適用於下列 Azure 區域:

    • 美國東部
    • 美國西部 2
    • 西歐
  • Read 模型

    • 手寫語言擴充:俄文 (ru)、阿拉伯文 (ar)、泰文 (th)。
    • 網路行政命令 (EO) 合規性。
  • 版面配置模型

    • 支援 Office 和 HTML 檔案。
    • Markdown 輸出支援。
    • 資料表擷取、讀取順序和章節標題偵測改善。
    • 有了文件智慧服務 2023-10-31-preview,一般文件模型 (預建文件) 已被取代。 未來,若要從文件中提取索引鍵/值組,請使用已啟用選用查詢字串參數 features=keyValuePairsprebuilt-layout 模型。
  • 收據模型

    • 現在會擷取所有價格相關欄位的貨幣。
  • 健保卡模型

    • 醫療保險和醫療補助資訊的新欄位支援。
  • 美國稅賦文件模型

    • 新的 1099 稅賦模型。 支援基礎 1099 表單和下列變異:A、B、C、CAP、DIV、G、H、INT、K、LS、LTC、MISC、NEC、OID、PATR、Q、QA、R、S、SA、SB。
  • 發票模型

    • 支援 KVK 欄位。
    • 支援 BPAY 欄位。
    • 許多欄位改進。
  • 自訂分類

    • 支援多語言文件。
    • 新的頁面分割選項:自動分割、一律依頁面分割、不分割。
  • 附加元件功能

    • 查詢欄位可搭配 2023-10-31-preview 版本使用。
    • 附加元件功能可在讀取模型以外的所有模型內使用。

注意

隨著 2022-08-31 API 正式發行 (GA),相關聯的預覽 API 即將淘汰。 如果您使用 2021-09-30-preview、2022-01-30-preview 或 2022-06-30-preview API 版本,請更新您的應用程式,以 2022-08-31 API 版本為目標。 如需詳細資訊,請參閱移轉指南

2023 年 7 月

注意

Azure 表格辨識器現在是 Azure AI 文件智慧服務

  • 文件,Azure AI 服務包含先前稱為認知服務和 Azure 應用 AI 服務的所有項目。
  • 價格沒有變更。
  • 認知服務Azure 應用 AI 的名稱會繼續用於 Azure 計費、成本分析、價目表和價格 API。
  • 應用程式開發介面 (API) 或用戶端程式庫沒有任何重大變更。
  • 某些平台仍在等候重新命名更新。 我們文件中的 Azure 表格辨識器或文件智慧服務全都是指相同的 Azure 服務。

文件智慧服務 v3.1 (GA)v3.0 (GA)

文件智慧服務版本 3.1 API 現已正式推出 (GA)! API 版本對應至 2023-07-31。 v3.1 API 引進新功能和更新的功能:

Document Intelligence Studio UX 更新

✔️ 分析選項

  • 文件智慧服務現在支援更複雜的分析功能,而且 Document Intelligence Studio 允許透過單一進入點 ([分析選項] 按鈕) 輕鬆設定附加元件功能。

  • 根據文件擷取案例,設定分析範圍、文件頁面範圍、選擇性偵測和進階偵測功能。

    顯示在工作室中使用 [分析選項] 按鈕來設定選項的動畫幕擷取畫面。

    注意

    字型擷取未在 Document Intelligence Studio 中視覺化。 不過,您可以檢查 JSON 輸出的樣式區段,以取得字型偵測結果。

✔️ 使用預建模型或您自己的模型來自動標記文件

  • 在自訂擷取模型標記頁面中,您現在可以使用其中一個文件智慧服務預建模型或您先前定型的模型來自動標記文件。

    顯示工作室中自動標記作業的動態螢幕擷取畫面。

  • 對於某些文件,在執行自動標記之後可能會有重複的標籤。 請務必修改標籤,以便之後在標籤頁面中沒有重複的標籤。

    顯示進行自動標記之後出現重複標籤警告的螢幕擷取畫面。

✔️ 自動標記資料表

  • 您現在可以在自訂擷取模型標籤頁面中自動標記文件中的資料表,而不需要手動標記資料表。

    顯示工作室中自動標記資料表作業的動態螢幕擷取畫面。

✔️ 將測試檔案直接新增至您的定型資料集

  • 一旦您定型了自訂擷取模型,如有必要,請將測試文件上傳至定型資料集,以使用測試頁面來改善您的模型品質。

  • 如果某些標籤傳回較低的信賴度分數,則請確定標籤正確。 如果未正確標記,請將它們新增至定型資料集並重新標記,以改善模型品質。

顯示如何將測試檔案上傳至定型資料集的動態螢幕擷取畫面。

✔️ 在自訂專案中使用檔案清單選項和篩選

  • 使用自訂擷取模型標記頁面。 您現在可以使用搜尋、篩選和依功能排序來輕鬆瀏覽定型文件。

  • 利用格線檢視來預覽文件,或使用清單檢視更輕鬆地捲動瀏覽文件。

    顯示文件清單檢視選項和篩選的螢幕擷取畫面。

✔️ 專案共用

2023 年 5 月

組建 2023 的重新整理文件簡介

2023 年 4 月

宣佈最新的文件智慧服務用戶端程式庫公開預覽版本

2023 年 3 月

重要

2023-02-28-preview 功能目前僅可在以下區域使用:

  • 西歐
  • 美國西部 2
  • 美國東部
  • 2023-02-28-preview API 起,自訂分類模型是文件智慧服務內的新功能。
  • 新增至一般文件模型的查詢欄位功能使用 Azure OpenAI 模型從文件擷取特定欄位。 使用 Document Intelligence Studio 試用含查詢欄位的一般文件功能。 查詢欄位目前僅適用於East US區域中的資源。
  • 附加元件功能
    • 現在可以使用 2023-02-28-preview API 辨識字型擷取。
    • 現在可以使用 2023-02-28-preview API 辨識公式擷取。
    • 現在可以使用 2023-02-28-preview API 辨識高解析度擷取。
  • 自訂擷取模型更新
    • 自訂神經模型現在支援新增的語言來訓練及分析。 定型荷蘭文、法文、德文、義大利文和西班牙文的神經網路模型。
    • 自訂範本模型現在具有改良的簽章偵測功能。
  • 文件智慧服務工作室更新:
    • 除了支援分類和查詢欄位等新功能,Studio 現在還支援自訂模型專案的專案共用。
    • 閘道預覽版中的新增模型:疫苗接種卡合約美國稅務 1098美國稅務 1098-E美國稅務 1098-T。 若要要求存取閘道預覽模型,請完成並提交文件智慧服務個人預覽版要求表單
  • 收據模型更新
    • 收據模型新增了熱感式收據的支援。
    • 收據模型現在新增了 18 種語言和三種地區語言 (英文、法文、葡萄牙文) 的支援。
    • 收據模型現在支援 TaxDetails 擷取。
  • 版面配置模型現在改善了資料表辨識。
  • 讀取模型現在新增了單一字元辨識的改善。

2023 年 2 月


2023 年 1 月

  • 預建收據模型 - 已新增支援的語言。 收據模型現在支援這些新增的語言和地區設定

    • 日文 - 日本 (ja-JP)
    • 法文 - 加拿大 (fr-CA)
    • 荷蘭文 - 荷蘭 (nl-NL)
    • 英文 - 阿拉伯聯合大公國 (en-AE)
    • 葡萄牙文 - 巴西 (pt-BR)
  • 預建發票模型 - 已新增支援的語言。 發票模型現在支援這些新增的語言和地區設定

    • 英文 - 美國 (en-US)、澳洲 (en-AU)、加拿大 (en-CA)、英國 (en-UK)、印度 (en-IN)
    • 西班牙文 - 西班牙 (es-ES)
    • 法文 - 法國 (fr-FR)
    • 義大利文 - 義大利 (it-IT)
    • 葡萄牙文 - 葡萄牙 (pt-PT)
    • 荷蘭文 - 荷蘭 (nl-NL)
  • 預建發票模型 - 已新增可辨識的欄位。 發票模型現在會辨識這些新增的欄位

    • 貨幣代碼
    • 付款選項
    • 折扣總計
    • 稅金項目 (僅限 en-IN)
  • 預建證件模型 - 已新增支援的文件類型。 證件模型現在支援這些新增的文件類型

    • 美國軍警證件

提示

REST API 版本 2022-08-31 (GA) 提供所有 2023 年 1 月的更新。

  • 預建收據模型—其他語言支援

    預建收據模型新增了下列語言的支援:

    • 英文 - 阿拉伯聯合大公國 (en-AE)
    • 荷蘭文 - 荷蘭 (nl-NL)
    • 法文 - 加拿大 (fr-CA)
    • 德文 - (de-DE)
    • 義大利文 - (it-IT)
    • 日文 - 日本 (ja-JP)
    • 葡萄牙文 - 巴西 (pt-BR)
  • 預建發票模型—其他語言支援和欄位擷取

    預建發票模型新增了下列語言的支援:

    • 英文 - 澳洲 (en-AU)、加拿大 (en-CA)、英國 (en-UK)、印度 (en-IN)
    • 葡萄牙文 - 巴西 (pt-BR)

    預建發票模型現在新增了下列欄位擷取的支援:

    • 貨幣代碼
    • 付款選項
    • 折扣總計
    • 稅金項目 (僅限 en-IN)
  • 預建證件文件模型—其他文件類型支援

    預建身分證明文件現在新增了下列文件類型的支援:

    • 支援印度、加拿大、英國和澳洲的駕照擴充
    • 美國軍警身分證和文件
    • 印度身分證和文件 (PAN 和 Aadhaar)
    • 澳洲身分證和文件 (照片身分證、Key-pass ID)
    • 加拿大身分證和文件 (身分證、楓葉卡)
    • 英國身分證和文件 (國家/地區身分證)

2022 年 12 月

  • Document Intelligence Studio 更新

    12 月 Document Intelligence Studio 版本包含 Document Intelligence Studio 的最新更新。 使用者體驗有顯著的改善,主要是自訂模型標籤支援。

    • 頁面範圍。 Studio 現在支援分析文件中的指定頁面。

    • 自訂模型標記

      • 自動執行版面配置 API。 您可以選擇在自訂模型的設定流程期間自動針對 Blob 儲存體中的所有文件執行版面配置 API。

      • 搜尋。 Studio 現在包含搜尋功能,可在文件中尋找字詞。 這項改進可讓您在標記時更輕鬆地瀏覽。

      • 瀏覽。 您可以選取標籤,以在文件中鎖定標記的文字。

      • 自動資料表標記。 選取文件內的資料表圖示後,您可以選擇在標記檢視中自動標記擷取的資料表。

      • 標籤子類型和第二層子類型 Studio 現在支援資料表資料行、資料表資料列的子類型,以及日期和數字等第二層子類型。

  • US Gov 維吉尼亞州區域現在支援建置自訂神經模型。

  • 預覽 API 版本 2022-01-30-preview2021-09-30-preview 將於 2023 年 1 月 31 日淘汰。 請更新至 2022-08-31 API 版本,以避免任何服務中斷。


2022 年 11 月

  • 宣佈 Azure AI 文件智慧服務程式庫的最新穩定版本
    • 此版本包含 .NET、JAVA、JavaScript 和 Python 用戶端程式庫的重要變更和更新。 如需詳細資訊,請參閱 Azure SDK DevBlog
    • 最重要的增強功能是引進兩個新的用戶端,DocumentAnalysisClientDocumentModelAdministrationClient

2022 年 10 月

  • 文件智慧服務已設定版本的內容

    • 更新了文件智慧服務文件,以呈現已設定版本的體驗。 現在,您可以選擇檢視以 v3.0 GA 體驗或 v2.1 GA 體驗為目標的內容。 預設值是 v3.0 體驗。

      文件智慧服務登陸頁面的螢幕擷取畫面,其中表示版本下拉式功能表。

  • Document Intelligence Studio 程式碼範例

  • 語言擴充

    • 使用最新的預覽版本,文件智慧服務的讀取 (OCR)、版面配置和自訂範本模型支援 134 個新語言。 這些語言新增包括希臘文、塞爾維亞文、泰文、烏克蘭文和越南文,以及數種拉丁文和斯拉夫文語言。 文件智慧服務現在最新的 GA 和新的預覽版本中總共支援 299 種語言。 請參閱支援的語言頁面,以查看所有支持的語言。
    • 使用 API 或對應的 SDK 來支援應用程式中的新語言時,請使用 REST API 參數 api-version=2022-06-30-preview
  • 新的預先建置合約模型

    • 新的預先建置項目,可從合約擷取資訊,例如合作對象、標題、合約識別碼、執行日期等等。 合約模型目前處於預覽狀態,請在此處要求存取權。
  • 定型自訂神經模型的區域擴充

    • 新增的區域現在支援定型自訂神經模型。
      • 美國東部
      • 美國東部 2
      • US Gov 亞利桑那州

2022 年 9 月

注意

自 4.0.0 版開始,引進一組新的用戶端,以運用文件智慧服務的最新功能。

SDK 版本 4.0.0 GA 發行包括下列更新︰

  • 版本 4.0.0 GA (2022-09-08)
  • 支援 REST API 第 3.0 版和第 2.0 版用戶端

套件 (NuGet)

變更記錄/版本歷程記錄

移轉指南

讀我檔案

範例

  • 現在支援六個新區域內的訓練自訂神經模型地區擴充

    • 澳大利亞東部
    • 美國中部
    • 東亞
    • 法國中部
    • 英國南部
    • 美國西部 2
    • 如需支援定型的區域完整清單,請參閱自訂神經模型

    • 文件智慧服務 SDK 版本 4.0.0 GA 發行:

      • 文件智慧服務用戶端程式庫 4.0.0 版 (.NET/C#、Java、JavaScript) 和 3.2.0 版 (Python) 已正式推出並可供生產應用程式使用!
      • 如需文件智慧服務用戶端程式庫的詳細資訊,請參閱 SDK 概觀
      • 使用程式設計語言的移轉指南來更新應用程式。

2022 年 8 月

文件智慧服務 SDK 搶鮮版 (Beta) 2022 年 8 月預覽版包含下列更新:

版本 4.0.0-beta.5 (2022-08-09)

變更記錄/版本歷程記錄

套件 (NuGet)

SDK 參考文件

  • 文件智慧服務 v3.0 正式推出

    • 文件智慧服務 REST API v3.0 現已正式推出,並已可用於生產應用程式! 您可以利用 REST API 版本 2022-08-31 來更新應用程式。
  • Document Intelligence Studio 更新

    • 後續步驟。 工作室現在於每個模型頁面下方,都有一個後續步驟的區段。 使用者可以快速參考範例程式碼、疑難排解指南及定價資訊。
    • 自訂模型。 工作室現在包含了在自訂模型專案中重新排序標籤的功能,以提高套用標籤的效率。
    • 複製模型 您可在工作室中跨文件智慧服務複製自訂模型。 此作業可讓已定型的模型升階至其他環境和區域。
    • 刪除文件。 工作室現支援從自訂專案中刪除已加上標籤的資料集文件。
  • 文件智慧服務更新

    • 預建讀取。 讀取 OCR 模型現也可在文件智慧服務中使用,並附有段落和語言偵測兩個新功能。 「文件智慧服務讀取」鎖定目標為進階文件案例,這與文件智慧服務中更廣泛文件智慧功能一致。
    • 預建配置。 版面配置模型皆會擷取段落,無論擷取的文字是段落、標題、區段標題、註腳、首頁、頁尾或頁碼。
    • 預建發票。 [TotalVAT] 和 [Line/VAT] 欄位現在分別解析為現有的欄位 [TotalTax] 和 [Line/Tax]。
    • 預建 idDocument。 資料擷取支援美國的州身分證、社會安全和綠卡。 支援護照簽證資訊。
    • 預建收據。 針對法文 (fr-FR)、西班牙文 (es-ES)、葡萄牙文 (pt-PT)、義大利文 (it-IT) 及德文 (de-DE) 擴充地區設定支援。
    • 預建 businessCard。 地址剖析支援擷取地址元件的子欄位,例如地址、縣/市、省/市、國家/地區和郵遞區號。
  • AI 品質改進

    • 預建讀取。 增強對單一字元、手寫日期、金額、名稱、收據和發票中常見其他重要資料的支援,以及改善數位 PDF 文件的處理。
    • 預建配置。 支援對裁剪的資料表和無框線資料表進行更完善的偵測,以及改善跨欄長儲存格的辨識。
    • 預建文件。 改善了值和核取方塊的偵測。
    • 自訂神經。 改善了偵測和擷取資料表時的正確性。

2022 年 6 月

  • 文件智慧服務 SDK 搶鮮版 (Beta) 2022 年 6 月預覽版包含下列更新:

2022 年 2 月

  • 文件智慧服務 v3.0 預覽版引進了數個新特性、功能和增強功能:

    • 自訂神經模型或自訂文件模型是新的自訂模型,可從結構化表單、半結構化和非結構化文件中擷取文字和選取標記。
    • W-2 預建模型是新的預建模型,可從 W-2 表單擷取欄位,以用於稅務報告和收入驗證案例。
    • 讀取 API 會擷取列印的文字行、字組、文字位置、偵測到的語言和手寫文字 (若有偵測到)。
    • 一般文件預先訓練模型現在已更新,可支援選取標記,還可支援表單和文件中的 API 文字、資料表、結構和索引鍵/值組。
    • 發票 API 發票預建模型擴充對西班牙文發票的支援。
    • Document Intelligence Studio 新增用於讀取、W2、飯店收據範例和訓練新自訂神經模型支援的示範。
    • 語言擴充 文件智慧服務的讀取、版面配置和自訂表單新增了對 42 種新語言的支援,包括阿拉伯文、印度文和其他使用阿拉伯文和梵文字母的語言,以將涵蓋範圍擴充至 164 種語言。 手寫語言支援可擴充至日文和韓文。
  • 開始使用新的 v3.0 預覽 API。

  • 文件智慧服務模型資料擷取:

    模型 文字擷取 索引鍵/值組 選取標記 表格 簽章
    參閱
    一般文件
    版面配置
    發票
    收據
    身分證明文件
    名片
    自訂範本
    自訂神經
  • 文件智慧服務 SDK 搶鮮版 (Beta) 預覽版包含下列更新:


下一步