本文包含 AI Builder 中文件處理模型的常見問題集。 如果在這裡找不到您的問題,請查看文件處理 AI 模型概觀或將您的問題提交給 AI Builder 的 Power Automate 社區。
功能
我可以用文件處理做什麼?
透過文件處理,您可以建立自訂 AI 模型,以從各種文件中擷取資訊。
- 如果可以在類似位置找到文件的元素,則固定式範本文件選項會是理想的選擇。 通常發票、訂購單、交貨單和稅表適用此選項。
- 一般文件選項適用於任何類型的文件,包括第一個選項支援的文件以及合約、工作說明、信件等。 此選項提取資料的能力更強,但所需的訓練時間也更長。
如需進一步了解,請參閱文件處理模型概觀。
文件處理可以處理哪些類型的文件?
支援的檔案類型為 PDF、JPG 和 PNG。
使用文件處理可以從文件中擷取哪些資料?
文件處理可以從文件中擷取欄位、資料表和核取方塊。
如需進一步了解,請參閱定義要提取的資訊。
我可以從文件擷取手寫文字嗎?
是。 文件處理可以從您的文件中擷取列印的和手寫文字。
我需要多少樣本來定型文件處理模型?
對於使用相同版面配置的高品質文件,五個範例文件就足夠了。 如果是品質較差的文件 (例如,掃描品質較差的 ),則可能需要更多範例文件。 若要改善結果,請使用 15 到 20 個範例文件。
最佳作法
對於範本文件
- 每系列一 (1) 個版面。
- 同一套集合內的版面配置必須相同。
- 每個集合至少有五 (5) 個文件,最多有 20 個文件 (不要超過此限制)。
對於一般文件
為文件類型的所有變體 (包括結構化和非結構化文件) 建立單一模型。
標記與其值相關的欄位以獲得更好的提取準確性。
例如,使用「supplier_id」作為供應商 ID。 欄位名稱應與文件的語言相符。
每個集合至少有五 (5) 個文件,最多有 20 個文件 (不要超過此限制)。
我的模型目前以 v3.1 (GA) 發布,我計劃使用 v4.0 (GA) 重新訓練它。 我是否需要重新標記我的所有文件?
除非您要向集合中新增欄位、複選框、資料表、用於資料提取的簽名或新文件,否則您不需要重新標記所有文件。
在發佈模型之前,建議使用一或多個範例快速 測試模型 ,以驗證並確保正確擷取所有所需的欄位。
我可以從一種文件類型切換到另一種嗎?
是的,在編輯模型時,您可以在固定範本文件類型和通用文件類型之間切換。 但是,發票不支援此開關。
單一表單處理模型能否從具有不同版面配置或範本的文件中擷取資訊?
是。 透過使用集合功能,您可以訓練單一表單處理模型來處理具有不同版面配置的文件。
如需進一步了解,請參閱按集合對文件進行分組。
文件處理可以在單一文件中處理多個表單嗎?
每個表單都必須位於不同的檔案中。 例如,如果您有一個包含多張發票的 PDF 文件,請在將其發送到文件處理模型之前為每張發票建立一個單獨的文件。
您也可以指定文件處理模型要處理的頁面。 透過這種方式,您可以利用模型的功能逐頁迴圈,並一次處理一個表單。
如需進一步了解,請參閱頁面範圍。
我已訓練了文件處理模型,但在擷取資料時未得到正確的結果。 我該如何改善模型?
如果模型在訓練後傳回的結果不佳,請編輯模型並提供更多範例進行訓練。 您提供的範例越多,AI 模型就越能了解如何從您的文件中擷取資料。
如需進一步了解,請參閱提高文件處理模型的效能。
限制
我可以處理的最大文件數是多少?
每個環境每 60 秒最多可以處理 360 個文件。
為什麼有些字元辨識不正確?
- 有些字元可能會混淆:0 (數字) 和 O (字母)、1 (數字) 和 l (字母)、4 (數字) 和 A (字母) 等等。
- 某些字元位於其他字元上方或附近時可能會被錯誤辨識:垂直線上的 O (字母) 會變成 0 (數字)、直線上的 5 (數字) 會變成$ (美元符號)、l_ (小寫字母、底線) 變成 L (大寫字母) 等等。
- 品質較差的文件上的某些字元可能會被錯誤識別,或者根本無法識別。
在前面的案例中,AI Builder 無法採取任何措施來提高辨識率。 我們建議提高來源文件的品質和佈局來解決類似問題。
注意
Microsoft 不斷改進光學字元辨識 (OCR) 技術來偵測字元,因此此類問題發生的頻率較低。
我可以建立包含多個集合的模型嗎?
每個模型最多可以建立 200 個集合。 然而,訓練具有數十個集合的通用文件模型可能需要幾個小時,並且在極少數情況下會逾時。如果您的模型具有大量集合,則預計最多需要等待 24 小時才能完成模型訓練。
我可以在解決方案中建立模型嗎?
目前,無法在解決方案中建立模型。
我可以在文件處理模型中使用合約和信件嗎?
可以,文件處理支援合約和信件等非結構化文件,使用通用文件選項。
比較
文件處理、發票處理、收據處理、身分證件讀取器、名片閱讀器和文字辨識之間的差異如何?
視您的狀況而定,您可能需要使用特定模型或它們的組合。
當您想要擷取影像或 PDF 中的所有文字時,請使用文字辨識。 例如,您可以在擷取的文字中搜尋關鍵字,或組建一些固定規則來擷取特定項目。
如果要從發票、收據、護照、駕照或名片中擷取資訊,請從對應的預建模型開始:
您可以立即使用這些預建模型,而不需建立新的模型。 這些模型可以擷取其對應檔案類型中的一般資訊。
對於任何其他文件類型,您可以建立自訂文件處理模型,以擷取所需的欄位與資料表。 如果您需要預建模型未提供的其他資訊,也適用此方法。
如需進一步了解,請參閱自訂文件處理模型。
AI Builder 文件處理與 Azure 表格辨識器有何區別?
AI Builder 文件處理是以 Azure 表格辨識器為基礎建立的。 這為兩種產品提供 Microsoft AI 的最新進展。
AI Builder 是 Microsoft Power Platform 的一部分。 這樣任何人都可以透過易於使用的介面,將 AI 新增至應用程式和自動化中。 您不需要是開發人員或資料科學家。
Azure 表單辨識器是以專業開發人員為主。 他們可以使用簡單的 REST API,將 AI 功能新增至其自訂程式碼解決方案。
成本選項
AI Builder 文件處理成本是多少?
您可以透過開始試用來試用文件處理。 評估後,您需要購買 AI Builder 點數才能使用文件處理。 使用文件處理處理的每個頁面都會消耗 AI Builder 點數,即使該頁面不包含要提取的資料也是如此。 AI Builder 點數可以透過 AI Builder 附加元件購買。
如需進一步了解,請參閱 AI Builder 授權。