文件處理常見問題集
本文包含 AI Builder 中文件處理模型的常見問題集。 如果在這裡到不到您的問題,請查看文件處理 AI 模型概觀,或將您的問題提交至 AI Builder 的 Power Automate社群。
透過文件處理,您可以建立自訂 AI 模型,以從各種文件中擷取資訊。
- 如果可以在類似位置找到文件的元素,則固定式範本文件選項會是理想的選擇。 通常發票、訂購單、交貨單和稅表適用此選項。
-
通用文件選項適用於任何類型的文件,包括第一個選項支援的文件,還包括合約、工作說明書、信件等。 此選項提取資料的能力更強,但所需的訓練時間也更長。
深入了解:文件處理模型概觀
支援的檔案類型為 PDF、JPG 和 PNG。
文件處理可以從文件中擷取欄位、資料表和核取方塊。
深入了解:定義要擷取的資訊
可以。 文件處理可以從您的文件中擷取列印的和手寫文字。
對於使用相同版面配置的高品質文件,五個範例文件就足夠了。 如果是品質較差的文件 (例如,品質較差的掃描內如),則可能需要更多範例文件。 若要改善結果,請使用 15 到 20 個範例文件。
是。 透過使用集合功能,您可以訓練單一表單處理模型來處理具有不同版面配置的文件。
深入了解:依集合對文件進行分組
每個表單都必須位於不同的檔案中。 例如,如果您有一個包含多張發票的 PDF 文件,請在將其發送到文件處理模型之前為每張發票建立一個單獨的文件。
您也可以指定文件處理模型要處理的頁面。 透過這種方式,您可以利用模型的功能逐頁迴圈,並一次處理一個表單。
深入了解:頁面範圍
如果模型在訓練後傳回的結果不佳,請編輯模型並提供更多範例進行訓練。 您提供的範例越多,AI 模型就越能了解如何從您的文件中擷取資料。
深入了解:改善文件處理模型的效能
每個環境每 60 秒最多可以處理 360 個文件。
- 有些字元可能會混淆:0 (數字) 和 O (字母)、1 (數字) 和 l (字母)、4 (數字) 和 A (字母) 等等。
- 某些字元位於其他字元上方或附近時可能會被錯誤辨識:垂直線上的 O (字母) 會變成 0 (數字)、直線上的 5 (數字) 會變成$ (美元符號)、l_ (小寫字母、底線) 變成 L (大寫字母) 等等。
- 品質較差的文件上的某些字元可能會被錯誤識別,或者根本無法識別。
在上述情況下,無法在 AI Builder 中採取任何措施來提高辨識率。 我們建議提高來源文件的品質和佈局來解決類似問題。
注意
Microsoft 正不斷改進檢測字元的 OCR 技術,因此此類問題很少發生。
每個模型最多可以建立 200 個集合。 然而,訓練具有數十個集合的通用文件模型可能需要幾個小時,並且在極少數情況下會逾時。如果您的模型具有大量集合,則預計最多需要等待 24 小時才能完成模型訓練。
目前,無法在解決方案中建立模型。
可以,文件處理支援合約和信件等非結構化文件,使用通用文件選項。
文件處理、發票處理、收據處理、身分證件讀取器、名片閱讀器和文字辨識之間的差異如何?
視您的狀況而定,您可能需要使用特定模型或它們的組合。
當您想要擷取影像或 PDF 中的所有文字時,請使用文字辨識。 例如,您可以在擷取的文字中搜尋關鍵字,或組建一些固定規則來擷取特定項目。
如果要從發票、收據、護照、駕照或名片中擷取資訊,請從對應的預建模型開始:
您可以立即使用這些預建模型,而不需建立新的模型。 這些模型可以擷取其對應檔案類型中的一般資訊。
對於任何其他文件類型,您可以建立自訂文件處理模型,以擷取所需的欄位與資料表。 如果您需要預建模型未提供的其他資訊,也適用此方法。
深入了解:自訂文件處理模型
AI Builder 文件處理是以 Azure 表格辨識器為基礎建立的。 這為兩種產品提供 Microsoft AI 的最新進展。
您可以透過開始試用來試用文件處理。 評估後,您需要購買 AI Builder 點數才能使用文件處理。 使用文件處理處理的每個頁面都會消耗 AI Builder 點數,即使該頁面不包含要提取的資料也是如此。 AI Builder 點數可以透過 AI Builder 附加元件購買。
深入了解:AI Builder 授權