文件處理常見問題集

發行項
2024/04/23

本文包含 AI Builder 中文件處理模型的常見問題集。如果在這裡到不到您的問題，請查看文件處理 AI 模型概觀，或將您的問題提交至 AI Builder 的 Power Automate社群。

功能

我可以用文件處理做什麼？

透過文件處理，您可以建立自訂 AI 模型，以從各種文件中擷取資訊。

如果可以在類似位置找到文件的元素，則固定式範本文件選項會是理想的選擇。通常發票、訂購單、交貨單和稅表適用此選項。
通用文件選項適用於任何類型的文件，包括第一個選項支援的文件，還包括合約、工作說明書、信件等。此選項提取資料的能力更強，但所需的訓練時間也更長。

深入了解：文件處理模型概觀

文件處理可以處理哪些類型的文件？

支援的檔案類型為 PDF、JPG 和 PNG。

使用文件處理可以從文件中擷取哪些資料？

文件處理可以從文件中擷取欄位、資料表和核取方塊。

深入了解：定義要擷取的資訊

我可以從文件擷取手寫文字嗎?

可以。文件處理可以從您的文件中擷取列印的和手寫文字。

我需要多少樣本來定型文件處理模型？

對於使用相同版面配置的高品質文件，五個範例文件就足夠了。如果是品質較差的文件 (例如，品質較差的掃描內如)，則可能需要更多範例文件。若要改善結果，請使用 15 到 20 個範例文件。

單一表單處理模型能否從具有不同版面配置或範本的文件中擷取資訊？

是。透過使用集合功能，您可以訓練單一表單處理模型來處理具有不同版面配置的文件。

深入了解：依集合對文件進行分組

文件處理可以在單一文件中處理多個表單嗎？

每個表單都必須位於不同的檔案中。例如，如果您有一個包含多張發票的 PDF 文件，請在將其發送到文件處理模型之前為每張發票建立一個單獨的文件。

您也可以指定文件處理模型要處理的頁面。透過這種方式，您可以利用模型的功能逐頁迴圈，並一次處理一個表單。

深入了解：頁面範圍

我已訓練了文件處理模型，但在擷取資料時未得到正確的結果。我該如何改善模型？

如果模型在訓練後傳回的結果不佳，請編輯模型並提供更多範例進行訓練。您提供的範例越多，AI 模型就越能了解如何從您的文件中擷取資料。

深入了解：改善文件處理模型的效能

限制

我可以處理的最大文件數是多少？

每個環境每 60 秒最多可以處理 360 個文件。

為什麼有些字元辨識不正確？

有些字元可能會混淆：0 (數字) 和 O (字母)、1 (數字) 和 l (字母)、4 (數字) 和 A (字母) 等等。
某些字元位於其他字元上方或附近時可能會被錯誤辨識：垂直線上的 O (字母) 會變成 0 (數字)、直線上的 5 (數字) 會變成$ (美元符號)、l_ (小寫字母、底線) 變成 L (大寫字母) 等等。
品質較差的文件上的某些字元可能會被錯誤識別，或者根本無法識別。

在上述情況下，無法在 AI Builder 中採取任何措施來提高辨識率。我們建議提高來源文件的品質和佈局來解決類似問題。

注意

Microsoft 正不斷改進檢測字元的 OCR 技術，因此此類問題很少發生。

我可以建立包含多個集合的模型嗎？

每個模型最多可以建立 200 個集合。然而，訓練具有數十個集合的通用文件模型可能需要幾個小時，並且在極少數情況下會逾時。如果您的模型具有大量集合，則預計最多需要等待 24 小時才能完成模型訓練。

我可以在解決方案中建立模型嗎？

目前，無法在解決方案中建立模型。

我可以在文件處理模型中使用合約和信件嗎？

可以，文件處理支援合約和信件等非結構化文件，使用通用文件選項。

比較

文件處理、發票處理、收據處理、身分證件讀取器、名片閱讀器和文字辨識之間的差異如何？

視您的狀況而定，您可能需要使用特定模型或它們的組合。

當您想要擷取影像或 PDF 中的所有文字時，請使用文字辨識。例如，您可以在擷取的文字中搜尋關鍵字，或組建一些固定規則來擷取特定項目。

如果要從發票、收據、護照、駕照或名片中擷取資訊，請從對應的預建模型開始：

您可以立即使用這些預建模型，而不需建立新的模型。這些模型可以擷取其對應檔案類型中的一般資訊。

對於任何其他文件類型，您可以建立自訂文件處理模型，以擷取所需的欄位與資料表。如果您需要預建模型未提供的其他資訊，也適用此方法。

深入了解：自訂文件處理模型

AI Builder 文件處理與 Azure 表格辨識器有何區別？

AI Builder 文件處理是以 Azure 表格辨識器為基礎建立的。這為兩種產品提供 Microsoft AI 的最新進展。

AI Builder 是 Microsoft Power Platform 的一部分。這樣任何人都可以透過易於使用的介面，將 AI 新增至應用程式和自動化中。 您不需要是開發人員或資料科學家。
Azure 表單辨識器是以專業開發人員為主。他們可以使用簡單的 REST API，將 AI 功能新增至其自訂程式碼解決方案。

成本選項

AI Builder 文件處理成本是多少？

您可以透過開始試用來試用文件處理。評估後，您需要購買 AI Builder 點數才能使用文件處理。使用文件處理處理的每個頁面都會消耗 AI Builder 點數，即使該頁面不包含要提取的資料也是如此。 AI Builder 點數可以透過 AI Builder 附加元件購買。

深入了解：AI Builder 授權

共用方式為

文件處理常見問題集

功能

我可以用文件處理做什麼？

文件處理可以處理哪些類型的文件？

使用文件處理可以從文件中擷取哪些資料？

我可以從文件擷取手寫文字嗎?

我需要多少樣本來定型文件處理模型？

單一表單處理模型能否從具有不同版面配置或範本的文件中擷取資訊？

文件處理可以在單一文件中處理多個表單嗎？

我已訓練了文件處理模型，但在擷取資料時未得到正確的結果。我該如何改善模型？

限制

我可以處理的最大文件數是多少？

為什麼有些字元辨識不正確？

我可以建立包含多個集合的模型嗎？

我可以在解決方案中建立模型嗎？

我可以在文件處理模型中使用合約和信件嗎？

比較

文件處理、發票處理、收據處理、身分證件讀取器、名片閱讀器和文字辨識之間的差異如何？

AI Builder 文件處理與 Azure 表格辨識器有何區別？

成本選項

AI Builder 文件處理成本是多少？

意見反應

其他資源

共用方式為

文件處理常見問題集

功能

我可以用文件處理做什麼？

文件處理可以處理哪些類型的文件？

使用文件處理可以從文件中擷取哪些資料？

我可以從文件擷取手寫文字嗎?

我需要多少樣本來定型文件處理模型？

單一表單處理模型能否從具有不同版面配置或範本的文件中擷取資訊？

文件處理可以在單一文件中處理多個表單嗎？

我已訓練了文件處理模型，但在擷取資料時未得到正確的結果。 我該如何改善模型？

限制

我可以處理的最大文件數是多少？

為什麼有些字元辨識不正確？

我可以建立包含多個集合的模型嗎？

我可以在解決方案中建立模型嗎？

我可以在文件處理模型中使用合約和信件嗎？

比較

文件處理、發票處理、收據處理、身分證件讀取器、名片閱讀器和文字辨識之間的差異如何？

AI Builder 文件處理與 Azure 表格辨識器有何區別？

成本選項

AI Builder 文件處理成本是多少？

意見反應

其他資源

我已訓練了文件處理模型，但在擷取資料時未得到正確的結果。我該如何改善模型？