共用方式為


營養素 - PDF OCR

使用 Nutrient Document Converter OCR 操作將掃描的文件和圖像轉換為可搜索、可編輯的 PDF。 使用先進的光學字元辨識 (OCR) 技術從 PDF 中無縫提取文字,以進行索引、自動化和內容分析。

此連接器適用於以下產品和區域:

服務 Class Regions
副駕駛工作室 進階 除下列區域外的所有 Power Automate 區域
     - 美國政府 (GCC)
     - 美國政府(海灣合作委員會高中)
     - 由 21Vianet 營運的中國雲
     - 美國國防部 (DoD)
邏輯應用程式 標準 所有 Logic Apps 區域, 但下列區域除外:
     - Azure Government 區域
     - Azure 中國區域
     - 美國國防部 (DoD)
Power Apps 進階 除下列區域外的所有 Power Apps 區域
     - 美國政府 (GCC)
     - 美國政府(海灣合作委員會高中)
     - 由 21Vianet 營運的中國雲
     - 美國國防部 (DoD)
Power Automate(自動化服務) 進階 除下列區域外的所有 Power Automate 區域
     - 美國政府 (GCC)
     - 美國政府(海灣合作委員會高中)
     - 由 21Vianet 營運的中國雲
     - 美國國防部 (DoD)
連絡人​​
名稱 營養(以前稱為 Muhimbi)支持
URL https://support.nutrient.io/hc/en-us/requests/new
Email support+low-code@nutrient.io
連接器中繼資料
Publisher Muhimbi 作為營養品進行交易
網站 https://www.nutrient.io/low-code/
隱私策略 https://www.nutrient.io/legal/privacy/
類別 通敵;內容和文件

對影像和掃描文件執行 OCR

使用 Nutrient Document Converter 透過 REST API 或自託管伺服器程式庫對影像和掃描檔案執行光學字元辨識 (OCR)。

OCR 功能

  • 將圖像、掃描件和傳真轉換為可搜索的 PDF。
  • 建立用於文字擷取和 PDF 可搜尋性的自動化文件工作流程。

整合選項

將 OCR 功能與您首選語言的程式碼範例整合:

先決條件

要使用 Nutrient Document Converter,您需要一個 免費試用 帳戶。 請參閱 比較指南 ,了解這些帳戶類型之間的差異。

入門指南

請依照下列步驟開始使用 Nutrient Document Converter 連接器:

已知問題與限制

由於安全性限制,無法處理受 IRM、DRM、RMS 或 AIP 解決方案 保護的文件。

如有問題或協助,請聯絡我們的 支援團隊

節流限制

名稱 呼叫 續約期間
每個連線的 API 呼叫 100 60 秒

動作

使用 OCR 提取文本

使用 OCR 從 PDF 檔案擷取文字

轉換為 OCRed PDF

對現有 PDF 文件或影像執行 OCR 以建立可搜尋的 PDF

使用 OCR 提取文本

使用 OCR 從 PDF 檔案擷取文字

參數

名稱 機碼 必要 類型 Description
來源檔案名稱
source_file_name True string

來源檔案的名稱,包括副檔名

來源檔案內容
source_file_content True byte

OCR 的檔案內容

語言
language enum

語言

X 座標
x string

X 座標 (以 Pts,1/72 英吋為單位)

Y 座標
y string

Y 座標 (單位為單位,1/72 英吋)

寬度
width string

OCR 區域的寬度(以點為單位,1/72 英吋)

高度
height string

OCR 區域的高度 (單位為單位,1/72 英吋)

頁碼
page_number string

頁碼(留空以OCR所有頁面)

Performance
performance enum

性能 ()

黑名單/白名單
characters_option enum

字元選項

字元
characters string

要列入黑名單或白名單的字元

使用分頁
paginate boolean

分頁

錯誤失敗
fail_on_error boolean

錯誤失敗

傳回

OCRText 作業的回應資料

轉換為 OCRed PDF

對現有 PDF 文件或影像執行 OCR 以建立可搜尋的 PDF

參數

名稱 機碼 必要 類型 Description
來源檔案名稱
source_file_name True string

來源檔案的名稱,包括副檔名

來源檔案內容
source_file_content True byte

OCR 的檔案內容

語言
language enum

語言

Performance
performance enum

Performance

黑名單/白名單
characters_option enum

字元選項

字元
characters string

要列入黑名單或白名單的字元

使用分頁
paginate boolean

分頁

Regions
regions string

將 OCR 區域限制為一個或多個特定區域

錯誤失敗
fail_on_error boolean

錯誤失敗

傳回

所有作業的回應資料

定義

ocr_operation_response

OCRText 作業的回應資料

名稱 路徑 類型 Description
輸出文字
out_text string

以純文字形式提取 OCR 文字。

基本檔案名稱
base_file_name string

沒有副檔名的輸入檔案名稱。

結果碼
result_code enum

操作結果代碼。

結果詳情
result_details string

操作結果詳細資訊。

operation_response

所有作業的回應資料

名稱 路徑 類型 Description
已處理的檔案內容
processed_file_content byte

由 Muhimbi 轉換器生成的文件。

基本檔案名稱
base_file_name string

沒有副檔名的輸入檔案名稱。

結果碼
result_code enum

操作結果代碼。

結果詳情
result_details string

操作結果詳細資訊。