營養素 - PDF OCR
使用 Nutrient Document Converter OCR 操作將掃描的文件和圖像轉換為可搜索、可編輯的 PDF。 使用先進的光學字元辨識 (OCR) 技術從 PDF 中無縫提取文字,以進行索引、自動化和內容分析。
此連接器適用於以下產品和區域:
| 服務 | Class | Regions |
|---|---|---|
| 副駕駛工作室 | 進階 | 除下列區域外的所有 Power Automate 區域 : - 美國政府 (GCC) - 美國政府(海灣合作委員會高中) - 由 21Vianet 營運的中國雲 - 美國國防部 (DoD) |
| 邏輯應用程式 | 標準 | 所有 Logic Apps 區域, 但下列區域除外: - Azure Government 區域 - Azure 中國區域 - 美國國防部 (DoD) |
| Power Apps | 進階 | 除下列區域外的所有 Power Apps 區域 : - 美國政府 (GCC) - 美國政府(海灣合作委員會高中) - 由 21Vianet 營運的中國雲 - 美國國防部 (DoD) |
| Power Automate(自動化服務) | 進階 | 除下列區域外的所有 Power Automate 區域 : - 美國政府 (GCC) - 美國政府(海灣合作委員會高中) - 由 21Vianet 營運的中國雲 - 美國國防部 (DoD) |
| 連絡人 | |
|---|---|
| 名稱 | 營養(以前稱為 Muhimbi)支持 |
| URL | https://support.nutrient.io/hc/en-us/requests/new |
| support+low-code@nutrient.io |
| 連接器中繼資料 | |
|---|---|
| Publisher | Muhimbi 作為營養品進行交易 |
| 網站 | https://www.nutrient.io/low-code/ |
| 隱私策略 | https://www.nutrient.io/legal/privacy/ |
| 類別 | 通敵;內容和文件 |
對影像和掃描文件執行 OCR
使用 Nutrient Document Converter 透過 REST API 或自託管伺服器程式庫對影像和掃描檔案執行光學字元辨識 (OCR)。
OCR 功能
- 將圖像、掃描件和傳真轉換為可搜索的 PDF。
- 建立用於文字擷取和 PDF 可搜尋性的自動化文件工作流程。
整合選項
將 OCR 功能與您首選語言的程式碼範例整合:
先決條件
要使用 Nutrient Document Converter,您需要一個 免費 或 試用 帳戶。 請參閱 比較指南 ,了解這些帳戶類型之間的差異。
入門指南
請依照下列步驟開始使用 Nutrient Document Converter 連接器:
- 填寫 此表格註冊 30 天試用期。
- 提交表單後,您將收到一封電子郵件,其中包含您的試用激活詳細信息。
- 請參閱 入門影片 ,以取得程式的逐步解說。
- 如需詳細指示,請閱讀適用於 Power Automate 的文件轉換器指南 。
- 探索 Power Automate 和 Logic Apps 教學課程, 以取得實際範例。
已知問題與限制
由於安全性限制,無法處理受 IRM、DRM、RMS 或 AIP 解決方案 保護的文件。
如有問題或協助,請聯絡我們的 支援團隊。
節流限制
| 名稱 | 呼叫 | 續約期間 |
|---|---|---|
| 每個連線的 API 呼叫 | 100 | 60 秒 |
動作
| 使用 OCR 提取文本 |
使用 OCR 從 PDF 檔案擷取文字 |
| 轉換為 OCRed PDF |
對現有 PDF 文件或影像執行 OCR 以建立可搜尋的 PDF |
使用 OCR 提取文本
使用 OCR 從 PDF 檔案擷取文字
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
來源檔案名稱
|
source_file_name | True | string |
來源檔案的名稱,包括副檔名 |
|
來源檔案內容
|
source_file_content | True | byte |
OCR 的檔案內容 |
|
語言
|
language | enum |
語言 |
|
|
X 座標
|
x | string |
X 座標 (以 Pts,1/72 英吋為單位) |
|
|
Y 座標
|
y | string |
Y 座標 (單位為單位,1/72 英吋) |
|
|
寬度
|
width | string |
OCR 區域的寬度(以點為單位,1/72 英吋) |
|
|
高度
|
height | string |
OCR 區域的高度 (單位為單位,1/72 英吋) |
|
|
頁碼
|
page_number | string |
頁碼(留空以OCR所有頁面) |
|
|
Performance
|
performance | enum |
性能 () |
|
|
黑名單/白名單
|
characters_option | enum |
字元選項 |
|
|
字元
|
characters | string |
要列入黑名單或白名單的字元 |
|
|
使用分頁
|
paginate | boolean |
分頁 |
|
|
錯誤失敗
|
fail_on_error | boolean |
錯誤失敗 |
傳回
OCRText 作業的回應資料
轉換為 OCRed PDF
對現有 PDF 文件或影像執行 OCR 以建立可搜尋的 PDF
參數
| 名稱 | 機碼 | 必要 | 類型 | Description |
|---|---|---|---|---|
|
來源檔案名稱
|
source_file_name | True | string |
來源檔案的名稱,包括副檔名 |
|
來源檔案內容
|
source_file_content | True | byte |
OCR 的檔案內容 |
|
語言
|
language | enum |
語言 |
|
|
Performance
|
performance | enum |
Performance |
|
|
黑名單/白名單
|
characters_option | enum |
字元選項 |
|
|
字元
|
characters | string |
要列入黑名單或白名單的字元 |
|
|
使用分頁
|
paginate | boolean |
分頁 |
|
|
Regions
|
regions | string |
將 OCR 區域限制為一個或多個特定區域 |
|
|
錯誤失敗
|
fail_on_error | boolean |
錯誤失敗 |
傳回
所有作業的回應資料
定義
ocr_operation_response
OCRText 作業的回應資料
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
輸出文字
|
out_text | string |
以純文字形式提取 OCR 文字。 |
|
基本檔案名稱
|
base_file_name | string |
沒有副檔名的輸入檔案名稱。 |
|
結果碼
|
result_code | enum |
操作結果代碼。 |
|
結果詳情
|
result_details | string |
操作結果詳細資訊。 |
operation_response
所有作業的回應資料
| 名稱 | 路徑 | 類型 | Description |
|---|---|---|---|
|
已處理的檔案內容
|
processed_file_content | byte |
由 Muhimbi 轉換器生成的文件。 |
|
基本檔案名稱
|
base_file_name | string |
沒有副檔名的輸入檔案名稱。 |
|
結果碼
|
result_code | enum |
操作結果代碼。 |
|
結果詳情
|
result_details | string |
操作結果詳細資訊。 |