Поделиться через


Питательные вещества — OCR PDF

Преобразование сканированных документов и изображений в доступные для поиска редактируемые PDF-файлы с помощью действий OCR конвертера питательных документов. Просто извлеките текст из PDF-файлов с помощью расширенной технологии оптического распознавания символов (OCR) для индексирования, автоматизации и анализа содержимого.

Этот соединитель доступен в следующих продуктах и регионах:

Услуга Class Регионы
Copilot Studio Премия Все регионы Power Automate , кроме следующих:
     - Правительство США (GCC)
     - Правительство США (GCC High)
     — Облако Китая, управляемое 21Vianet
     - Министерство обороны США (DoD)
Логические приложения Стандарт Все регионы Logic Apps , кроме следующих:
     — Регионы Azure для государственных организаций
     — Регионы Azure Для Китая
     - Министерство обороны США (DoD)
Power Apps Премия Все регионы Power Apps , кроме следующих:
     - Правительство США (GCC)
     - Правительство США (GCC High)
     — Облако Китая, управляемое 21Vianet
     - Министерство обороны США (DoD)
Power Automate Премия Все регионы Power Automate , кроме следующих:
     - Правительство США (GCC)
     - Правительство США (GCC High)
     — Облако Китая, управляемое 21Vianet
     - Министерство обороны США (DoD)
Контакт
Имя Поддержка питательных веществ (ранее Мухимби)
URL https://support.nutrient.io/hc/en-us/requests/new
Адрес электронной почты support+low-code@nutrient.io
Метаданные соединителя
Publisher Мухимби торгуется как питательные вещества
Website https://www.nutrient.io/low-code/
Политика конфиденциальности https://www.nutrient.io/legal/privacy/
Категории Сотрудничество; Содержимое и файлы

Выполнение OCR на изображениях и сканированных документах

Используйте конвертер документов питательных веществ для запуска оптического распознавания символов (OCR) на изображениях и сканированных файлах с помощью REST API или локальной библиотеки сервера.

Возможности OCR

  • Преобразуйте изображения, сканирование и факсы в доступные для поиска PDF-файлы.
  • Создание автоматизированных рабочих процессов документов для извлечения текста и возможности поиска в формате PDF.

Параметры интеграции

Интеграция функций OCR с примерами кода на предпочитаемом языке:

Предпосылки

Чтобы использовать конвертер питательных документов, вам нужна бесплатная или пробная учетная запись. Ознакомьтесь с руководством по сравнению, чтобы понять различия между этими типами учетных записей.

Начало работы

Выполните приведенные ниже действия, чтобы начать использование соединителя конвертера питательных документов:

Известные проблемы и ограничения

Документы, защищенные с помощью IRM, DRM, RMS или решений AIP , не могут обрабатываться из-за ограничений безопасности.

Чтобы получить вопросы или помощь, обратитесь в службу поддержки.

Ограничения регулирования

Имя Вызовы Период обновления
Вызовы API для каждого подключения 100 60 секунд

Действия

Извлечение текста с помощью OCR

Извлечение текста из PDF-файла с помощью OCR

Преобразование в OCRed PDF

Выполнение OCR в существующем PDF-документе или изображении для создания pdf-файла с возможностью поиска

Извлечение текста с помощью OCR

Извлечение текста из PDF-файла с помощью OCR

Параметры

Имя Ключ Обязательно Тип Описание
Имя исходного файла
source_file_name True string

Имя исходного файла, включая расширение

Содержимое исходного файла
source_file_content True byte

Содержимое файла в OCR

Language
language enum

Language

Координата X
x string

Координата X (в Pts, 1/72 дюйма)

Координата Y
y string

Координата Y (в Pts, 1/72 дюйма)

Ширина
width string

Ширина области OCR (в Pts, 1/72 дюйма)

Высота
height string

Высота области OCR (в Pts, 1/72 дюйма)

Номер страницы
page_number string

Номер страницы (оставьте пустым для всех страниц OCR)

Performance
performance enum

Производительность ()

Черный список / список разрешений
characters_option enum

Параметр "Символы"

Символы
characters string

Символы для черного списка или списка разрешений

Использование разбиения на страницы
paginate boolean

Нумеровать страницы

Останавливать при ошибке
fail_on_error boolean

Останавливать при ошибке

Возвращаемое значение

Ответные данные для операции OCRText

Преобразование в OCRed PDF

Выполнение OCR в существующем PDF-документе или изображении для создания pdf-файла с возможностью поиска

Параметры

Имя Ключ Обязательно Тип Описание
Имя исходного файла
source_file_name True string

Имя исходного файла, включая расширение

Содержимое исходного файла
source_file_content True byte

Содержимое файла в OCR

Language
language enum

Language

Performance
performance enum

Performance

Черный список / список разрешений
characters_option enum

Параметр "Символы"

Символы
characters string

Символы для черного списка или списка разрешений

Использование разбиения на страницы
paginate boolean

Нумеровать страницы

Регионы
regions string

Ограничение области на OCR до одной или нескольких конкретных областей

Останавливать при ошибке
fail_on_error boolean

Останавливать при ошибке

Возвращаемое значение

Данные ответа для всех операций

Определения

ocr_operation_response

Ответные данные для операции OCRText

Имя Путь Тип Описание
Вне текста
out_text string

Извлеченный текст OCRed в виде обычного текста.

Имя базового файла
base_file_name string

Имя входного файла без расширения.

Код результата
result_code enum

Код результата операции.

Сведения о результатах
result_details string

Сведения о результатах операции.

operation_response

Данные ответа для всех операций

Имя Путь Тип Описание
Обработанное содержимое файла
processed_file_content byte

Файл, созданный преобразователем Muhimbi.

Имя базового файла
base_file_name string

Имя входного файла без расширения.

Код результата
result_code enum

Код результата операции.

Сведения о результатах
result_details string

Сведения о результатах операции.