Питательные вещества — OCR PDF

Преобразование сканированных документов и изображений в доступные для поиска редактируемые PDF-файлы с помощью действий OCR конвертера питательных документов. Просто извлеките текст из PDF-файлов с помощью расширенной технологии оптического распознавания символов (OCR) для индексирования, автоматизации и анализа содержимого.

Этот соединитель доступен в следующих продуктах и регионах:

Услуга	Class	Регионы
Copilot Studio	Премия	Все регионы Power Automate , кроме следующих: - Правительство США (GCC) - Правительство США (GCC High) — Облако Китая, управляемое 21Vianet - Министерство обороны США (DoD)
Логические приложения	Стандарт	Все регионы Logic Apps , кроме следующих: — Регионы Azure для государственных организаций — Регионы Azure Для Китая - Министерство обороны США (DoD)
Power Apps	Премия	Все регионы Power Apps , кроме следующих: - Правительство США (GCC) - Правительство США (GCC High) — Облако Китая, управляемое 21Vianet - Министерство обороны США (DoD)
Power Automate	Премия	Все регионы Power Automate , кроме следующих: - Правительство США (GCC) - Правительство США (GCC High) — Облако Китая, управляемое 21Vianet - Министерство обороны США (DoD)

Контакт
Имя	Поддержка питательных веществ (ранее Мухимби)
URL	https://support.nutrient.io/hc/en-us/requests/new
Адрес электронной почты	support+low-code@nutrient.io

Метаданные соединителя
Publisher	Мухимби торгуется как питательные вещества
Website	https://www.nutrient.io/low-code/
Политика конфиденциальности	https://www.nutrient.io/legal/privacy/
Категории	Сотрудничество; Содержимое и файлы

Выполнение OCR на изображениях и сканированных документах

Используйте конвертер документов питательных веществ для запуска оптического распознавания символов (OCR) на изображениях и сканированных файлах с помощью REST API или локальной библиотеки сервера.

Возможности OCR

Преобразуйте изображения, сканирование и факсы в доступные для поиска PDF-файлы.
Создание автоматизированных рабочих процессов документов для извлечения текста и возможности поиска в формате PDF.

Параметры интеграции

Интеграция функций OCR с примерами кода на предпочитаемом языке:

Предпосылки

Чтобы использовать конвертер питательных документов, вам нужна бесплатная или пробная учетная запись. Ознакомьтесь с руководством по сравнению, чтобы понять различия между этими типами учетных записей.

Начало работы

Выполните приведенные ниже действия, чтобы начать использование соединителя конвертера питательных документов:

Зарегистрируйтесь для 30-дневной пробной версии, заполнив эту форму.
После отправки формы вы получите электронное письмо с подробными сведениями о активации пробной версии.
Ознакомьтесь с видео о начале работы, чтобы получить пошаговое руководство по процессу.
Подробные инструкции см. в руководстве по Конвертеру документов для Power Automate .
Ознакомьтесь с руководствами по Power Automate и Logic Apps , чтобы ознакомиться с практическими примерами.

Известные проблемы и ограничения

Документы, защищенные с помощью IRM, DRM, RMS или решений AIP , не могут обрабатываться из-за ограничений безопасности.

Чтобы получить вопросы или помощь, обратитесь в службу поддержки.

Ограничения регулирования

Имя	Вызовы	Период обновления
Вызовы API для каждого подключения	100	60 секунд

Действия

Извлечение текста с помощью OCR	Извлечение текста из PDF-файла с помощью OCR
Преобразование в OCRed PDF	Выполнение OCR в существующем PDF-документе или изображении для создания pdf-файла с возможностью поиска

Извлечение текста с помощью OCR

Идентификатор операции:: ocr_text

Извлечение текста из PDF-файла с помощью OCR

Параметры

Имя	Ключ	Обязательно	Тип	Описание
Имя исходного файла	source_file_name	True	string	Имя исходного файла, включая расширение
Содержимое исходного файла	source_file_content	True	byte	Содержимое файла в OCR
Language	language		enum	Language
Координата X	x		string	Координата X (в Pts, 1/72 дюйма)
Координата Y	y		string	Координата Y (в Pts, 1/72 дюйма)
Ширина	width		string	Ширина области OCR (в Pts, 1/72 дюйма)
Высота	height		string	Высота области OCR (в Pts, 1/72 дюйма)
Номер страницы	page_number		string	Номер страницы (оставьте пустым для всех страниц OCR)
Performance	performance		enum	Производительность ()
Черный список / список разрешений	characters_option		enum	Параметр "Символы"
Символы	characters		string	Символы для черного списка или списка разрешений
Использование разбиения на страницы	paginate		boolean	Нумеровать страницы
Останавливать при ошибке	fail_on_error		boolean	Останавливать при ошибке

Возвращаемое значение

Ответные данные для операции OCRText

Тело: ocr_operation_response

Преобразование в OCRed PDF

Идентификатор операции:: ocr_pdf

Выполнение OCR в существующем PDF-документе или изображении для создания pdf-файла с возможностью поиска

Параметры

Имя	Ключ	Обязательно	Тип	Описание
Имя исходного файла	source_file_name	True	string	Имя исходного файла, включая расширение
Содержимое исходного файла	source_file_content	True	byte	Содержимое файла в OCR
Language	language		enum	Language
Performance	performance		enum	Performance
Черный список / список разрешений	characters_option		enum	Параметр "Символы"
Символы	characters		string	Символы для черного списка или списка разрешений
Использование разбиения на страницы	paginate		boolean	Нумеровать страницы
Регионы	regions		string	Ограничение области на OCR до одной или нескольких конкретных областей
Останавливать при ошибке	fail_on_error		boolean	Останавливать при ошибке

Возвращаемое значение

Данные ответа для всех операций

Тело: operation_response

Определения

ocr_operation_response

Ответные данные для операции OCRText

Имя	Путь	Тип	Описание
Вне текста	out_text	string	Извлеченный текст OCRed в виде обычного текста.
Имя базового файла	base_file_name	string	Имя входного файла без расширения.
Код результата	result_code	enum	Код результата операции.
Сведения о результатах	result_details	string	Сведения о результатах операции.

operation_response

Данные ответа для всех операций

Имя	Путь	Тип	Описание
Обработанное содержимое файла	processed_file_content	byte	Файл, созданный преобразователем Muhimbi.
Имя базового файла	base_file_name	string	Имя входного файла без расширения.
Код результата	result_code	enum	Код результата операции.
Сведения о результатах	result_details	string	Сведения о результатах операции.

Поделиться через

Питательные вещества — OCR PDF

Выполнение OCR на изображениях и сканированных документах

Возможности OCR

Параметры интеграции

Предпосылки

Начало работы

Известные проблемы и ограничения

Ограничения регулирования

Действия

Извлечение текста с помощью OCR

Параметры

Возвращаемое значение

Преобразование в OCRed PDF

Параметры

Возвращаемое значение

Определения

ocr_operation_response

operation_response