ИИ документа (предварительная версия)

Извлеките структурированные данные, включая именованные поля, таблицы, штрихкоды, классификации и сводки из общих форматов документов, сканированных документов и фотографий документов с помощью ИИ. Также поддерживает рукописный ввод и низкое качество фотографий и сканирования, а также цифровые входные данные документа. Поддерживает широкий спектр языков и может анализировать и выводить семантику структуры из визуального макета документов.

Этот соединитель доступен в следующих продуктах и регионах:

Услуга	Class	Регионы
Copilot Studio	Премия	Все регионы Power Automate за исключением следующих: - Правительство США (GCC) - Правительство США (GCC High) — Облако Китая, управляемое 21Vianet - Министерство обороны США (DoD)
Логические приложения	Стандарт	Все регионы Logic Apps , кроме следующих: - Azure Government регионы - Azure регионы Китая - Министерство обороны США (DoD)
Power Apps	Премия	Все регионы Power Apps кроме следующих: - Правительство США (GCC) - Правительство США (GCC High) — Облако Китая, управляемое 21Vianet - Министерство обороны США (DoD)
Power Automate	Премия	Все регионы Power Automate за исключением следующих: - Правительство США (GCC) - Правительство США (GCC High) — Облако Китая, управляемое 21Vianet - Министерство обороны США (DoD)

Контакт
Имя	Cloudmersive
URL	https://www.cloudmersive.com
Адрес электронной почты	support@cloudmersive.com

Метаданные соединителя
Publisher	Cloudmersive, LLC
Веб-сайт	https://www.cloudmersive.com
Политика конфиденциальности	https://www.cloudmersive.com/privacy-policy
Категории	Искусственный интеллект; Содержимое и файлы

Cloudmersive Document AI Connector

API ИИ Cloudmersive Document позволяет использовать ИИ следующего поколения для извлечения данных, полей, аналитических сведений и текста из документов.

Предпосылки

Для продолжения вам потребуется следующее:

Microsoft Power Apps, Power Automate или Azure Logic Apps с поддержкой соединителя premium
Ключ API Cloudmersive

Получение учетных данных

Чтобы использовать этот соединитель, требуется учетная запись Cloudmersive. Вы можете зарегистрироваться с помощью учетной записи Майкрософт или создать учетную запись Cloudmersive. Выполните приведенные ниже действия, чтобы получить ключ API.

Получение ключа и секрета API

Регистрация для облачной учетной записи
Щелкните ключи API

Здесь вы можете создать и просмотреть ключи API, перечисленные на странице "Ключи API". Просто скопируйте и вставьте этот ключ API в соединитель ИИ Cloudmersive Document.

Теперь вы можете приступить к использованию соединителя Cloudmersive CDR.

Поддерживаемые операции

Соединитель поддерживает следующие операции:

Enforce Policies to a Document to allow or block it using Advanced AI: принудительно применять политики к документу, чтобы разрешить или заблокировать его с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Использует 100 вызовов API на страницу.
Answer Questions about a Document in a structured way using Advanced AI: ответ на логический ответ (да/нет), несколько вариантов и бесплатных ответов о содержимом документа с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Использует 100 вызовов API на страницу.
Extract Text from a Document using AI: извлеките необработанный текст из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Поддерживает широкий спектр языков. Использует 100 вызовов API на страницу.
Extract Field Values from a Document using AI: извлеките значения полей (например, номер счета, дата счета, номер телефона визитной карточки и т. д.) из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.
Extract Field Values from a Document using Advanced AI: извлеките значения полей (например, номер счета, дата счета, номер телефона визитной карточки и т. д.) из документа с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.
Extract Tables of Data from a Document using AI: извлечение таблиц, состоящих из строк и столбцов данных, из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.
Extract Barcodes of from a Document using AI: извлеките все штрихкоды из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG, HEIC и WEBP. Использует 100 вызовов API на страницу.
Extract All Fields and Tables of Data from a Document using AI: извлеките все поля и таблицы, состоящие из строк и столбцов данных, из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.
Extract Classification or Category from a Document using AI: извлечение классификации или категории (например, счета, квитанции, налоговой формы или формы 1040, формы 1040 EZ и т. д.) из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.
Extract Classification or Category from a Document using Advanced AI: извлечение классификации или категории (например, счета, квитанции, налоговой формы или формы 1040, формы 1040 EZ и т. д.) из документа с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.
Extract Summary from a Document using AI: создает сводку по 1 абзацу входного документа с помощью искусственного интеллекта. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.
Extract Text from a Document using AI as a Batch Job: создает асинхронное пакетное задание для обработки большого документа в виде пакетного задания ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Поддерживает широкий спектр языков. Требуется развертывание Managed Instance или частного облака.
Extract Field Values from a Document using Advanced AI as a Batch Job: создает асинхронное пакетное задание для обработки большого документа в виде пакетного задания ИИ. Извлечение значений полей (например, номер счета, дата счета, номер телефона визитной карточки и т. д.) из документа с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Требуется развертывание Managed Instance или частного облака.
Extract All Fields and Tables of Data from a Document using AI as a Batch Job: создает асинхронное пакетное задание для обработки большого документа в виде пакетного задания ИИ. Извлеките все поля и таблицы, состоящие из строк и столбцов данных, из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Требуется развертывание Managed Instance или частного облака.
Extract Classification or Category from a Document using AI as a Batch Job: создает асинхронное пакетное задание для обработки большого документа в виде пакетного задания ИИ. Извлечение классификации или категории (например, счета, квитанции, налоговой формы или формы 1040, формы 1040 EZ и т. д.) из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Требуется развертывание Managed Instance или частного облака.
Get the status and result of an Extract Document Batch Job: возвращает результат асинхронного задания — возможные состояния можно ЗАПУСТИТЬ или ЗАВЕРШИТЬ. Этот API доступен только для развертываний Cloudmersive Managed Instance и частного облака.

Создание подключения

Соединитель поддерживает следующие типы проверки подлинности:


По умолчанию	Параметры для создания подключения.	Все регионы	Недоступен для совместного использования

По умолчанию

Применимо: все регионы

Параметры для создания подключения.

Это недоступно для общего доступа. Если приложение power предоставляется другому пользователю, пользователю будет предложено явно создать новое подключение.

Имя	Тип	Description	Обязательно
Apikey	securestring	Apikey для этого API	True

Ограничения регулирования

Имя	Вызовы	Период обновления
Вызовы API для каждого подключения	100	60 секунд

Действия

Извлечение всех полей и таблиц данных из документа с помощью ИИ	Извлеките все поля и таблицы, состоящие из строк и столбцов данных, из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.
Извлечение всех полей и таблиц данных из документа с помощью ИИ в качестве пакетного задания	Создает асинхронное пакетное задание для обработки большого документа в виде пакетного задания ИИ. Извлеките все поля и таблицы, состоящие из строк и столбцов данных, из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Требуется развертывание Managed Instance или частного облака.
Извлечение значений полей из документа с помощью ИИ	Извлеките значения полей (например, номер счета, дата счета, номер телефона визитной карточки и т. д.) из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.
Извлечение значений полей из документа с помощью расширенного ИИ в качестве пакетного задания	Создает асинхронное пакетное задание для обработки большого документа в виде пакетного задания ИИ. Извлечение значений полей (например, номер счета, дата счета, номер телефона визитной карточки и т. д.) из документа с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Требуется развертывание Managed Instance или частного облака.
Извлечение значений полей из документа с помощью расширенного искусственного интеллекта	Извлечение значений полей (например, номер счета, дата счета, номер телефона визитной карточки и т. д.) из документа с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.
Извлечение классификации или категории из документа с помощью ИИ	Извлечение классификации или категории (например, счета, квитанции, налоговой формы или формы 1040, формы 1040 EZ и т. д.) из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.
Извлечение классификации или категории из документа с помощью ИИ в качестве пакетного задания	Создает асинхронное пакетное задание для обработки большого документа в виде пакетного задания ИИ. Извлечение классификации или категории (например, счета, квитанции, налоговой формы или формы 1040, формы 1040 EZ и т. д.) из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Требуется развертывание Managed Instance или частного облака.
Извлечение классификации или категории из документа с помощью расширенного ИИ	Извлечение классификации или категории (например, счета, квитанции, налоговой формы или формы 1040, формы 1040 EZ и т. д.) из документа с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.
Извлечение сводки из документа с помощью ИИ	Создает сводку по 1 абзацу входного документа с помощью искусственного интеллекта. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.
Извлечение таблиц данных из документа с помощью ИИ	Извлеките таблицы, состоящие из строк и столбцов данных, из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Используется 100 вызовов API на страницу.
Извлечение текста из документа с помощью ИИ в качестве пакетного задания	Создает асинхронное пакетное задание для обработки большого документа в виде пакетного задания ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Поддерживает широкий спектр языков. Требуется развертывание Managed Instance или частного облака.
Извлечение текста из документа с помощью искусственного интеллекта	Извлеките необработанный текст из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Поддерживает широкий спектр языков. Использует 100 вызовов API на страницу.
Извлечение штрихкодов из документа с помощью ИИ	Извлеките все штрихкоды из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG, HEIC и WEBP. Использует 100 вызовов API на страницу.
Ответы на вопросы о документе структурированным способом с помощью расширенного искусственного интеллекта	Ответ на логические вопросы (да/нет), несколько вариантов и бесплатных ответов о содержимом документа с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Использует 100 вызовов API на страницу.
Получение состояния и результата задания пакетной службы извлечения документов	Возвращает результат асинхронного задания— возможные состояния можно ЗАПУСТИТЬ или ЗАВЕРШИТЬ. Этот API доступен только для развертываний Cloudmersive Managed Instance и частного облака.
Принудительное применение политик к документу, чтобы разрешить или заблокировать его с помощью расширенного искусственного интеллекта	Принудительное применение политик к документу, чтобы разрешить или заблокировать его с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Использует 100 вызовов API на страницу.

Извлечение всех полей и таблиц данных из документа с помощью ИИ

Идентификатор операции:: ExtractAllFieldsAndTables

Извлеките все поля и таблицы, состоящие из строк и столбцов данных, из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.

Параметры

Имя	Ключ	Тип	Описание
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...	recognitionMode	string	Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...
Необязательно. Задайте уровень предварительной обработки изображения для повышения точности. ...	preprocessing	string	Необязательно. Задайте уровень предварительной обработки изображения для повышения точности. ...
Входной документ или фотографии документа для извлечения данных из	InputFile	file	Входной документ или фотографии документа для извлечения данных из

Возвращаемое значение

Результат извлечения полей из документа

Тело: ExtractFieldsAndTablesResponse

Извлечение всех полей и таблиц данных из документа с помощью ИИ в качестве пакетного задания

Идентификатор операции:: ExtractAllFieldsAndTablesFromDocumentBatchJob

Создает асинхронное пакетное задание для обработки большого документа в виде пакетного задания ИИ. Извлеките все поля и таблицы, состоящие из строк и столбцов данных, из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Требуется развертывание Managed Instance или частного облака.

Параметры

Имя	Ключ	Обязательно	Тип	Описание
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...	recognitionMode		string	Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...
Входной документ или фотографии документа для извлечения данных из	InputFile		file	Входной документ или фотографии документа для извлечения данных из

Возвращаемое значение

Результат выполнения пакетного задания разбиения документа

Тело: ExtractDocumentBatchJobResult

Извлечение значений полей из документа с помощью ИИ

Идентификатор операции:: ExtractFields

Извлеките значения полей (например, номер счета, дата счета, номер телефона визитной карточки и т. д.) из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.

Параметры

Имя	Ключ	Тип	Описание
Требуемые поля для извлечения, разделенные запятыми	FieldNames	string	Требуемые поля для извлечения, разделенные запятыми
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...	recognitionMode	string	Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...
Входной документ или фотографии документа для извлечения данных из	InputFile	file	Входной документ или фотографии документа для извлечения данных из

Возвращаемое значение

Результат извлечения полей из документа

Тело: ExtractFieldsResponse

Извлечение значений полей из документа с помощью расширенного ИИ в качестве пакетного задания

Идентификатор операции:: ExtractFieldsFromDocumentAdvancedBatchJob

Создает асинхронное пакетное задание для обработки большого документа в виде пакетного задания ИИ. Извлечение значений полей (например, номер счета, дата счета, номер телефона визитной карточки и т. д.) из документа с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Требуется развертывание Managed Instance или частного облака.

Параметры

Имя	Ключ	Тип	Описание
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...	recognitionMode	string	Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...
InputFile	InputFile	byte	Входной файл документа для выполнения операции в виде массива байтов
Имя поля	FieldName	string	Имя поля для извлечения
FieldOptional	FieldOptional	boolean	Необязательный: значение true, если поле является необязательным, значение false при необходимости (по умолчанию)
FieldDescription	FieldDescription	string	Необязательно, но рекомендуется: описание поля — используйте его для описания того, что такое поле, как оно отформатировано, что уникально для него и т. д.
FieldExample	FieldExample	string	Необязательно. Пример метки или значения поля
MaximumPagesProcessed	MaximumPagesProcessed	integer	Необязательно. Ограничение количества обработанных страниц
Preprocessing	Preprocessing	string	Необязательно. Задайте уровень предварительной обработки изображения для повышения точности. Возможные значения: "Auto", "SmoothEdges", "SmoothEdgesPlus", "ContrastEdgesPlus", "ContrastEdgesPlus", "Invert", "Binarize", "Compatability" и "None". По умолчанию используется значение Auto. Установите значение SmoothEdges на гладкие жесткие края в входном изображении, чтобы повысить точность распознавания. Установите значение SmoothEdgesPlus, чтобы сгладить суровые края до более высокой степени. Установите значение "Контрастные" и "Контрастные", чтобы повысить контрастность и удобочитаемость для изображений с низким качеством черного и белого или серого уровня. Установите значение Invert, чтобы инвертировать входной образ. Установите для binarize входное изображение. Задайте значение Compatability для максимальной совместимости функций PDF.
ResultCrossCheck	ResultCrossCheck	string	Необязательно. Задайте уровень точности перекрестной проверки выходных данных для выполнения входных данных. Возможные значения: None, Advanced и Ultra. Значение по умолчанию — None. Ультра будет производить максимальную точность, но по стоимости более длительного времени обработки.
СменаImageDegrees	RotateImageDegrees	double	Необязательно. Поворот входного изображения перед распознаванием по указанному количеству градусов; Допустимые значения варьируются от -360 до +360.

Возвращаемое значение

Результат выполнения пакетного задания разбиения документа

Тело: ExtractDocumentBatchJobResult

Извлечение значений полей из документа с помощью расширенного искусственного интеллекта

Идентификатор операции:: ExtractFieldsAdvanced

Извлечение значений полей (например, номер счета, дата счета, номер телефона визитной карточки и т. д.) из документа с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.

Параметры

Имя	Ключ	Тип	Описание
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...	recognitionMode	string	Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...
InputFile	InputFile	byte	Входной файл документа для выполнения операции в виде массива байтов
Имя поля	FieldName	string	Имя поля для извлечения
FieldOptional	FieldOptional	boolean	Необязательный: значение true, если поле является необязательным, значение false при необходимости (по умолчанию)
FieldDescription	FieldDescription	string	Необязательно, но рекомендуется: описание поля — используйте его для описания того, что такое поле, как оно отформатировано, что уникально для него и т. д.
FieldExample	FieldExample	string	Необязательно. Пример метки или значения поля
MaximumPagesProcessed	MaximumPagesProcessed	integer	Необязательно. Ограничение количества обработанных страниц
Preprocessing	Preprocessing	string	Необязательно. Задайте уровень предварительной обработки изображения для повышения точности. Возможные значения: "Auto", "SmoothEdges", "SmoothEdgesPlus", "ContrastEdgesPlus", "ContrastEdgesPlus", "Invert", "Binarize", "Compatability" и "None". По умолчанию используется значение Auto. Установите значение SmoothEdges на гладкие жесткие края в входном изображении, чтобы повысить точность распознавания. Установите значение SmoothEdgesPlus, чтобы сгладить суровые края до более высокой степени. Установите значение "Контрастные" и "Контрастные", чтобы повысить контрастность и удобочитаемость для изображений с низким качеством черного и белого или серого уровня. Установите значение Invert, чтобы инвертировать входной образ. Установите для binarize входное изображение. Задайте значение Compatability для максимальной совместимости функций PDF.
ResultCrossCheck	ResultCrossCheck	string	Необязательно. Задайте уровень точности перекрестной проверки выходных данных для выполнения входных данных. Возможные значения: None, Advanced и Ultra. Значение по умолчанию — None. Ультра будет производить максимальную точность, но по стоимости более длительного времени обработки.
СменаImageDegrees	RotateImageDegrees	double	Необязательно. Поворот входного изображения перед распознаванием по указанному количеству градусов; Допустимые значения варьируются от -360 до +360.

Возвращаемое значение

Результат извлечения полей из документа

Тело: ExtractFieldsAdvancedResponse

Извлечение классификации или категории из документа с помощью ИИ

Идентификатор операции:: ExtractClassification

Извлечение классификации или категории (например, счета, квитанции, налоговой формы или формы 1040, формы 1040 EZ и т. д.) из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.

Параметры

Имя	Ключ	Тип	Описание
Требуемая классификация для извлечения	Categories	string	Требуемая классификация для извлечения
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...	recognitionMode	string	Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...
Входной документ или фотографии документа для извлечения данных из	InputFile	file	Входной документ или фотографии документа для извлечения данных из

Возвращаемое значение

Результат классификации документа с помощью искусственного интеллекта

Тело: DocumentClassificationResult

Извлечение классификации или категории из документа с помощью ИИ в качестве пакетного задания

Идентификатор операции:: ExtractClassificationFromDocumentBatchJob

Создает асинхронное пакетное задание для обработки большого документа в виде пакетного задания ИИ. Извлечение классификации или категории (например, счета, квитанции, налоговой формы или формы 1040, формы 1040 EZ и т. д.) из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Требуется развертывание Managed Instance или частного облака.

Параметры

Имя	Ключ	Тип	Описание
Требуемая классификация для извлечения	Categories	string	Требуемая классификация для извлечения
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...	recognitionMode	string	Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...
Входной документ или фотографии документа для извлечения данных из	InputFile	file	Входной документ или фотографии документа для извлечения данных из

Возвращаемое значение

Результат выполнения пакетного задания разбиения документа

Тело: ExtractDocumentBatchJobResult

Извлечение классификации или категории из документа с помощью расширенного ИИ

Идентификатор операции:: ExtractClassificationAdvanced

Извлечение классификации или категории (например, счета, квитанции, налоговой формы или формы 1040, формы 1040 EZ и т. д.) из документа с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.

Параметры

Имя	Ключ	Тип	Описание
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...	recognitionMode	string	Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...
InputFile	InputFile	byte	Входной файл документа для выполнения операции в виде массива байтов
ИмяКатегории	CategoryName	string	Имя классификации
CategoryDescription	CategoryDescription	string	Необязательно, но рекомендуется: описание классификации в естественном навесе
Preprocessing	Preprocessing	string	Необязательно. Задайте уровень предварительной обработки изображения для повышения точности. Возможные значения: Auto, SmoothEdges, SmoothEdgesPlus, Compatability и None. По умолчанию используется значение Auto. Установите значение SmoothEdges на гладкие жесткие края в входном изображении, чтобы повысить точность распознавания. Установите значение SmoothEdgesPlus, чтобы сгладить суровые края до более высокой степени. Задайте значение Compatability для максимальной совместимости функций PDF.
ResultCrossCheck	ResultCrossCheck	string	Необязательно. Задайте уровень точности перекрестной проверки выходных данных для выполнения входных данных. Возможные значения: None, Advanced, Ultra и Hyper. Значение по умолчанию — None. Ультра и Hyper будут производить максимальную точность, но за счет длительного времени обработки.
MaximumPagesProcessed	MaximumPagesProcessed	integer	Необязательно. Ограничение количества обработанных страниц
СменаImageDegrees	RotateImageDegrees	double	Необязательно. Поворот входного изображения перед распознаванием по указанному количеству градусов; Допустимые значения варьируются от -360 до +360.

Возвращаемое значение

Результат классификации документа с помощью искусственного интеллекта

Тело: DocumentAdvancedClassificationResult

Извлечение сводки из документа с помощью ИИ

Идентификатор операции:: ExtractSummary

Создает сводку по 1 абзацу входного документа с помощью искусственного интеллекта. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.

Параметры

Имя	Ключ	Обязательно	Тип	Описание
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...	recognitionMode		string	Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...
Входной документ или фотографии документа для извлечения данных из	InputFile		file	Входной документ или фотографии документа для извлечения данных из

Возвращаемое значение

Результат сводки документа

Тело: SummarizeDocumentResponse

Извлечение таблиц данных из документа с помощью ИИ

Идентификатор операции:: ExtractTables

Извлеките таблицы, состоящие из строк и столбцов данных, из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Используется 100 вызовов API на страницу.

Параметры

Имя	Ключ	Обязательно	Тип	Описание
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...	recognitionMode		string	Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...
Входной документ или фотографии документа для извлечения данных из	InputFile		file	Входной документ или фотографии документа для извлечения данных из

Возвращаемое значение

Результат извлечения таблиц из документа

Тело: ExtractTablesResponse

Извлечение текста из документа с помощью ИИ в качестве пакетного задания

Идентификатор операции:: ExtractTextFromDocumentBatchJob

Создает асинхронное пакетное задание для обработки большого документа в виде пакетного задания ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Поддерживает широкий спектр языков. Требуется развертывание Managed Instance или частного облака.

Параметры

Имя	Ключ	Обязательно	Тип	Описание
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...	recognitionMode		string	Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...
Входной документ или фотографии документа для извлечения данных из	InputFile		file	Входной документ или фотографии документа для извлечения данных из

Возвращаемое значение

Результат выполнения пакетного задания разбиения документа

Тело: ExtractDocumentBatchJobResult

Извлечение текста из документа с помощью искусственного интеллекта

Идентификатор операции:: ExtractText

Извлеките необработанный текст из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Поддерживает широкий спектр языков. Использует 100 вызовов API на страницу.

Параметры

Имя	Ключ	Обязательно	Тип	Описание
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...	recognitionMode		string	Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...
Входной документ или фотографии документа для извлечения данных из	InputFile		file	Входной документ или фотографии документа для извлечения данных из

Возвращаемое значение

Результат извлечения текста из документа

Тело: ExtractTextResponse

Извлечение штрихкодов из документа с помощью ИИ

Идентификатор операции:: ExtractBarcodes

Извлеките все штрихкоды из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG, HEIC и WEBP. Использует 100 вызовов API на страницу.

Параметры

Имя	Ключ	Обязательно	Тип	Описание
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...	recognitionMode		string	Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...
Входной документ или фотографии документа для извлечения данных из	InputFile		file	Входной документ или фотографии документа для извлечения данных из

Возвращаемое значение

Результат извлечения штрихкодов из документа

Тело: ExtractBarcodesAiResponse

Ответы на вопросы о документе структурированным способом с помощью расширенного искусственного интеллекта

Идентификатор операции:: AnswerQuestions

Ответ на логические вопросы (да/нет), несколько вариантов и бесплатных ответов о содержимом документа с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Использует 100 вызовов API на страницу.

Параметры

Имя	Ключ	Тип	Описание
InputFile	InputFile	byte	Входной файл в виде массива байтов
QuestionId	QuestionId	string	Уникальный идентификатор вопроса, например 1 или 2A
ВопросТекст	QuestionText	string	Вопрос на естественном языке, чтобы задать документ, в котором ответ разрешает да или НЕТ, например "Подписан ли этот документ и подназначен обеими сторонами?"
QuestionId	QuestionId	string	Уникальный идентификатор вопроса, например 1 или 2A
ВопросТекст	QuestionText	string	Вопрос на естественном языке, чтобы задать документ, где ответ разрешает одно из фиксированного числа предоставленных вариантов, например "Что такое руководящий закон этого соглашения?"
ChoiceId	ChoiceId	string	Уникальный идентификатор выбора ответа, например 3C
ChoiceText	ChoiceText	string	Текст описания этого выбора, например "Delaware"
QuestionId	QuestionId	string	Уникальный идентификатор вопроса, например 7 или 5A
ВопросТекст	QuestionText	string	Вопрос на естественном языке, чтобы задать документ, в котором ответ разрешается на свободный ответ, например "Кто является коллегой в этом соглашении?"
RecognitionMode	RecognitionMode	string	Дополнительные; Режим распознавания — обычный (по умолчанию) обеспечивает максимальную точность, но медленную скорость, в то время как обычный обеспечивает более быстрый ответ, но более низкую точность для изображений низкого качества

Возвращаемое значение

Результат выполнения операции ответа на вопрос документа

Тело: DocumentQuestionAnswersResult

Получение состояния и результата задания пакетной службы извлечения документов

Идентификатор операции:: GetAsyncJobStatus

Возвращает результат асинхронного задания— возможные состояния можно ЗАПУСТИТЬ или ЗАВЕРШИТЬ. Этот API доступен только для развертываний Cloudmersive Managed Instance и частного облака.

Параметры

Имя	Ключ	Обязательно	Тип	Описание
Идентификатор задания для пакетного задания, чтобы получить состояние	AsyncJobID		string	Идентификатор задания для пакетного задания, чтобы получить состояние

Возвращаемое значение

Результат выполнения операции пакетного задания

Тело: ExtractDocumentJobStatusResult

Принудительное применение политик к документу, чтобы разрешить или заблокировать его с помощью расширенного искусственного интеллекта

Идентификатор операции:: ApplyRules

Принудительное применение политик к документу, чтобы разрешить или заблокировать его с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Использует 100 вызовов API на страницу.

Параметры

Имя	Ключ	Тип	Описание
InputFile	InputFile	byte	Входной файл в виде массива байтов
Идентификатор правила	RuleId	string
ТипПравила	RuleType	string	Возможные значения: ALLOW и DENY
RuleDescription	RuleDescription	string	Описание правила на естественном языке, например, не разрешайте документам, содержащим оскорбительный язык
RecognitionMode	RecognitionMode	string	Дополнительные; Режим распознавания — обычный (по умолчанию) обеспечивает максимальную точность, но медленную скорость, в то время как обычный обеспечивает более быстрый ответ, но более низкую точность для изображений низкого качества

Возвращаемое значение

Результат выполнения операции принудительного применения политики документов

Тело: DocumentPolicyResult

Определения

DocumentAdvancedClassificationResult

Результат классификации документа с помощью искусственного интеллекта

Имя	Путь	Тип	Описание
Успешно выполнено	Successful	boolean	Значение True, если успешно, значение false в противном случае
DocumentCategoryResult	DocumentCategoryResult	string	Категория, примененная к документу; Если не удалось определить категорию, будет использоваться "другой". Пробелы заменяются подчеркиваниями.
Уровень доверия	ConfidenceScore	double	Оценка достоверности от 0.0 до 1.0, где значения > 0,8 указывают на высокую достоверность.

DocumentClassificationResult

Результат классификации документа с помощью искусственного интеллекта

Имя	Путь	Тип	Описание
Успешно выполнено	Successful	boolean	Значение True, если успешно, значение false в противном случае
DocumentCategoryResult	DocumentCategoryResult	string	Категория, примененная к документу; Если не удалось определить категорию, будет использоваться "другой". Пробелы заменяются подчеркиваниями.

DocumentPolicyResult

Результат выполнения операции принудительного применения политики документов

Имя	Путь	Тип	Описание
CleanResult	CleanResult	boolean	Значение True, если документ соответствует всем политикам, и значение false, если оно не соответствует
RiskScore	RiskScore	double	Оценка риска от 0,0 до 1.0, где значения выше 0,5 повышают уровень риска
RuleViolations	RuleViolations	array of PolicyRuleViolation	Нарушения политики

DocumentQuestionAnswerItem

Ответ на входной вопрос

Имя	Путь	Тип	Описание
QuestionId	QuestionId	string	Идентификатор входного вопроса
AnswerValue	AnswerValue	string	Значение ответа ответа, отформатированный как строка, для этого вопроса. Логические вопросы возвращают ДА или НЕТ.
AnswerRationale	AnswerRationale	string	Обоснование, объясняющее, почему этот ответ был дан
Уровень доверия	ConfidenceScore	double	Оценка достоверности между 0.0 и 1.0, где значения выше 0,8 указывают на высокую достоверность

DocumentQuestionAnswersResult

Результат выполнения операции ответа на вопрос документа

Имя	Путь	Тип	Описание
Успешно выполнено	Successful	boolean	Значение True, если операция была выполнена успешно, или значение false в противном случае
Уровень доверия	ConfidenceScore	double	Оценка достоверности между 0.0 и 1.0, где значения выше 0,8 указывают на высокую достоверность
AnswerResults	AnswerResults	array of DocumentQuestionAnswerItem

ExtractBarcodesAiResponse

Результат извлечения штрихкодов из документа

Имя	Путь	Тип	Описание
Успешно выполнено	Successful	boolean	Значение True, если успешно, значение false в противном случае
BarcodeResults	BarcodeResults	array of ExtractedBarcodeItem	Результаты табличного значения из операции извлечения

ExtractDocumentBatchJobResult

Результат выполнения пакетного задания разбиения документа

Имя	Путь	Тип	Описание
Успешно выполнено	Successful	boolean	Значение True, если успешно, значение false в противном случае
AsyncJobID	AsyncJobID	string	При создании задания возвращается идентификатор асинхронного задания. Используйте API GetAsyncJobStatus, чтобы проверить состояние этого задания с помощью AsyncJobID и получить результат после завершения.

ExtractDocumentJobStatusResult

Результат выполнения операции пакетного задания

Имя	Путь	Тип	Описание
Успешно выполнено	Successful	boolean	Значение True, если операция проверки состояния задания выполнена успешно, значение false в противном случае
AsyncJobStatus	AsyncJobStatus	string	Возвращает состояние задания Асинхронного задания, если применимо. Возможные состояния STARTED и COMPLETED
AsyncJobID	AsyncJobID	string	Идентификатор задания
ExtractTextResult	ExtractTextResult	ExtractTextResponse	Результат извлечения текста из документа
ExtractFieldsAndTablesResult	ExtractFieldsAndTablesResult	ExtractFieldsAndTablesResponse	Результат извлечения полей из документа
ExtractFieldsResult	ExtractFieldsResult	ExtractFieldsResponse	Результат извлечения полей из документа
ExtractClassificationResult	ExtractClassificationResult	DocumentClassificationResult	Результат классификации документа с помощью искусственного интеллекта
Сообщение об ошибке	ErrorMessage	string	Сообщение об ошибке (если таковое есть)

ExtractFieldsAdvancedResponse

Результат извлечения полей из документа

Имя	Путь	Тип	Описание
Успешно выполнено	Successful	boolean	Значение True, если успешно, значение false в противном случае
Results	Results	array of FieldAdvancedValue	Результаты значения поля из операции извлечения
Уровень доверия	ConfidenceScore	double	Оценка достоверности от 0.0 до 1.0, где значения > 0,8 указывают на высокую достоверность.

ExtractFieldsAndTablesResponse

Результат извлечения полей из документа

Имя	Путь	Тип	Описание
Успешно выполнено	Successful	boolean	Значение True, если успешно, значение false в противном случае
FieldResults	FieldResults	array of FieldValue	Результаты значения поля из операции извлечения
TableResults	TableResults	array of TableResult	Результаты табличного значения из операции извлечения

ExtractFieldsResponse

Результат извлечения полей из документа

Имя	Путь	Тип	Описание
Успешно выполнено	Successful	boolean	Значение True, если успешно, значение false в противном случае
Results	Results	array of FieldValue	Результаты значения поля из операции извлечения

ExtractTablesResponse

Результат извлечения таблиц из документа

Имя	Путь	Тип	Описание
Успешно выполнено	Successful	boolean	Значение True, если успешно, значение false в противном случае
TableResults	TableResults	array of TableResult	Результаты табличного значения из операции извлечения

ExtractTextResponse

Результат извлечения текста из документа

Имя	Путь	Тип	Описание
Успешно выполнено	Successful	boolean	Значение True, если успешно, значение false в противном случае
PageResults	PageResults	array of ExtractedTextPage	Результаты страницы из операции извлечения

ExtractedBarcodeItem

Извлеченный результат штрихкода

Имя	Путь	Тип	Описание
BarcodeType	BarcodeType	string	Тип идентифицированного штрихкода: AZTEC, CODABAR, CODE_39, CODE_93, CODE_128, DATA_MATRIX, EAN_8, EAN_13, ITF, MAXICODE, PDF_417, QR_CODE, RSS_14, RSS_EXPANDED, UPC_A, UPC_E, All_1D, UPC_EAN_EXTENSION, MSI, PLESSEY, IMB, UNKNOWN
BarcodeValue	BarcodeValue	string	Значение штрихкода в виде строки

ExtractedTextPage

Извлеченная страница из входного документа

Имя	Путь	Тип	Описание
PageNumber	PageNumber	integer	Индекс номера страницы, на основе 1
TextResult	TextResult	string	Текстовое содержимое страницы

FieldAdvancedValue

Результат извлечения полей из документа

Имя	Путь	Тип	Описание
Имя поля	FieldName	string	Имя поля (обратите внимание, что пробелы будут заменены подчеркиванием)
FieldStringValue	FieldStringValue	string	Строковое значение поля, извлеченного из документа

FieldValue

Результат извлечения полей из документа

Имя	Путь	Тип	Описание
Имя поля	FieldName	string	Имя поля (обратите внимание, что пробелы будут заменены подчеркиванием)
FieldStringValue	FieldStringValue	string	Основное или первое строковое значение поля, извлеченного из документа
AdditionalFieldStringValues	AdditionalFieldStringValues	array of string	Дополнительные значения этого поля, если одно и то же поле присутствует с несколькими значениями, например, если два экземпляра одной формы происходят в одном документе

PolicyRuleViolation

Экземпляры нарушения правила политики

Имя	Путь	Тип	Описание
Идентификатор правила	RuleId	string	Идентификатор правила; Если идентификатор не указан, идентификатор — это 1-й индекс правила.
RuleViolationRiskScore	RuleViolationRiskScore	double	Оценка риска от 0,0 до 1.0, где значения выше 0,5 повышают уровень риска
RuleViolationRationale	RuleViolationRationale	string	Обоснование естественного языка ИИ для того, почему эта политика была нарушена

СуммированиеDocumentResponse

Результат сводки документа

Имя	Путь	Тип	Описание
Успешно выполнено	Successful	boolean	Значение True, если успешно, значение false в противном случае
DocumentSummaryText	DocumentSummaryText	string	Сводка документа

TableResult

Таблица, извлеченная из документа

Имя	Путь	Тип	Описание
Название	Title	string	Заголовок таблицы (необязательно)
Rows	Rows	array of TableResultRow	Строки таблицы

TableResultCell

Ячейка строки таблицы, извлеченной из документа

Имя	Путь	Тип	Описание
CellHeader	CellHeader	string	Заголовок столбца ячейки
CellValue	CellValue	string	Значение ячейки в виде строки

TableResultRow

Строка таблицы, извлеченной из документа

Имя	Путь	Тип	Описание
Клетки	Cells	array of TableResultCell	Ячейки в строке

Поделиться через

ИИ документа (предварительная версия)

Cloudmersive Document AI Connector

Предпосылки

Получение учетных данных

Получение ключа и секрета API

Поддерживаемые операции

Создание подключения

По умолчанию

Ограничения регулирования

Действия

Извлечение всех полей и таблиц данных из документа с помощью ИИ

Параметры

Возвращаемое значение

Извлечение всех полей и таблиц данных из документа с помощью ИИ в качестве пакетного задания

Параметры

Возвращаемое значение

Извлечение значений полей из документа с помощью ИИ

Параметры

Возвращаемое значение

Извлечение значений полей из документа с помощью расширенного ИИ в качестве пакетного задания

Параметры

Возвращаемое значение

Извлечение значений полей из документа с помощью расширенного искусственного интеллекта

Параметры

Возвращаемое значение

Извлечение классификации или категории из документа с помощью ИИ

Параметры

Возвращаемое значение

Извлечение классификации или категории из документа с помощью ИИ в качестве пакетного задания

Параметры

Возвращаемое значение

Извлечение классификации или категории из документа с помощью расширенного ИИ

Параметры

Возвращаемое значение

Извлечение сводки из документа с помощью ИИ

Параметры

Возвращаемое значение

Извлечение таблиц данных из документа с помощью ИИ

Параметры

Возвращаемое значение

Извлечение текста из документа с помощью ИИ в качестве пакетного задания

Параметры

Возвращаемое значение

Извлечение текста из документа с помощью искусственного интеллекта

Параметры

Возвращаемое значение

Извлечение штрихкодов из документа с помощью ИИ

Параметры

Возвращаемое значение

Ответы на вопросы о документе структурированным способом с помощью расширенного искусственного интеллекта

Параметры

Возвращаемое значение

Получение состояния и результата задания пакетной службы извлечения документов

Параметры

Возвращаемое значение

Принудительное применение политик к документу, чтобы разрешить или заблокировать его с помощью расширенного искусственного интеллекта

Параметры

Возвращаемое значение

Определения

DocumentAdvancedClassificationResult

DocumentClassificationResult

DocumentPolicyResult

DocumentQuestionAnswerItem

DocumentQuestionAnswersResult

ExtractBarcodesAiResponse

ExtractDocumentBatchJobResult

ExtractDocumentJobStatusResult

ExtractFieldsAdvancedResponse

ExtractFieldsAndTablesResponse

ExtractFieldsResponse

ExtractTablesResponse

ExtractTextResponse

ExtractedBarcodeItem

ExtractedTextPage

FieldAdvancedValue

FieldValue

PolicyRuleViolation

СуммированиеDocumentResponse

TableResult