ИИ документа (предварительная версия)
Извлеките структурированные данные, включая именованные поля, таблицы, штрихкоды, классификации и сводки из общих форматов документов, сканированных документов и фотографий документов с помощью ИИ. Также поддерживает рукописный ввод и низкое качество фотографий и сканирования, а также цифровые входные данные документа. Поддерживает широкий спектр языков и может анализировать и выводить семантику структуры из визуального макета документов.
Этот соединитель доступен в следующих продуктах и регионах:
| Услуга | Class | Регионы |
|---|---|---|
| Copilot Studio | Премия | Все регионы Power Automate , кроме следующих: - Правительство США (GCC) - Правительство США (GCC High) — Облако Китая, управляемое 21Vianet - Министерство обороны США (DoD) |
| Логические приложения | Стандарт | Все регионы Logic Apps , кроме следующих: — Регионы Azure для государственных организаций — Регионы Azure Для Китая - Министерство обороны США (DoD) |
| Power Apps | Премия | Все регионы Power Apps , кроме следующих: - Правительство США (GCC) - Правительство США (GCC High) — Облако Китая, управляемое 21Vianet - Министерство обороны США (DoD) |
| Power Automate | Премия | Все регионы Power Automate , кроме следующих: - Правительство США (GCC) - Правительство США (GCC High) — Облако Китая, управляемое 21Vianet - Министерство обороны США (DoD) |
| Контакт | |
|---|---|
| Имя | Cloudmersive |
| URL | https://www.cloudmersive.com |
| Адрес электронной почты | support@cloudmersive.com |
| Метаданные соединителя | |
|---|---|
| Publisher | Cloudmersive, LLC |
| Веб-сайт | https://www.cloudmersive.com |
| Политика конфиденциальности | https://www.cloudmersive.com/privacy-policy |
| Категории | Искусственный интеллект; Содержимое и файлы |
Cloudmersive Document AI Connector
API ИИ Cloudmersive Document позволяет использовать ИИ следующего поколения для извлечения данных, полей, аналитических сведений и текста из документов.
Предпосылки
Для продолжения вам потребуется следующее:
- Поддержка соединителя Microsoft Power Apps, Power Automate или Azure Logic Apps с поддержкой соединителя premium
- Ключ API Cloudmersive
Получение учетных данных
Чтобы использовать этот соединитель, требуется учетная запись Cloudmersive. Вы можете зарегистрироваться с помощью учетной записи Майкрософт или создать учетную запись Cloudmersive. Выполните приведенные ниже действия, чтобы получить ключ API.
Получение ключа и секрета API
- Регистрация для облачной учетной записи
- Щелкните ключи API
Здесь вы можете создать и просмотреть ключи API, перечисленные на странице "Ключи API". Просто скопируйте и вставьте этот ключ API в соединитель ИИ Cloudmersive Document.
Теперь вы можете приступить к использованию соединителя Cloudmersive CDR.
Поддерживаемые операции
Соединитель поддерживает следующие операции:
-
Enforce Policies to a Document to allow or block it using Advanced AI: принудительно применять политики к документу, чтобы разрешить или заблокировать его с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Использует 100 вызовов API на страницу. -
Answer Questions about a Document in a structured way using Advanced AI: ответ на логический ответ (да/нет), несколько вариантов и бесплатных ответов о содержимом документа с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Использует 100 вызовов API на страницу. -
Extract Text from a Document using AI: извлеките необработанный текст из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Поддерживает широкий спектр языков. Использует 100 вызовов API на страницу. -
Extract Field Values from a Document using AI: извлеките значения полей (например, номер счета, дата счета, номер телефона визитной карточки и т. д.) из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу. -
Extract Field Values from a Document using Advanced AI: извлеките значения полей (например, номер счета, дата счета, номер телефона визитной карточки и т. д.) из документа с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу. -
Extract Tables of Data from a Document using AI: извлечение таблиц, состоящих из строк и столбцов данных, из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу. -
Extract Barcodes of from a Document using AI: извлеките все штрихкоды из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG, HEIC и WEBP. Использует 100 вызовов API на страницу. -
Extract All Fields and Tables of Data from a Document using AI: извлеките все поля и таблицы, состоящие из строк и столбцов данных, из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу. -
Extract Classification or Category from a Document using AI: извлечение классификации или категории (например, счета, квитанции, налоговой формы или формы 1040, формы 1040 EZ и т. д.) из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу. -
Extract Classification or Category from a Document using Advanced AI: извлечение классификации или категории (например, счета, квитанции, налоговой формы или формы 1040, формы 1040 EZ и т. д.) из документа с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу. -
Extract Summary from a Document using AI: создает сводку по 1 абзацу входного документа с помощью искусственного интеллекта. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу. -
Extract Text from a Document using AI as a Batch Job: создает асинхронное пакетное задание для обработки большого документа в виде пакетного задания ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Поддерживает широкий спектр языков. Требуется развертывание управляемого экземпляра или частного облака. -
Extract Field Values from a Document using Advanced AI as a Batch Job: создает асинхронное пакетное задание для обработки большого документа в виде пакетного задания ИИ. Извлечение значений полей (например, номер счета, дата счета, номер телефона визитной карточки и т. д.) из документа с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Требуется развертывание управляемого экземпляра или частного облака. -
Extract All Fields and Tables of Data from a Document using AI as a Batch Job: создает асинхронное пакетное задание для обработки большого документа в виде пакетного задания ИИ. Извлеките все поля и таблицы, состоящие из строк и столбцов данных, из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Требуется развертывание управляемого экземпляра или частного облака. -
Extract Classification or Category from a Document using AI as a Batch Job: создает асинхронное пакетное задание для обработки большого документа в виде пакетного задания ИИ. Извлечение классификации или категории (например, счета, квитанции, налоговой формы или формы 1040, формы 1040 EZ и т. д.) из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Требуется развертывание управляемого экземпляра или частного облака. -
Get the status and result of an Extract Document Batch Job: возвращает результат асинхронного задания — возможные состояния можно ЗАПУСТИТЬ или ЗАВЕРШИТЬ. Этот API доступен только для развертываний Cloudmersive Managed Instance и частного облака.
Создание подключения
Соединитель поддерживает следующие типы проверки подлинности:
| По умолчанию | Параметры для создания подключения. | Все регионы | Недоступен для совместного использования |
По умолчанию
Применимо: все регионы
Параметры для создания подключения.
Это недоступно для общего доступа. Если приложение power предоставляется другому пользователю, пользователю будет предложено явно создать новое подключение.
| Имя | Тип | Description | Обязательно |
|---|---|---|---|
| Apikey | securestring | Apikey для этого API | True |
Ограничения регулирования
| Имя | Вызовы | Период обновления |
|---|---|---|
| Вызовы API для каждого подключения | 100 | 60 секунд |
Действия
| Извлечение всех полей и таблиц данных из документа с помощью ИИ |
Извлеките все поля и таблицы, состоящие из строк и столбцов данных, из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу. |
| Извлечение всех полей и таблиц данных из документа с помощью ИИ в качестве пакетного задания |
Создает асинхронное пакетное задание для обработки большого документа в виде пакетного задания ИИ. Извлеките все поля и таблицы, состоящие из строк и столбцов данных, из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Требуется развертывание управляемого экземпляра или частного облака. |
| Извлечение значений полей из документа с помощью ИИ |
Извлеките значения полей (например, номер счета, дата счета, номер телефона визитной карточки и т. д.) из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу. |
| Извлечение значений полей из документа с помощью расширенного ИИ в качестве пакетного задания |
Создает асинхронное пакетное задание для обработки большого документа в виде пакетного задания ИИ. Извлечение значений полей (например, номер счета, дата счета, номер телефона визитной карточки и т. д.) из документа с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Требуется развертывание управляемого экземпляра или частного облака. |
| Извлечение значений полей из документа с помощью расширенного искусственного интеллекта |
Извлечение значений полей (например, номер счета, дата счета, номер телефона визитной карточки и т. д.) из документа с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу. |
| Извлечение классификации или категории из документа с помощью ИИ |
Извлечение классификации или категории (например, счета, квитанции, налоговой формы или формы 1040, формы 1040 EZ и т. д.) из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу. |
| Извлечение классификации или категории из документа с помощью ИИ в качестве пакетного задания |
Создает асинхронное пакетное задание для обработки большого документа в виде пакетного задания ИИ. Извлечение классификации или категории (например, счета, квитанции, налоговой формы или формы 1040, формы 1040 EZ и т. д.) из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Требуется развертывание управляемого экземпляра или частного облака. |
| Извлечение классификации или категории из документа с помощью расширенного ИИ |
Извлечение классификации или категории (например, счета, квитанции, налоговой формы или формы 1040, формы 1040 EZ и т. д.) из документа с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу. |
| Извлечение сводки из документа с помощью ИИ |
Создает сводку по 1 абзацу входного документа с помощью искусственного интеллекта. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу. |
| Извлечение таблиц данных из документа с помощью ИИ |
Извлеките таблицы, состоящие из строк и столбцов данных, из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Используется 100 вызовов API на страницу. |
| Извлечение текста из документа с помощью ИИ в качестве пакетного задания |
Создает асинхронное пакетное задание для обработки большого документа в виде пакетного задания ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Поддерживает широкий спектр языков. Требуется развертывание управляемого экземпляра или частного облака. |
| Извлечение текста из документа с помощью искусственного интеллекта |
Извлеките необработанный текст из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Поддерживает широкий спектр языков. Использует 100 вызовов API на страницу. |
| Извлечение штрихкодов из документа с помощью ИИ |
Извлеките все штрихкоды из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG, HEIC и WEBP. Использует 100 вызовов API на страницу. |
| Ответы на вопросы о документе структурированным способом с помощью расширенного искусственного интеллекта |
Ответ на логические вопросы (да/нет), несколько вариантов и бесплатных ответов о содержимом документа с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Использует 100 вызовов API на страницу. |
| Получение состояния и результата задания пакетной службы извлечения документов |
Возвращает результат асинхронного задания— возможные состояния можно ЗАПУСТИТЬ или ЗАВЕРШИТЬ. Этот API доступен только для развертываний Cloudmersive Managed Instance и частного облака. |
| Принудительное применение политик к документу, чтобы разрешить или заблокировать его с помощью расширенного искусственного интеллекта |
Принудительное применение политик к документу, чтобы разрешить или заблокировать его с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Использует 100 вызовов API на страницу. |
Извлечение всех полей и таблиц данных из документа с помощью ИИ
Извлеките все поля и таблицы, состоящие из строк и столбцов данных, из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...
|
recognitionMode | string |
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень... |
|
|
Необязательно. Задайте уровень предварительной обработки изображения для повышения точности. ...
|
preprocessing | string |
Необязательно. Задайте уровень предварительной обработки изображения для повышения точности. ... |
|
|
Входной документ или фотографии документа для извлечения данных из
|
InputFile | file |
Входной документ или фотографии документа для извлечения данных из |
Возвращаемое значение
Результат извлечения полей из документа
Извлечение всех полей и таблиц данных из документа с помощью ИИ в качестве пакетного задания
Создает асинхронное пакетное задание для обработки большого документа в виде пакетного задания ИИ. Извлеките все поля и таблицы, состоящие из строк и столбцов данных, из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Требуется развертывание управляемого экземпляра или частного облака.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...
|
recognitionMode | string |
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень... |
|
|
Входной документ или фотографии документа для извлечения данных из
|
InputFile | file |
Входной документ или фотографии документа для извлечения данных из |
Возвращаемое значение
Результат выполнения пакетного задания разбиения документа
Извлечение значений полей из документа с помощью ИИ
Извлеките значения полей (например, номер счета, дата счета, номер телефона визитной карточки и т. д.) из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
Требуемые поля для извлечения, разделенные запятыми
|
FieldNames | string |
Требуемые поля для извлечения, разделенные запятыми |
|
|
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...
|
recognitionMode | string |
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень... |
|
|
Входной документ или фотографии документа для извлечения данных из
|
InputFile | file |
Входной документ или фотографии документа для извлечения данных из |
Возвращаемое значение
Результат извлечения полей из документа
Извлечение значений полей из документа с помощью расширенного ИИ в качестве пакетного задания
Создает асинхронное пакетное задание для обработки большого документа в виде пакетного задания ИИ. Извлечение значений полей (например, номер счета, дата счета, номер телефона визитной карточки и т. д.) из документа с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Требуется развертывание управляемого экземпляра или частного облака.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...
|
recognitionMode | string |
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень... |
|
|
InputFile
|
InputFile | byte |
Входной файл документа для выполнения операции в виде массива байтов |
|
|
Имя поля
|
FieldName | string |
Имя поля для извлечения |
|
|
FieldOptional
|
FieldOptional | boolean |
Необязательный: значение true, если поле является необязательным, значение false при необходимости (по умолчанию) |
|
|
FieldDescription
|
FieldDescription | string |
Необязательно, но рекомендуется: описание поля — используйте его для описания того, что такое поле, как оно отформатировано, что уникально для него и т. д. |
|
|
FieldExample
|
FieldExample | string |
Необязательно. Пример метки или значения поля |
|
|
MaximumPagesProcessed
|
MaximumPagesProcessed | integer |
Необязательно. Ограничение количества обработанных страниц |
|
|
Preprocessing
|
Preprocessing | string |
Необязательно. Задайте уровень предварительной обработки изображения для повышения точности. Возможные значения: "Auto", "SmoothEdges", "SmoothEdgesPlus", "ContrastEdgesPlus", "ContrastEdgesPlus", "Invert", "Binarize", "Compatability" и "None". По умолчанию используется значение Auto. Установите значение SmoothEdges на гладкие жесткие края в входном изображении, чтобы повысить точность распознавания. Установите значение SmoothEdgesPlus, чтобы сгладить суровые края до более высокой степени. Установите значение "Контрастные" и "Контрастные", чтобы повысить контрастность и удобочитаемость для изображений с низким качеством черного и белого или серого уровня. Установите значение Invert, чтобы инвертировать входной образ. Установите для binarize входное изображение. Задайте значение Compatability для максимальной совместимости функций PDF. |
|
|
ResultCrossCheck
|
ResultCrossCheck | string |
Необязательно. Задайте уровень точности перекрестной проверки выходных данных для выполнения входных данных. Возможные значения: None, Advanced и Ultra. Значение по умолчанию — None. Ультра будет производить максимальную точность, но по стоимости более длительного времени обработки. |
|
|
СменаImageDegrees
|
RotateImageDegrees | double |
Необязательно. Поворот входного изображения перед распознаванием по указанному количеству градусов; Допустимые значения варьируются от -360 до +360. |
Возвращаемое значение
Результат выполнения пакетного задания разбиения документа
Извлечение значений полей из документа с помощью расширенного искусственного интеллекта
Извлечение значений полей (например, номер счета, дата счета, номер телефона визитной карточки и т. д.) из документа с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...
|
recognitionMode | string |
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень... |
|
|
InputFile
|
InputFile | byte |
Входной файл документа для выполнения операции в виде массива байтов |
|
|
Имя поля
|
FieldName | string |
Имя поля для извлечения |
|
|
FieldOptional
|
FieldOptional | boolean |
Необязательный: значение true, если поле является необязательным, значение false при необходимости (по умолчанию) |
|
|
FieldDescription
|
FieldDescription | string |
Необязательно, но рекомендуется: описание поля — используйте его для описания того, что такое поле, как оно отформатировано, что уникально для него и т. д. |
|
|
FieldExample
|
FieldExample | string |
Необязательно. Пример метки или значения поля |
|
|
MaximumPagesProcessed
|
MaximumPagesProcessed | integer |
Необязательно. Ограничение количества обработанных страниц |
|
|
Preprocessing
|
Preprocessing | string |
Необязательно. Задайте уровень предварительной обработки изображения для повышения точности. Возможные значения: "Auto", "SmoothEdges", "SmoothEdgesPlus", "ContrastEdgesPlus", "ContrastEdgesPlus", "Invert", "Binarize", "Compatability" и "None". По умолчанию используется значение Auto. Установите значение SmoothEdges на гладкие жесткие края в входном изображении, чтобы повысить точность распознавания. Установите значение SmoothEdgesPlus, чтобы сгладить суровые края до более высокой степени. Установите значение "Контрастные" и "Контрастные", чтобы повысить контрастность и удобочитаемость для изображений с низким качеством черного и белого или серого уровня. Установите значение Invert, чтобы инвертировать входной образ. Установите для binarize входное изображение. Задайте значение Compatability для максимальной совместимости функций PDF. |
|
|
ResultCrossCheck
|
ResultCrossCheck | string |
Необязательно. Задайте уровень точности перекрестной проверки выходных данных для выполнения входных данных. Возможные значения: None, Advanced и Ultra. Значение по умолчанию — None. Ультра будет производить максимальную точность, но по стоимости более длительного времени обработки. |
|
|
СменаImageDegrees
|
RotateImageDegrees | double |
Необязательно. Поворот входного изображения перед распознаванием по указанному количеству градусов; Допустимые значения варьируются от -360 до +360. |
Возвращаемое значение
Результат извлечения полей из документа
Извлечение классификации или категории из документа с помощью ИИ
Извлечение классификации или категории (например, счета, квитанции, налоговой формы или формы 1040, формы 1040 EZ и т. д.) из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
Требуемая классификация для извлечения
|
Categories | string |
Требуемая классификация для извлечения |
|
|
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...
|
recognitionMode | string |
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень... |
|
|
Входной документ или фотографии документа для извлечения данных из
|
InputFile | file |
Входной документ или фотографии документа для извлечения данных из |
Возвращаемое значение
Результат классификации документа с помощью искусственного интеллекта
Извлечение классификации или категории из документа с помощью ИИ в качестве пакетного задания
Создает асинхронное пакетное задание для обработки большого документа в виде пакетного задания ИИ. Извлечение классификации или категории (например, счета, квитанции, налоговой формы или формы 1040, формы 1040 EZ и т. д.) из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Требуется развертывание управляемого экземпляра или частного облака.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
Требуемая классификация для извлечения
|
Categories | string |
Требуемая классификация для извлечения |
|
|
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...
|
recognitionMode | string |
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень... |
|
|
Входной документ или фотографии документа для извлечения данных из
|
InputFile | file |
Входной документ или фотографии документа для извлечения данных из |
Возвращаемое значение
Результат выполнения пакетного задания разбиения документа
Извлечение классификации или категории из документа с помощью расширенного ИИ
Извлечение классификации или категории (например, счета, квитанции, налоговой формы или формы 1040, формы 1040 EZ и т. д.) из документа с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...
|
recognitionMode | string |
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень... |
|
|
InputFile
|
InputFile | byte |
Входной файл документа для выполнения операции в виде массива байтов |
|
|
ИмяКатегории
|
CategoryName | string |
Имя классификации |
|
|
CategoryDescription
|
CategoryDescription | string |
Необязательно, но рекомендуется: описание классификации в естественном навесе |
|
|
Preprocessing
|
Preprocessing | string |
Необязательно. Задайте уровень предварительной обработки изображения для повышения точности. Возможные значения: Auto, SmoothEdges, SmoothEdgesPlus, Compatability и None. По умолчанию используется значение Auto. Установите значение SmoothEdges на гладкие жесткие края в входном изображении, чтобы повысить точность распознавания. Установите значение SmoothEdgesPlus, чтобы сгладить суровые края до более высокой степени. Задайте значение Compatability для максимальной совместимости функций PDF. |
|
|
ResultCrossCheck
|
ResultCrossCheck | string |
Необязательно. Задайте уровень точности перекрестной проверки выходных данных для выполнения входных данных. Возможные значения: None, Advanced, Ultra и Hyper. Значение по умолчанию — None. Ультра и Hyper будут производить максимальную точность, но за счет длительного времени обработки. |
|
|
MaximumPagesProcessed
|
MaximumPagesProcessed | integer |
Необязательно. Ограничение количества обработанных страниц |
|
|
СменаImageDegrees
|
RotateImageDegrees | double |
Необязательно. Поворот входного изображения перед распознаванием по указанному количеству градусов; Допустимые значения варьируются от -360 до +360. |
Возвращаемое значение
Результат классификации документа с помощью искусственного интеллекта
Извлечение сводки из документа с помощью ИИ
Создает сводку по 1 абзацу входного документа с помощью искусственного интеллекта. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...
|
recognitionMode | string |
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень... |
|
|
Входной документ или фотографии документа для извлечения данных из
|
InputFile | file |
Входной документ или фотографии документа для извлечения данных из |
Возвращаемое значение
Результат сводки документа
Извлечение таблиц данных из документа с помощью ИИ
Извлеките таблицы, состоящие из строк и столбцов данных, из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Используется 100 вызовов API на страницу.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...
|
recognitionMode | string |
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень... |
|
|
Входной документ или фотографии документа для извлечения данных из
|
InputFile | file |
Входной документ или фотографии документа для извлечения данных из |
Возвращаемое значение
Результат извлечения таблиц из документа
Извлечение текста из документа с помощью ИИ в качестве пакетного задания
Создает асинхронное пакетное задание для обработки большого документа в виде пакетного задания ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Поддерживает широкий спектр языков. Требуется развертывание управляемого экземпляра или частного облака.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...
|
recognitionMode | string |
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень... |
|
|
Входной документ или фотографии документа для извлечения данных из
|
InputFile | file |
Входной документ или фотографии документа для извлечения данных из |
Возвращаемое значение
Результат выполнения пакетного задания разбиения документа
Извлечение текста из документа с помощью искусственного интеллекта
Извлеките необработанный текст из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Поддерживает широкий спектр языков. Использует 100 вызовов API на страницу.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...
|
recognitionMode | string |
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень... |
|
|
Входной документ или фотографии документа для извлечения данных из
|
InputFile | file |
Входной документ или фотографии документа для извлечения данных из |
Возвращаемое значение
Результат извлечения текста из документа
- Тело
- ExtractTextResponse
Извлечение штрихкодов из документа с помощью ИИ
Извлеките все штрихкоды из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG, HEIC и WEBP. Использует 100 вызовов API на страницу.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...
|
recognitionMode | string |
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень... |
|
|
Входной документ или фотографии документа для извлечения данных из
|
InputFile | file |
Входной документ или фотографии документа для извлечения данных из |
Возвращаемое значение
Результат извлечения штрихкодов из документа
Ответы на вопросы о документе структурированным способом с помощью расширенного искусственного интеллекта
Ответ на логические вопросы (да/нет), несколько вариантов и бесплатных ответов о содержимом документа с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Использует 100 вызовов API на страницу.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
InputFile
|
InputFile | byte |
Входной файл в виде массива байтов |
|
|
QuestionId
|
QuestionId | string |
Уникальный идентификатор вопроса, например 1 или 2A |
|
|
ВопросТекст
|
QuestionText | string |
Вопрос на естественном языке, чтобы задать документ, в котором ответ разрешает да или НЕТ, например "Подписан ли этот документ и подназначен обеими сторонами?" |
|
|
QuestionId
|
QuestionId | string |
Уникальный идентификатор вопроса, например 1 или 2A |
|
|
ВопросТекст
|
QuestionText | string |
Вопрос на естественном языке, чтобы задать документ, где ответ разрешает одно из фиксированного числа предоставленных вариантов, например "Что такое руководящий закон этого соглашения?" |
|
|
ChoiceId
|
ChoiceId | string |
Уникальный идентификатор выбора ответа, например 3C |
|
|
ChoiceText
|
ChoiceText | string |
Текст описания этого выбора, например "Delaware" |
|
|
QuestionId
|
QuestionId | string |
Уникальный идентификатор вопроса, например 7 или 5A |
|
|
ВопросТекст
|
QuestionText | string |
Вопрос на естественном языке, чтобы задать документ, в котором ответ разрешается на свободный ответ, например "Кто является коллегой в этом соглашении?" |
|
|
RecognitionMode
|
RecognitionMode | string |
Дополнительные; Режим распознавания — обычный (по умолчанию) обеспечивает максимальную точность, но медленную скорость, в то время как обычный обеспечивает более быстрый ответ, но более низкую точность для изображений низкого качества |
Возвращаемое значение
Результат выполнения операции ответа на вопрос документа
Получение состояния и результата задания пакетной службы извлечения документов
Возвращает результат асинхронного задания— возможные состояния можно ЗАПУСТИТЬ или ЗАВЕРШИТЬ. Этот API доступен только для развертываний Cloudmersive Managed Instance и частного облака.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
Идентификатор задания для пакетного задания, чтобы получить состояние
|
AsyncJobID | string |
Идентификатор задания для пакетного задания, чтобы получить состояние |
Возвращаемое значение
Результат выполнения операции пакетного задания
Принудительное применение политик к документу, чтобы разрешить или заблокировать его с помощью расширенного искусственного интеллекта
Принудительное применение политик к документу, чтобы разрешить или заблокировать его с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Использует 100 вызовов API на страницу.
Параметры
| Имя | Ключ | Обязательно | Тип | Описание |
|---|---|---|---|---|
|
InputFile
|
InputFile | byte |
Входной файл в виде массива байтов |
|
|
Идентификатор правила
|
RuleId | string | ||
|
ТипПравила
|
RuleType | string |
Возможные значения: ALLOW и DENY |
|
|
RuleDescription
|
RuleDescription | string |
Описание правила на естественном языке, например, не разрешайте документам, содержащим оскорбительный язык |
|
|
RecognitionMode
|
RecognitionMode | string |
Дополнительные; Режим распознавания — обычный (по умолчанию) обеспечивает максимальную точность, но медленную скорость, в то время как обычный обеспечивает более быстрый ответ, но более низкую точность для изображений низкого качества |
Возвращаемое значение
Результат выполнения операции принудительного применения политики документов
- Тело
- DocumentPolicyResult
Определения
DocumentAdvancedClassificationResult
Результат классификации документа с помощью искусственного интеллекта
| Имя | Путь | Тип | Описание |
|---|---|---|---|
|
Успешно выполнено
|
Successful | boolean |
Значение True, если успешно, значение false в противном случае |
|
DocumentCategoryResult
|
DocumentCategoryResult | string |
Категория, примененная к документу; Если не удалось определить категорию, будет использоваться "другой". Пробелы заменяются подчеркиваниями. |
|
Уровень доверия
|
ConfidenceScore | double |
Оценка достоверности от 0.0 до 1.0, где значения > 0,8 указывают на высокую достоверность. |
DocumentClassificationResult
Результат классификации документа с помощью искусственного интеллекта
| Имя | Путь | Тип | Описание |
|---|---|---|---|
|
Успешно выполнено
|
Successful | boolean |
Значение True, если успешно, значение false в противном случае |
|
DocumentCategoryResult
|
DocumentCategoryResult | string |
Категория, примененная к документу; Если не удалось определить категорию, будет использоваться "другой". Пробелы заменяются подчеркиваниями. |
DocumentPolicyResult
Результат выполнения операции принудительного применения политики документов
| Имя | Путь | Тип | Описание |
|---|---|---|---|
|
CleanResult
|
CleanResult | boolean |
Значение True, если документ соответствует всем политикам, и значение false, если оно не соответствует |
|
RiskScore
|
RiskScore | double |
Оценка риска от 0,0 до 1.0, где значения выше 0,5 повышают уровень риска |
|
RuleViolations
|
RuleViolations | array of PolicyRuleViolation |
Нарушения политики |
DocumentQuestionAnswerItem
Ответ на входной вопрос
| Имя | Путь | Тип | Описание |
|---|---|---|---|
|
QuestionId
|
QuestionId | string |
Идентификатор входного вопроса |
|
AnswerValue
|
AnswerValue | string |
Значение ответа ответа, отформатированный как строка, для этого вопроса. Логические вопросы возвращают ДА или НЕТ. |
|
AnswerRationale
|
AnswerRationale | string |
Обоснование, объясняющее, почему этот ответ был дан |
|
Уровень доверия
|
ConfidenceScore | double |
Оценка достоверности между 0.0 и 1.0, где значения выше 0,8 указывают на высокую достоверность |
DocumentQuestionAnswersResult
Результат выполнения операции ответа на вопрос документа
| Имя | Путь | Тип | Описание |
|---|---|---|---|
|
Успешно выполнено
|
Successful | boolean |
Значение True, если операция была выполнена успешно, или значение false в противном случае |
|
Уровень доверия
|
ConfidenceScore | double |
Оценка достоверности между 0.0 и 1.0, где значения выше 0,8 указывают на высокую достоверность |
|
AnswerResults
|
AnswerResults | array of DocumentQuestionAnswerItem |
ExtractBarcodesAiResponse
Результат извлечения штрихкодов из документа
| Имя | Путь | Тип | Описание |
|---|---|---|---|
|
Успешно выполнено
|
Successful | boolean |
Значение True, если успешно, значение false в противном случае |
|
BarcodeResults
|
BarcodeResults | array of ExtractedBarcodeItem |
Результаты табличного значения из операции извлечения |
ExtractDocumentBatchJobResult
Результат выполнения пакетного задания разбиения документа
| Имя | Путь | Тип | Описание |
|---|---|---|---|
|
Успешно выполнено
|
Successful | boolean |
Значение True, если успешно, значение false в противном случае |
|
AsyncJobID
|
AsyncJobID | string |
При создании задания возвращается идентификатор асинхронного задания. Используйте API GetAsyncJobStatus, чтобы проверить состояние этого задания с помощью AsyncJobID и получить результат после завершения. |
ExtractDocumentJobStatusResult
Результат выполнения операции пакетного задания
| Имя | Путь | Тип | Описание |
|---|---|---|---|
|
Успешно выполнено
|
Successful | boolean |
Значение True, если операция проверки состояния задания выполнена успешно, значение false в противном случае |
|
AsyncJobStatus
|
AsyncJobStatus | string |
Возвращает состояние задания Асинхронного задания, если применимо. Возможные состояния STARTED и COMPLETED |
|
AsyncJobID
|
AsyncJobID | string |
Идентификатор задания |
|
ExtractTextResult
|
ExtractTextResult | ExtractTextResponse |
Результат извлечения текста из документа |
|
ExtractFieldsAndTablesResult
|
ExtractFieldsAndTablesResult | ExtractFieldsAndTablesResponse |
Результат извлечения полей из документа |
|
ExtractFieldsResult
|
ExtractFieldsResult | ExtractFieldsResponse |
Результат извлечения полей из документа |
|
ExtractClassificationResult
|
ExtractClassificationResult | DocumentClassificationResult |
Результат классификации документа с помощью искусственного интеллекта |
|
Сообщение об ошибке
|
ErrorMessage | string |
Сообщение об ошибке (если таковое есть) |
ExtractFieldsAdvancedResponse
Результат извлечения полей из документа
| Имя | Путь | Тип | Описание |
|---|---|---|---|
|
Успешно выполнено
|
Successful | boolean |
Значение True, если успешно, значение false в противном случае |
|
Results
|
Results | array of FieldAdvancedValue |
Результаты значения поля из операции извлечения |
|
Уровень доверия
|
ConfidenceScore | double |
Оценка достоверности от 0.0 до 1.0, где значения > 0,8 указывают на высокую достоверность. |
ExtractFieldsAndTablesResponse
Результат извлечения полей из документа
| Имя | Путь | Тип | Описание |
|---|---|---|---|
|
Успешно выполнено
|
Successful | boolean |
Значение True, если успешно, значение false в противном случае |
|
FieldResults
|
FieldResults | array of FieldValue |
Результаты значения поля из операции извлечения |
|
TableResults
|
TableResults | array of TableResult |
Результаты табличного значения из операции извлечения |
ExtractFieldsResponse
Результат извлечения полей из документа
| Имя | Путь | Тип | Описание |
|---|---|---|---|
|
Успешно выполнено
|
Successful | boolean |
Значение True, если успешно, значение false в противном случае |
|
Results
|
Results | array of FieldValue |
Результаты значения поля из операции извлечения |
ExtractTablesResponse
Результат извлечения таблиц из документа
| Имя | Путь | Тип | Описание |
|---|---|---|---|
|
Успешно выполнено
|
Successful | boolean |
Значение True, если успешно, значение false в противном случае |
|
TableResults
|
TableResults | array of TableResult |
Результаты табличного значения из операции извлечения |
ExtractTextResponse
Результат извлечения текста из документа
| Имя | Путь | Тип | Описание |
|---|---|---|---|
|
Успешно выполнено
|
Successful | boolean |
Значение True, если успешно, значение false в противном случае |
|
PageResults
|
PageResults | array of ExtractedTextPage |
Результаты страницы из операции извлечения |
ExtractedBarcodeItem
Извлеченный результат штрихкода
| Имя | Путь | Тип | Описание |
|---|---|---|---|
|
BarcodeType
|
BarcodeType | string |
Тип идентифицированного штрихкода: AZTEC, CODABAR, CODE_39, CODE_93, CODE_128, DATA_MATRIX, EAN_8, EAN_13, ITF, MAXICODE, PDF_417, QR_CODE, RSS_14, RSS_EXPANDED, UPC_A, UPC_E, All_1D, UPC_EAN_EXTENSION, MSI, PLESSEY, IMB, UNKNOWN |
|
BarcodeValue
|
BarcodeValue | string |
Значение штрихкода в виде строки |
ExtractedTextPage
Извлеченная страница из входного документа
| Имя | Путь | Тип | Описание |
|---|---|---|---|
|
PageNumber
|
PageNumber | integer |
Индекс номера страницы, на основе 1 |
|
TextResult
|
TextResult | string |
Текстовое содержимое страницы |
FieldAdvancedValue
Результат извлечения полей из документа
| Имя | Путь | Тип | Описание |
|---|---|---|---|
|
Имя поля
|
FieldName | string |
Имя поля (обратите внимание, что пробелы будут заменены подчеркиванием) |
|
FieldStringValue
|
FieldStringValue | string |
Строковое значение поля, извлеченного из документа |
FieldValue
Результат извлечения полей из документа
| Имя | Путь | Тип | Описание |
|---|---|---|---|
|
Имя поля
|
FieldName | string |
Имя поля (обратите внимание, что пробелы будут заменены подчеркиванием) |
|
FieldStringValue
|
FieldStringValue | string |
Основное или первое строковое значение поля, извлеченного из документа |
|
AdditionalFieldStringValues
|
AdditionalFieldStringValues | array of string |
Дополнительные значения этого поля, если одно и то же поле присутствует с несколькими значениями, например, если два экземпляра одной формы происходят в одном документе |
PolicyRuleViolation
Экземпляры нарушения правила политики
| Имя | Путь | Тип | Описание |
|---|---|---|---|
|
Идентификатор правила
|
RuleId | string |
Идентификатор правила; Если идентификатор не указан, идентификатор — это 1-й индекс правила. |
|
RuleViolationRiskScore
|
RuleViolationRiskScore | double |
Оценка риска от 0,0 до 1.0, где значения выше 0,5 повышают уровень риска |
|
RuleViolationRationale
|
RuleViolationRationale | string |
Обоснование естественного языка ИИ для того, почему эта политика была нарушена |
СуммированиеDocumentResponse
Результат сводки документа
| Имя | Путь | Тип | Описание |
|---|---|---|---|
|
Успешно выполнено
|
Successful | boolean |
Значение True, если успешно, значение false в противном случае |
|
DocumentSummaryText
|
DocumentSummaryText | string |
Сводка документа |
TableResult
Таблица, извлеченная из документа
| Имя | Путь | Тип | Описание |
|---|---|---|---|
|
Название
|
Title | string |
Заголовок таблицы (необязательно) |
|
Rows
|
Rows | array of TableResultRow |
Строки таблицы |
TableResultCell
Ячейка строки таблицы, извлеченной из документа
| Имя | Путь | Тип | Описание |
|---|---|---|---|
|
CellHeader
|
CellHeader | string |
Заголовок столбца ячейки |
|
CellValue
|
CellValue | string |
Значение ячейки в виде строки |
TableResultRow
Строка таблицы, извлеченной из документа
| Имя | Путь | Тип | Описание |
|---|---|---|---|
|
Клетки
|
Cells | array of TableResultCell |
Ячейки в строке |