Поделиться через


ИИ документа (предварительная версия)

Извлеките структурированные данные, включая именованные поля, таблицы, штрихкоды, классификации и сводки из общих форматов документов, сканированных документов и фотографий документов с помощью ИИ. Также поддерживает рукописный ввод и низкое качество фотографий и сканирования, а также цифровые входные данные документа. Поддерживает широкий спектр языков и может анализировать и выводить семантику структуры из визуального макета документов.

Этот соединитель доступен в следующих продуктах и регионах:

Услуга Class Регионы
Copilot Studio Премия Все регионы Power Automate , кроме следующих:
     - Правительство США (GCC)
     - Правительство США (GCC High)
     — Облако Китая, управляемое 21Vianet
     - Министерство обороны США (DoD)
Логические приложения Стандарт Все регионы Logic Apps , кроме следующих:
     — Регионы Azure для государственных организаций
     — Регионы Azure Для Китая
     - Министерство обороны США (DoD)
Power Apps Премия Все регионы Power Apps , кроме следующих:
     - Правительство США (GCC)
     - Правительство США (GCC High)
     — Облако Китая, управляемое 21Vianet
     - Министерство обороны США (DoD)
Power Automate Премия Все регионы Power Automate , кроме следующих:
     - Правительство США (GCC)
     - Правительство США (GCC High)
     — Облако Китая, управляемое 21Vianet
     - Министерство обороны США (DoD)
Контакт
Имя Cloudmersive
URL https://www.cloudmersive.com
Адрес электронной почты support@cloudmersive.com
Метаданные соединителя
Publisher Cloudmersive, LLC
Веб-сайт https://www.cloudmersive.com
Политика конфиденциальности https://www.cloudmersive.com/privacy-policy
Категории Искусственный интеллект; Содержимое и файлы

Cloudmersive Document AI Connector

API ИИ Cloudmersive Document позволяет использовать ИИ следующего поколения для извлечения данных, полей, аналитических сведений и текста из документов.

Предпосылки

Для продолжения вам потребуется следующее:

  • Поддержка соединителя Microsoft Power Apps, Power Automate или Azure Logic Apps с поддержкой соединителя premium
  • Ключ API Cloudmersive

Получение учетных данных

Чтобы использовать этот соединитель, требуется учетная запись Cloudmersive. Вы можете зарегистрироваться с помощью учетной записи Майкрософт или создать учетную запись Cloudmersive. Выполните приведенные ниже действия, чтобы получить ключ API.

Получение ключа и секрета API

Здесь вы можете создать и просмотреть ключи API, перечисленные на странице "Ключи API". Просто скопируйте и вставьте этот ключ API в соединитель ИИ Cloudmersive Document.

Теперь вы можете приступить к использованию соединителя Cloudmersive CDR.

Поддерживаемые операции

Соединитель поддерживает следующие операции:

  • Enforce Policies to a Document to allow or block it using Advanced AI: принудительно применять политики к документу, чтобы разрешить или заблокировать его с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Использует 100 вызовов API на страницу.
  • Answer Questions about a Document in a structured way using Advanced AI: ответ на логический ответ (да/нет), несколько вариантов и бесплатных ответов о содержимом документа с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Использует 100 вызовов API на страницу.
  • Extract Text from a Document using AI: извлеките необработанный текст из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Поддерживает широкий спектр языков. Использует 100 вызовов API на страницу.
  • Extract Field Values from a Document using AI: извлеките значения полей (например, номер счета, дата счета, номер телефона визитной карточки и т. д.) из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.
  • Extract Field Values from a Document using Advanced AI: извлеките значения полей (например, номер счета, дата счета, номер телефона визитной карточки и т. д.) из документа с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.
  • Extract Tables of Data from a Document using AI: извлечение таблиц, состоящих из строк и столбцов данных, из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.
  • Extract Barcodes of from a Document using AI: извлеките все штрихкоды из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG, HEIC и WEBP. Использует 100 вызовов API на страницу.
  • Extract All Fields and Tables of Data from a Document using AI: извлеките все поля и таблицы, состоящие из строк и столбцов данных, из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.
  • Extract Classification or Category from a Document using AI: извлечение классификации или категории (например, счета, квитанции, налоговой формы или формы 1040, формы 1040 EZ и т. д.) из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.
  • Extract Classification or Category from a Document using Advanced AI: извлечение классификации или категории (например, счета, квитанции, налоговой формы или формы 1040, формы 1040 EZ и т. д.) из документа с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.
  • Extract Summary from a Document using AI: создает сводку по 1 абзацу входного документа с помощью искусственного интеллекта. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.
  • Extract Text from a Document using AI as a Batch Job: создает асинхронное пакетное задание для обработки большого документа в виде пакетного задания ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Поддерживает широкий спектр языков. Требуется развертывание управляемого экземпляра или частного облака.
  • Extract Field Values from a Document using Advanced AI as a Batch Job: создает асинхронное пакетное задание для обработки большого документа в виде пакетного задания ИИ. Извлечение значений полей (например, номер счета, дата счета, номер телефона визитной карточки и т. д.) из документа с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Требуется развертывание управляемого экземпляра или частного облака.
  • Extract All Fields and Tables of Data from a Document using AI as a Batch Job: создает асинхронное пакетное задание для обработки большого документа в виде пакетного задания ИИ. Извлеките все поля и таблицы, состоящие из строк и столбцов данных, из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Требуется развертывание управляемого экземпляра или частного облака.
  • Extract Classification or Category from a Document using AI as a Batch Job: создает асинхронное пакетное задание для обработки большого документа в виде пакетного задания ИИ. Извлечение классификации или категории (например, счета, квитанции, налоговой формы или формы 1040, формы 1040 EZ и т. д.) из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Требуется развертывание управляемого экземпляра или частного облака.
  • Get the status and result of an Extract Document Batch Job: возвращает результат асинхронного задания — возможные состояния можно ЗАПУСТИТЬ или ЗАВЕРШИТЬ. Этот API доступен только для развертываний Cloudmersive Managed Instance и частного облака.

Создание подключения

Соединитель поддерживает следующие типы проверки подлинности:

По умолчанию Параметры для создания подключения. Все регионы Недоступен для совместного использования

По умолчанию

Применимо: все регионы

Параметры для создания подключения.

Это недоступно для общего доступа. Если приложение power предоставляется другому пользователю, пользователю будет предложено явно создать новое подключение.

Имя Тип Description Обязательно
Apikey securestring Apikey для этого API True

Ограничения регулирования

Имя Вызовы Период обновления
Вызовы API для каждого подключения 100 60 секунд

Действия

Извлечение всех полей и таблиц данных из документа с помощью ИИ

Извлеките все поля и таблицы, состоящие из строк и столбцов данных, из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.

Извлечение всех полей и таблиц данных из документа с помощью ИИ в качестве пакетного задания

Создает асинхронное пакетное задание для обработки большого документа в виде пакетного задания ИИ. Извлеките все поля и таблицы, состоящие из строк и столбцов данных, из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Требуется развертывание управляемого экземпляра или частного облака.

Извлечение значений полей из документа с помощью ИИ

Извлеките значения полей (например, номер счета, дата счета, номер телефона визитной карточки и т. д.) из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.

Извлечение значений полей из документа с помощью расширенного ИИ в качестве пакетного задания

Создает асинхронное пакетное задание для обработки большого документа в виде пакетного задания ИИ. Извлечение значений полей (например, номер счета, дата счета, номер телефона визитной карточки и т. д.) из документа с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Требуется развертывание управляемого экземпляра или частного облака.

Извлечение значений полей из документа с помощью расширенного искусственного интеллекта

Извлечение значений полей (например, номер счета, дата счета, номер телефона визитной карточки и т. д.) из документа с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.

Извлечение классификации или категории из документа с помощью ИИ

Извлечение классификации или категории (например, счета, квитанции, налоговой формы или формы 1040, формы 1040 EZ и т. д.) из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.

Извлечение классификации или категории из документа с помощью ИИ в качестве пакетного задания

Создает асинхронное пакетное задание для обработки большого документа в виде пакетного задания ИИ. Извлечение классификации или категории (например, счета, квитанции, налоговой формы или формы 1040, формы 1040 EZ и т. д.) из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Требуется развертывание управляемого экземпляра или частного облака.

Извлечение классификации или категории из документа с помощью расширенного ИИ

Извлечение классификации или категории (например, счета, квитанции, налоговой формы или формы 1040, формы 1040 EZ и т. д.) из документа с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.

Извлечение сводки из документа с помощью ИИ

Создает сводку по 1 абзацу входного документа с помощью искусственного интеллекта. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.

Извлечение таблиц данных из документа с помощью ИИ

Извлеките таблицы, состоящие из строк и столбцов данных, из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Используется 100 вызовов API на страницу.

Извлечение текста из документа с помощью ИИ в качестве пакетного задания

Создает асинхронное пакетное задание для обработки большого документа в виде пакетного задания ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Поддерживает широкий спектр языков. Требуется развертывание управляемого экземпляра или частного облака.

Извлечение текста из документа с помощью искусственного интеллекта

Извлеките необработанный текст из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Поддерживает широкий спектр языков. Использует 100 вызовов API на страницу.

Извлечение штрихкодов из документа с помощью ИИ

Извлеките все штрихкоды из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG, HEIC и WEBP. Использует 100 вызовов API на страницу.

Ответы на вопросы о документе структурированным способом с помощью расширенного искусственного интеллекта

Ответ на логические вопросы (да/нет), несколько вариантов и бесплатных ответов о содержимом документа с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Использует 100 вызовов API на страницу.

Получение состояния и результата задания пакетной службы извлечения документов

Возвращает результат асинхронного задания— возможные состояния можно ЗАПУСТИТЬ или ЗАВЕРШИТЬ. Этот API доступен только для развертываний Cloudmersive Managed Instance и частного облака.

Принудительное применение политик к документу, чтобы разрешить или заблокировать его с помощью расширенного искусственного интеллекта

Принудительное применение политик к документу, чтобы разрешить или заблокировать его с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Использует 100 вызовов API на страницу.

Извлечение всех полей и таблиц данных из документа с помощью ИИ

Извлеките все поля и таблицы, состоящие из строк и столбцов данных, из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.

Параметры

Имя Ключ Обязательно Тип Описание
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...
recognitionMode string

Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...

Необязательно. Задайте уровень предварительной обработки изображения для повышения точности. ...
preprocessing string

Необязательно. Задайте уровень предварительной обработки изображения для повышения точности. ...

Входной документ или фотографии документа для извлечения данных из
InputFile file

Входной документ или фотографии документа для извлечения данных из

Возвращаемое значение

Результат извлечения полей из документа

Извлечение всех полей и таблиц данных из документа с помощью ИИ в качестве пакетного задания

Создает асинхронное пакетное задание для обработки большого документа в виде пакетного задания ИИ. Извлеките все поля и таблицы, состоящие из строк и столбцов данных, из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Требуется развертывание управляемого экземпляра или частного облака.

Параметры

Имя Ключ Обязательно Тип Описание
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...
recognitionMode string

Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...

Входной документ или фотографии документа для извлечения данных из
InputFile file

Входной документ или фотографии документа для извлечения данных из

Возвращаемое значение

Результат выполнения пакетного задания разбиения документа

Извлечение значений полей из документа с помощью ИИ

Извлеките значения полей (например, номер счета, дата счета, номер телефона визитной карточки и т. д.) из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.

Параметры

Имя Ключ Обязательно Тип Описание
Требуемые поля для извлечения, разделенные запятыми
FieldNames string

Требуемые поля для извлечения, разделенные запятыми

Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...
recognitionMode string

Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...

Входной документ или фотографии документа для извлечения данных из
InputFile file

Входной документ или фотографии документа для извлечения данных из

Возвращаемое значение

Результат извлечения полей из документа

Извлечение значений полей из документа с помощью расширенного ИИ в качестве пакетного задания

Создает асинхронное пакетное задание для обработки большого документа в виде пакетного задания ИИ. Извлечение значений полей (например, номер счета, дата счета, номер телефона визитной карточки и т. д.) из документа с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Требуется развертывание управляемого экземпляра или частного облака.

Параметры

Имя Ключ Обязательно Тип Описание
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...
recognitionMode string

Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...

InputFile
InputFile byte

Входной файл документа для выполнения операции в виде массива байтов

Имя поля
FieldName string

Имя поля для извлечения

FieldOptional
FieldOptional boolean

Необязательный: значение true, если поле является необязательным, значение false при необходимости (по умолчанию)

FieldDescription
FieldDescription string

Необязательно, но рекомендуется: описание поля — используйте его для описания того, что такое поле, как оно отформатировано, что уникально для него и т. д.

FieldExample
FieldExample string

Необязательно. Пример метки или значения поля

MaximumPagesProcessed
MaximumPagesProcessed integer

Необязательно. Ограничение количества обработанных страниц

Preprocessing
Preprocessing string

Необязательно. Задайте уровень предварительной обработки изображения для повышения точности. Возможные значения: "Auto", "SmoothEdges", "SmoothEdgesPlus", "ContrastEdgesPlus", "ContrastEdgesPlus", "Invert", "Binarize", "Compatability" и "None". По умолчанию используется значение Auto. Установите значение SmoothEdges на гладкие жесткие края в входном изображении, чтобы повысить точность распознавания. Установите значение SmoothEdgesPlus, чтобы сгладить суровые края до более высокой степени. Установите значение "Контрастные" и "Контрастные", чтобы повысить контрастность и удобочитаемость для изображений с низким качеством черного и белого или серого уровня. Установите значение Invert, чтобы инвертировать входной образ. Установите для binarize входное изображение. Задайте значение Compatability для максимальной совместимости функций PDF.

ResultCrossCheck
ResultCrossCheck string

Необязательно. Задайте уровень точности перекрестной проверки выходных данных для выполнения входных данных. Возможные значения: None, Advanced и Ultra. Значение по умолчанию — None. Ультра будет производить максимальную точность, но по стоимости более длительного времени обработки.

СменаImageDegrees
RotateImageDegrees double

Необязательно. Поворот входного изображения перед распознаванием по указанному количеству градусов; Допустимые значения варьируются от -360 до +360.

Возвращаемое значение

Результат выполнения пакетного задания разбиения документа

Извлечение значений полей из документа с помощью расширенного искусственного интеллекта

Извлечение значений полей (например, номер счета, дата счета, номер телефона визитной карточки и т. д.) из документа с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.

Параметры

Имя Ключ Обязательно Тип Описание
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...
recognitionMode string

Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...

InputFile
InputFile byte

Входной файл документа для выполнения операции в виде массива байтов

Имя поля
FieldName string

Имя поля для извлечения

FieldOptional
FieldOptional boolean

Необязательный: значение true, если поле является необязательным, значение false при необходимости (по умолчанию)

FieldDescription
FieldDescription string

Необязательно, но рекомендуется: описание поля — используйте его для описания того, что такое поле, как оно отформатировано, что уникально для него и т. д.

FieldExample
FieldExample string

Необязательно. Пример метки или значения поля

MaximumPagesProcessed
MaximumPagesProcessed integer

Необязательно. Ограничение количества обработанных страниц

Preprocessing
Preprocessing string

Необязательно. Задайте уровень предварительной обработки изображения для повышения точности. Возможные значения: "Auto", "SmoothEdges", "SmoothEdgesPlus", "ContrastEdgesPlus", "ContrastEdgesPlus", "Invert", "Binarize", "Compatability" и "None". По умолчанию используется значение Auto. Установите значение SmoothEdges на гладкие жесткие края в входном изображении, чтобы повысить точность распознавания. Установите значение SmoothEdgesPlus, чтобы сгладить суровые края до более высокой степени. Установите значение "Контрастные" и "Контрастные", чтобы повысить контрастность и удобочитаемость для изображений с низким качеством черного и белого или серого уровня. Установите значение Invert, чтобы инвертировать входной образ. Установите для binarize входное изображение. Задайте значение Compatability для максимальной совместимости функций PDF.

ResultCrossCheck
ResultCrossCheck string

Необязательно. Задайте уровень точности перекрестной проверки выходных данных для выполнения входных данных. Возможные значения: None, Advanced и Ultra. Значение по умолчанию — None. Ультра будет производить максимальную точность, но по стоимости более длительного времени обработки.

СменаImageDegrees
RotateImageDegrees double

Необязательно. Поворот входного изображения перед распознаванием по указанному количеству градусов; Допустимые значения варьируются от -360 до +360.

Возвращаемое значение

Результат извлечения полей из документа

Извлечение классификации или категории из документа с помощью ИИ

Извлечение классификации или категории (например, счета, квитанции, налоговой формы или формы 1040, формы 1040 EZ и т. д.) из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.

Параметры

Имя Ключ Обязательно Тип Описание
Требуемая классификация для извлечения
Categories string

Требуемая классификация для извлечения

Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...
recognitionMode string

Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...

Входной документ или фотографии документа для извлечения данных из
InputFile file

Входной документ или фотографии документа для извлечения данных из

Возвращаемое значение

Результат классификации документа с помощью искусственного интеллекта

Извлечение классификации или категории из документа с помощью ИИ в качестве пакетного задания

Создает асинхронное пакетное задание для обработки большого документа в виде пакетного задания ИИ. Извлечение классификации или категории (например, счета, квитанции, налоговой формы или формы 1040, формы 1040 EZ и т. д.) из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Требуется развертывание управляемого экземпляра или частного облака.

Параметры

Имя Ключ Обязательно Тип Описание
Требуемая классификация для извлечения
Categories string

Требуемая классификация для извлечения

Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...
recognitionMode string

Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...

Входной документ или фотографии документа для извлечения данных из
InputFile file

Входной документ или фотографии документа для извлечения данных из

Возвращаемое значение

Результат выполнения пакетного задания разбиения документа

Извлечение классификации или категории из документа с помощью расширенного ИИ

Извлечение классификации или категории (например, счета, квитанции, налоговой формы или формы 1040, формы 1040 EZ и т. д.) из документа с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.

Параметры

Имя Ключ Обязательно Тип Описание
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...
recognitionMode string

Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...

InputFile
InputFile byte

Входной файл документа для выполнения операции в виде массива байтов

ИмяКатегории
CategoryName string

Имя классификации

CategoryDescription
CategoryDescription string

Необязательно, но рекомендуется: описание классификации в естественном навесе

Preprocessing
Preprocessing string

Необязательно. Задайте уровень предварительной обработки изображения для повышения точности. Возможные значения: Auto, SmoothEdges, SmoothEdgesPlus, Compatability и None. По умолчанию используется значение Auto. Установите значение SmoothEdges на гладкие жесткие края в входном изображении, чтобы повысить точность распознавания. Установите значение SmoothEdgesPlus, чтобы сгладить суровые края до более высокой степени. Задайте значение Compatability для максимальной совместимости функций PDF.

ResultCrossCheck
ResultCrossCheck string

Необязательно. Задайте уровень точности перекрестной проверки выходных данных для выполнения входных данных. Возможные значения: None, Advanced, Ultra и Hyper. Значение по умолчанию — None. Ультра и Hyper будут производить максимальную точность, но за счет длительного времени обработки.

MaximumPagesProcessed
MaximumPagesProcessed integer

Необязательно. Ограничение количества обработанных страниц

СменаImageDegrees
RotateImageDegrees double

Необязательно. Поворот входного изображения перед распознаванием по указанному количеству градусов; Допустимые значения варьируются от -360 до +360.

Возвращаемое значение

Результат классификации документа с помощью искусственного интеллекта

Извлечение сводки из документа с помощью ИИ

Создает сводку по 1 абзацу входного документа с помощью искусственного интеллекта. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Использует 100 вызовов API на страницу.

Параметры

Имя Ключ Обязательно Тип Описание
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...
recognitionMode string

Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...

Входной документ или фотографии документа для извлечения данных из
InputFile file

Входной документ или фотографии документа для извлечения данных из

Возвращаемое значение

Результат сводки документа

Извлечение таблиц данных из документа с помощью ИИ

Извлеките таблицы, состоящие из строк и столбцов данных, из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Используется 100 вызовов API на страницу.

Параметры

Имя Ключ Обязательно Тип Описание
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...
recognitionMode string

Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...

Входной документ или фотографии документа для извлечения данных из
InputFile file

Входной документ или фотографии документа для извлечения данных из

Возвращаемое значение

Результат извлечения таблиц из документа

Извлечение текста из документа с помощью ИИ в качестве пакетного задания

Создает асинхронное пакетное задание для обработки большого документа в виде пакетного задания ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Поддерживает широкий спектр языков. Требуется развертывание управляемого экземпляра или частного облака.

Параметры

Имя Ключ Обязательно Тип Описание
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...
recognitionMode string

Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...

Входной документ или фотографии документа для извлечения данных из
InputFile file

Входной документ или фотографии документа для извлечения данных из

Возвращаемое значение

Результат выполнения пакетного задания разбиения документа

Извлечение текста из документа с помощью искусственного интеллекта

Извлеките необработанный текст из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG и WEBP. Поддерживает широкий спектр языков. Использует 100 вызовов API на страницу.

Параметры

Имя Ключ Обязательно Тип Описание
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...
recognitionMode string

Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...

Входной документ или фотографии документа для извлечения данных из
InputFile file

Входной документ или фотографии документа для извлечения данных из

Возвращаемое значение

Результат извлечения текста из документа

Извлечение штрихкодов из документа с помощью ИИ

Извлеките все штрихкоды из документа с помощью ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, XLSX, PPTX, EML, MSG, JPG, PNG, HEIC и WEBP. Использует 100 вызовов API на страницу.

Параметры

Имя Ключ Обязательно Тип Описание
Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...
recognitionMode string

Дополнительные; Режим распознавания — расширенный (по умолчанию) обеспечивает наивысший уровень...

Входной документ или фотографии документа для извлечения данных из
InputFile file

Входной документ или фотографии документа для извлечения данных из

Возвращаемое значение

Результат извлечения штрихкодов из документа

Ответы на вопросы о документе структурированным способом с помощью расширенного искусственного интеллекта

Ответ на логические вопросы (да/нет), несколько вариантов и бесплатных ответов о содержимом документа с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Использует 100 вызовов API на страницу.

Параметры

Имя Ключ Обязательно Тип Описание
InputFile
InputFile byte

Входной файл в виде массива байтов

QuestionId
QuestionId string

Уникальный идентификатор вопроса, например 1 или 2A

ВопросТекст
QuestionText string

Вопрос на естественном языке, чтобы задать документ, в котором ответ разрешает да или НЕТ, например "Подписан ли этот документ и подназначен обеими сторонами?"

QuestionId
QuestionId string

Уникальный идентификатор вопроса, например 1 или 2A

ВопросТекст
QuestionText string

Вопрос на естественном языке, чтобы задать документ, где ответ разрешает одно из фиксированного числа предоставленных вариантов, например "Что такое руководящий закон этого соглашения?"

ChoiceId
ChoiceId string

Уникальный идентификатор выбора ответа, например 3C

ChoiceText
ChoiceText string

Текст описания этого выбора, например "Delaware"

QuestionId
QuestionId string

Уникальный идентификатор вопроса, например 7 или 5A

ВопросТекст
QuestionText string

Вопрос на естественном языке, чтобы задать документ, в котором ответ разрешается на свободный ответ, например "Кто является коллегой в этом соглашении?"

RecognitionMode
RecognitionMode string

Дополнительные; Режим распознавания — обычный (по умолчанию) обеспечивает максимальную точность, но медленную скорость, в то время как обычный обеспечивает более быстрый ответ, но более низкую точность для изображений низкого качества

Возвращаемое значение

Результат выполнения операции ответа на вопрос документа

Получение состояния и результата задания пакетной службы извлечения документов

Возвращает результат асинхронного задания— возможные состояния можно ЗАПУСТИТЬ или ЗАВЕРШИТЬ. Этот API доступен только для развертываний Cloudmersive Managed Instance и частного облака.

Параметры

Имя Ключ Обязательно Тип Описание
Идентификатор задания для пакетного задания, чтобы получить состояние
AsyncJobID string

Идентификатор задания для пакетного задания, чтобы получить состояние

Возвращаемое значение

Результат выполнения операции пакетного задания

Принудительное применение политик к документу, чтобы разрешить или заблокировать его с помощью расширенного искусственного интеллекта

Принудительное применение политик к документу, чтобы разрешить или заблокировать его с помощью расширенного ИИ. Поддерживаемые форматы входных документов включают DOCX, PDF, PNG и JPG. Использует 100 вызовов API на страницу.

Параметры

Имя Ключ Обязательно Тип Описание
InputFile
InputFile byte

Входной файл в виде массива байтов

Идентификатор правила
RuleId string
ТипПравила
RuleType string

Возможные значения: ALLOW и DENY

RuleDescription
RuleDescription string

Описание правила на естественном языке, например, не разрешайте документам, содержащим оскорбительный язык

RecognitionMode
RecognitionMode string

Дополнительные; Режим распознавания — обычный (по умолчанию) обеспечивает максимальную точность, но медленную скорость, в то время как обычный обеспечивает более быстрый ответ, но более низкую точность для изображений низкого качества

Возвращаемое значение

Результат выполнения операции принудительного применения политики документов

Определения

DocumentAdvancedClassificationResult

Результат классификации документа с помощью искусственного интеллекта

Имя Путь Тип Описание
Успешно выполнено
Successful boolean

Значение True, если успешно, значение false в противном случае

DocumentCategoryResult
DocumentCategoryResult string

Категория, примененная к документу; Если не удалось определить категорию, будет использоваться "другой". Пробелы заменяются подчеркиваниями.

Уровень доверия
ConfidenceScore double

Оценка достоверности от 0.0 до 1.0, где значения > 0,8 указывают на высокую достоверность.

DocumentClassificationResult

Результат классификации документа с помощью искусственного интеллекта

Имя Путь Тип Описание
Успешно выполнено
Successful boolean

Значение True, если успешно, значение false в противном случае

DocumentCategoryResult
DocumentCategoryResult string

Категория, примененная к документу; Если не удалось определить категорию, будет использоваться "другой". Пробелы заменяются подчеркиваниями.

DocumentPolicyResult

Результат выполнения операции принудительного применения политики документов

Имя Путь Тип Описание
CleanResult
CleanResult boolean

Значение True, если документ соответствует всем политикам, и значение false, если оно не соответствует

RiskScore
RiskScore double

Оценка риска от 0,0 до 1.0, где значения выше 0,5 повышают уровень риска

RuleViolations
RuleViolations array of PolicyRuleViolation

Нарушения политики

DocumentQuestionAnswerItem

Ответ на входной вопрос

Имя Путь Тип Описание
QuestionId
QuestionId string

Идентификатор входного вопроса

AnswerValue
AnswerValue string

Значение ответа ответа, отформатированный как строка, для этого вопроса. Логические вопросы возвращают ДА или НЕТ.

AnswerRationale
AnswerRationale string

Обоснование, объясняющее, почему этот ответ был дан

Уровень доверия
ConfidenceScore double

Оценка достоверности между 0.0 и 1.0, где значения выше 0,8 указывают на высокую достоверность

DocumentQuestionAnswersResult

Результат выполнения операции ответа на вопрос документа

Имя Путь Тип Описание
Успешно выполнено
Successful boolean

Значение True, если операция была выполнена успешно, или значение false в противном случае

Уровень доверия
ConfidenceScore double

Оценка достоверности между 0.0 и 1.0, где значения выше 0,8 указывают на высокую достоверность

AnswerResults
AnswerResults array of DocumentQuestionAnswerItem

ExtractBarcodesAiResponse

Результат извлечения штрихкодов из документа

Имя Путь Тип Описание
Успешно выполнено
Successful boolean

Значение True, если успешно, значение false в противном случае

BarcodeResults
BarcodeResults array of ExtractedBarcodeItem

Результаты табличного значения из операции извлечения

ExtractDocumentBatchJobResult

Результат выполнения пакетного задания разбиения документа

Имя Путь Тип Описание
Успешно выполнено
Successful boolean

Значение True, если успешно, значение false в противном случае

AsyncJobID
AsyncJobID string

При создании задания возвращается идентификатор асинхронного задания. Используйте API GetAsyncJobStatus, чтобы проверить состояние этого задания с помощью AsyncJobID и получить результат после завершения.

ExtractDocumentJobStatusResult

Результат выполнения операции пакетного задания

Имя Путь Тип Описание
Успешно выполнено
Successful boolean

Значение True, если операция проверки состояния задания выполнена успешно, значение false в противном случае

AsyncJobStatus
AsyncJobStatus string

Возвращает состояние задания Асинхронного задания, если применимо. Возможные состояния STARTED и COMPLETED

AsyncJobID
AsyncJobID string

Идентификатор задания

ExtractTextResult
ExtractTextResult ExtractTextResponse

Результат извлечения текста из документа

ExtractFieldsAndTablesResult
ExtractFieldsAndTablesResult ExtractFieldsAndTablesResponse

Результат извлечения полей из документа

ExtractFieldsResult
ExtractFieldsResult ExtractFieldsResponse

Результат извлечения полей из документа

ExtractClassificationResult
ExtractClassificationResult DocumentClassificationResult

Результат классификации документа с помощью искусственного интеллекта

Сообщение об ошибке
ErrorMessage string

Сообщение об ошибке (если таковое есть)

ExtractFieldsAdvancedResponse

Результат извлечения полей из документа

Имя Путь Тип Описание
Успешно выполнено
Successful boolean

Значение True, если успешно, значение false в противном случае

Results
Results array of FieldAdvancedValue

Результаты значения поля из операции извлечения

Уровень доверия
ConfidenceScore double

Оценка достоверности от 0.0 до 1.0, где значения > 0,8 указывают на высокую достоверность.

ExtractFieldsAndTablesResponse

Результат извлечения полей из документа

Имя Путь Тип Описание
Успешно выполнено
Successful boolean

Значение True, если успешно, значение false в противном случае

FieldResults
FieldResults array of FieldValue

Результаты значения поля из операции извлечения

TableResults
TableResults array of TableResult

Результаты табличного значения из операции извлечения

ExtractFieldsResponse

Результат извлечения полей из документа

Имя Путь Тип Описание
Успешно выполнено
Successful boolean

Значение True, если успешно, значение false в противном случае

Results
Results array of FieldValue

Результаты значения поля из операции извлечения

ExtractTablesResponse

Результат извлечения таблиц из документа

Имя Путь Тип Описание
Успешно выполнено
Successful boolean

Значение True, если успешно, значение false в противном случае

TableResults
TableResults array of TableResult

Результаты табличного значения из операции извлечения

ExtractTextResponse

Результат извлечения текста из документа

Имя Путь Тип Описание
Успешно выполнено
Successful boolean

Значение True, если успешно, значение false в противном случае

PageResults
PageResults array of ExtractedTextPage

Результаты страницы из операции извлечения

ExtractedBarcodeItem

Извлеченный результат штрихкода

Имя Путь Тип Описание
BarcodeType
BarcodeType string

Тип идентифицированного штрихкода: AZTEC, CODABAR, CODE_39, CODE_93, CODE_128, DATA_MATRIX, EAN_8, EAN_13, ITF, MAXICODE, PDF_417, QR_CODE, RSS_14, RSS_EXPANDED, UPC_A, UPC_E, All_1D, UPC_EAN_EXTENSION, MSI, PLESSEY, IMB, UNKNOWN

BarcodeValue
BarcodeValue string

Значение штрихкода в виде строки

ExtractedTextPage

Извлеченная страница из входного документа

Имя Путь Тип Описание
PageNumber
PageNumber integer

Индекс номера страницы, на основе 1

TextResult
TextResult string

Текстовое содержимое страницы

FieldAdvancedValue

Результат извлечения полей из документа

Имя Путь Тип Описание
Имя поля
FieldName string

Имя поля (обратите внимание, что пробелы будут заменены подчеркиванием)

FieldStringValue
FieldStringValue string

Строковое значение поля, извлеченного из документа

FieldValue

Результат извлечения полей из документа

Имя Путь Тип Описание
Имя поля
FieldName string

Имя поля (обратите внимание, что пробелы будут заменены подчеркиванием)

FieldStringValue
FieldStringValue string

Основное или первое строковое значение поля, извлеченного из документа

AdditionalFieldStringValues
AdditionalFieldStringValues array of string

Дополнительные значения этого поля, если одно и то же поле присутствует с несколькими значениями, например, если два экземпляра одной формы происходят в одном документе

PolicyRuleViolation

Экземпляры нарушения правила политики

Имя Путь Тип Описание
Идентификатор правила
RuleId string

Идентификатор правила; Если идентификатор не указан, идентификатор — это 1-й индекс правила.

RuleViolationRiskScore
RuleViolationRiskScore double

Оценка риска от 0,0 до 1.0, где значения выше 0,5 повышают уровень риска

RuleViolationRationale
RuleViolationRationale string

Обоснование естественного языка ИИ для того, почему эта политика была нарушена

СуммированиеDocumentResponse

Результат сводки документа

Имя Путь Тип Описание
Успешно выполнено
Successful boolean

Значение True, если успешно, значение false в противном случае

DocumentSummaryText
DocumentSummaryText string

Сводка документа

TableResult

Таблица, извлеченная из документа

Имя Путь Тип Описание
Название
Title string

Заголовок таблицы (необязательно)

Rows
Rows array of TableResultRow

Строки таблицы

TableResultCell

Ячейка строки таблицы, извлеченной из документа

Имя Путь Тип Описание
CellHeader
CellHeader string

Заголовок столбца ячейки

CellValue
CellValue string

Значение ячейки в виде строки

TableResultRow

Строка таблицы, извлеченной из документа

Имя Путь Тип Описание
Клетки
Cells array of TableResultCell

Ячейки в строке