Поделиться через


Что такое Аналитика документов Azure ИИ?

Внимание

  • Выпуски общедоступной предварительной версии Document Intelligence предоставляют ранний доступ к функциям, которые находятся в активной разработке. Функции, подходы и процессы могут изменяться до общедоступной доступности на основе отзывов пользователей.
  • Общедоступная предварительная версия клиентских библиотек Аналитики документов по умолчанию использует REST API версии 2024-07-31-preview.
  • Общедоступная предварительная версия 2024-07-31-preview в настоящее время доступна только в следующих регионах Azure. Обратите внимание, что пользовательская модель создания (извлечение полей документов) в AI Studio доступна только в регионе "Северная часть США":
    • Восточная часть США
    • Западная часть США2
    • Западная Европа
    • Северная часть США

Это содержимое относится к: версии 4.0 (предварительная версия) | Предыдущие версии: флажоксиняя галочка версия 3.1 (GA) версии 3.0 (GA) синяя галочка версии 2.1 (GA) синяя галочка

Это содержимое относится к: версия 3.1 (GA) | Последняя версия: фиолетовый флажокфлажок версия 4.0 (предварительная версия) | Предыдущие версии: синяя галочка версии 3.0синяя галочка версии 2.1

Это содержимое относится к: версия 3.0 (GA) | Последние версии: флажок фиолетовый флажок v4.0 (предварительная версия) фиолетовый флажок версии 3.1 | Предыдущая версия: синяя галочка версия 2.1

Это содержимое относится к: версия 2.1 Последняя версия: флажоксиняя галочка версия 4.0 (предварительная версия) |

Примечание.

Распознаватель документов сейчас Аналитика документов ИИ Azure!

  • По состоянию на июль 2023 года службы искусственного интеллекта Azure охватывают все ранее известные как Cognitive Services и приложение Azure лиированные службы искусственного интеллекта.
  • Нет изменений в ценах.
  • Имена Cognitive Services и приложение Azure lied AI продолжают использоваться в выставлении счетов Azure, анализе затрат, прайс-листе и API цен.
  • Критические изменения в интерфейсах программирования приложений (API) или пакетах SDK до версии 3.1 отсутствуют. Начиная с версии 4.0 API и пакеты SDK обновляются до аналитики документов.
  • Некоторые платформы по-прежнему ожидают переименования обновления. Все упоминания о Распознаватель документов или аналитике документов в нашей документации относятся к одной службе Azure.

Azure AI Document Intelligence — это облачная служба ИИ Azure, которая позволяет создавать интеллектуальные решения для обработки документов. Большие объемы данных, охватывающие широкий спектр типов данных, хранятся в формах и документах. Аналитика документов позволяет эффективно управлять скоростью сбора и обработки данных и является ключевым фактором для улучшения операций, принятия обоснованных решений на основе данных и просвещенных инноваций.

| ✔️ Модели анализа документов | ✔️ Предварительно созданные модели | ✔️ Пользовательские модели |

Общие модели извлечения

Общие модели извлечения позволяют извлекать текст из форм и документов и возвращать структурированное содержимое, готовое для бизнеса, готовое для действий, использования или разработки вашей организации.

Чтение | Извлеките печатный и рукописный текст.

Макет | Извлечение текста, таблиц и структуры документов.

Чтение | Извлеките печатный и рукописный
текст.

Макет | Извлечение текста, таблиц
и структуры документов.

Общий документ | Извлечение пар "текст",
"структура" и "ключ-значение".

Предварительно созданные модели

Предварительно созданные модели позволяют добавлять интеллектуальную обработку документов в приложения и потоки без необходимости обучать и создавать собственные модели.

Банковский оператор | Извлеките сведения о счете и сведения из банковских инструкций.

Проверка | Извлеките соответствующие сведения из проверок.

Контракт | Извлечение соглашений и сведений о стороне.

Кредитная карта | Извлеките сведения о платной карте.

Счет | Извлеките сведения о клиенте и поставщике.

Оплата заглушки | Извлечение сведений о заглушки оплаты.

Получение | Извлеките сведения о транзакции продаж.

Налог США

Унифицированный налог США | Извлечение из любых поддерживаемых налоговых форм США.

Налог США W-2 | Извлечение сведений о компенсации с налогом.

Налог США 1098 | Извлечение 1098 сведений о вариантах.

Налог США 1099 | Извлечение 1099 сведений о вариантах.

Налог США 1040 | Извлечение 1040 сведений о вариантах.

Ипотека США

Ипотека США 1003 | Извлечение сведений о приложении кредита.

Ипотека США 1004 | Извлечение информации из оценки.

Ипотека США 1005 | Извлеките сведения из проверки занятости.

Ипотека США 1008 | Извлечение сведений о передаче кредита.

Раскрытие ипотеки США | Извлеките окончательные условия закрытия кредита.

Личная идентификация

Карточка медицинского страхования | Извлеките сведения о страховании.

Удостоверение | Извлеките сведения о проверке.

Свидетельство о браке | Извлеките сертифицированные сведения о браке.

Счет | Извлеките сведения о клиенте
и поставщике.

Получение | Извлеките сведения о транзакции продаж
.

Удостоверение | Извлечение сведений об идентификации
и проверке.

Карточка медицинского страхования | Извлеките сведения о медицинском страховании.

Визитная карточка | Извлечение сведений о бизнес-контакте.

Контракт | Извлечение соглашений
и сведений о стороне.

Налог США W-2 | Извлечение сведений о компенсации с налогом
.

Налог США 1098 | Извлечение 1098 сведений о вариантах.

Пользовательские модели

Пользовательские модели обучены с помощью помеченных наборов данных для извлечения отдельных данных из форм и документов, относящихся к вашим вариантам использования. Изолированные настраиваемые модели можно объединять для создания составных моделей.

Модели извлечения полей документа

✔️ Модели извлечения полей документов обучены извлекать помеченные поля из документов.

Пользовательский генерированный | Создайте пользовательскую модель извлечения с помощью генерированного ИИ для документов с неструктурированным форматом и различными шаблонами.

Настраиваемый нейрон | Извлеките данные из документов смешанного типа.

Пользовательский шаблон | Извлеките данные из статических макетов.

Пользовательский состав | Извлечение данных с помощью коллекции моделей.

Пользовательские модели классификации

✔️ Пользовательские классификаторы определяют типы документов перед вызовом модели извлечения.

Настраиваемый классификатор | Определите назначенные типы документов (классы) перед вызовом модели извлечения.

Возможности надстройки

Аналитика документов поддерживает дополнительные функции, которые можно включить и отключить в зависимости от сценария извлечения документов. Для и более поздних выпусков доступны 2023-07-31 (GA) следующие возможности надстройки:

В выпуске2024-07-31-preview представлена read поддержка моделей для выходных данных PDF, доступных для поиска:

Аналитика документов поддерживает дополнительные функции, которые можно включить и отключить в зависимости от сценария извлечения документов. Для и более поздних выпусков доступны 2023-10-31-previewследующие возможности надстройки:

Функции анализа

Model ID Извлечение содержимого Поля запроса Абзацы Роли абзаца Метки выделения Таблицы Пары "Ключ-значение" Языки Штрихкоды Анализ документов Формулы* Шрифт стиля* Высокое разрешение* Pdf-файл, доступный для поиска
prebuilt-read O O O O O
prebuilt-layout O O O O O
prebuilt-document O O O O O
prebuilt-businessCard
предварительно созданный контракт O O O O
prebuilt-healthInsuranceCard.us O O O O O
prebuilt-idDocument O O O O O
prebuilt-invoice O O O O O O
prebuilt-receipt O O O O O
prebuilt-marriageCertificate.us O O O O O
предварительно созданная кредитная карта O O O O O
prebuilt-check.us O O O O O
prebuilt-payStub.us O O O O O
prebuilt-bankStatement O O O O O
prebuilt-mortgage.us.1003 O O O O O
prebuilt-mortgage.us.1004 O O O O O
prebuilt-mortgage.us.1005 O O O O O
prebuilt-mortgage.us.1008 O O O O O
prebuilt-mortgage.us.closingDisclosure O O O O O
prebuilt-tax.us O O O O O
prebuilt-tax.us.w2 O O O O O
prebuilt-tax.us.1098 O O O O O
prebuilt-tax.us.1098E O O O O O
prebuilt-tax.us.1098T O O O O O
prebuilt-tax.us.1099(варианты) O O O O O
prebuilt-tax.us.1040(варианты) O O O O O
{ customModelName } O O O O O

✓ - Включен O - Необязательный

* - Премиум функции влечет за собой дополнительные расходы

Модели и варианты разработки

Примечание.

Следующие модели и варианты разработки документов поддерживаются службой аналитики документов версии 3.0.

Вы можете использовать аналитику документов для автоматизации обработки документов в приложениях и рабочих процессах, улучшения стратегий на основе данных и обогащения возможностей поиска документов. Используйте ссылки в таблице, чтобы узнать больше о каждой модели и просмотреть параметры разработки.

Читать

Снимок экрана: анализ модели чтения с помощью Document Intelligence Studio.

Model ID Description Варианты использования автоматизации Варианты разработки
prebuilt-read • Извлечение текста из документов.
Извлечение данных
• Оцифровка любого документа.
• Соответствие требованиям и аудит.
• Обработка рукописных заметок перед переводом.
Document Intelligence Studio
● REST API

● SDK для C#
● Пакет SDK

для Python ● Пакет SDK
для Java для JavaScript

Макет

Снимок экрана: анализ модели макета с помощью Document Intelligence Studio.

Model ID Description Варианты использования автоматизации Варианты разработки
prebuilt-layout ● Извлечение текста и сведений о макете из документов.
Извлечение данных
• Индексирование документов и извлечение по структуре.
• Анализ финансовых и медицинских отчетов.
Document Intelligence Studio
● REST API

● SDK для C#
● Пакет SDK

для Python ● Пакет SDK
для Java для JavaScript

Общий документ (устаревший в 2023-10-31-preview)

Снимок экрана: анализ модели общего документа с помощью Document Intelligence Studio.

Model ID Description Варианты использования автоматизации Варианты разработки
предварительно созданный документ • Извлеките пары "текст", "макет" и " ключ-значение" из документов.
Извлечение данных и полей
● Извлечение пары "ключ-значение".
• Обработка форм.
• Сбор и анализ данных опроса.
REST API Аналитики
документов

Счет

Снимок экрана: анализ модели счета с помощью Document Intelligence Studio.

Model ID Description Варианты использования автоматизации Варианты разработки
prebuilt-invoice • Извлечение ключевых сведений из счетов.
Извлечение данных и полей
• Обработка с оплатой счетов.
● Автоматическая запись налогов и отчетность.
Document Intelligence Studio
● REST API

● SDK для C#
● Пакет SDK

для Python ● Пакет SDK
для Java для JavaScript

Получение

Снимок экрана: анализ модели квитанций с помощью Document Intelligence Studio.

Model ID Description Варианты использования автоматизации Варианты разработки
prebuilt-receipt • Извлечение ключевых сведений из квитанций.
Извлечение
данных и полей— модель квитанций версии 3.0 поддерживает обработку квитанций об одностраничных отелях.
• Управление расходами.
• Анализ данных поведения потребителей.
• Программа лояльности клиентов.
• Обработка возвращаемых товаров.
● Автоматическая запись налогов и отчетность.
Document Intelligence Studio
● REST API

● SDK для C#
● Пакет SDK

для Python ● Пакет SDK
для Java для JavaScript

Удостоверение (идентификатор)

Снимок экрана: анализ модели документов удостоверений (ID) с помощью Document Intelligence Studio.

Model ID Description Варианты использования автоматизации Варианты разработки
prebuilt-idDocument • Извлеките ключевые сведения из паспортов и идентификаторов.
• Типы
документов●
Извлечение подтверждений, ограничений и классификаций транспортных средств из водительских лицензий США.
• Ознакомься с рекомендациями по соответствию требованиям финансовых услуг клиента (KYC).
• Управление медицинскими учетными записями.
• Контрольные точки идентификации и шлюзы.
• Регистрация отеля.
Document Intelligence Studio
● REST API

● SDK для C#
● Пакет SDK

для Python ● Пакет SDK
для Java для JavaScript

Проверить

Снимок экрана: проверка анализа моделей с помощью Document Intelligence Studio.

Model ID Description Варианты использования автоматизации Варианты разработки
предварительно созданная проверка • Извлечение сведений о ключе из проверок.
Извлечение данных и полей
• Управление кредитами.
• Автоматизированное управление кредитором.
Document Intelligence Studio
● REST API

● SDK для C#
● Пакет SDK

для Python ● Пакет SDK
для Java для JavaScript

Оплата заглушки

Снимок экрана: анализ модели заглушки оплаты с помощью Document Intelligence Studio.

Model ID Description Варианты использования автоматизации Варианты разработки
предварительно созданная paystub • Извлеките ключевые сведения из заглушки оплаты.
Извлечение данных и полей
• Проверка сведений о заработной плате сотрудников.
• Обнаружение мошенничества для трудоустройства.
● Автоматическая обработка налогов.
Document Intelligence Studio
● REST API

● SDK для C#
● Пакет SDK

для Python ● Пакет SDK
для Java для JavaScript

Банковская выписка

Снимок экрана: анализ модели инструкций Банка с помощью Document Intelligence Studio.

Model ID Description Варианты использования автоматизации Варианты разработки
prebuilt-bankStatement • Извлечение ключевых сведений из банковских инструкций.
Извлечение данных и полей
• Варианты использования налоговой обработки.
• Автоматизированное управление учетом.
• Управление кредитным дебетом.
• Обработка документации по кредитам.
Document Intelligence Studio
● REST API

● SDK для C#
● Пакет SDK

для Python ● Пакет SDK
для Java для JavaScript

Карточка медицинского страхования

Снимок экрана: анализ модели карты медицинского страхования с помощью Document Intelligence Studio.

Model ID Description Варианты использования автоматизации Варианты разработки
prebuilt-healthInsuranceCard.us • Извлеките ключевые сведения из карт медицинского страхования США.
Извлечение данных и полей
● Покрытие и проверка прав на получение прав.
— прогнозное моделирование.
• Аналитика на основе значений.
Document Intelligence Studio
● REST API

● SDK для C#
● Пакет SDK

для Python ● Пакет SDK
для Java для JavaScript

Модель контракта

Снимок экрана: извлечение модели контракта с помощью Document Intelligence Studio.

Model ID Description Варианты разработки
предварительно созданный контракт Извлеките соглашение о контракте и сведения о стороне.
Извлечение данных и полей
Document Intelligence Studio
● REST API● REST API

● ПАКЕТ SDK

для C# ● Пакет SDK для Python ● Пакет SDK

java для Java

Модель кредитной карты

Снимок экрана: анализ модели изображений кредитной карты с помощью Document Intelligence Studio.

Model ID Description Варианты разработки
предварительно созданная кредитная карта Извлеките соглашение о контракте и сведения о стороне.
Извлечение данных и полей
Document Intelligence Studio
● REST API● REST API

● ПАКЕТ SDK

для C# ● Пакет SDK для Python ● Пакет SDK

java для Java

Модель сертификата о браке

Снимок экрана: анализ модели документов сертификата о браке с помощью Document Intelligence Studio.

Model ID Description Варианты разработки
prebuilt-marriageCertificate.us Извлеките соглашение о контракте и сведения о стороне.
Извлечение данных и полей
Document Intelligence Studio
● REST API● REST API

● ПАКЕТ SDK

для C# ● Пакет SDK для Python ● Пакет SDK

java для Java

Форма ипотеки США 1003

Снимок экрана: анализ модели документов для ипотеки США 1003 с помощью Document Intelligence Studio.

Model ID Description Варианты использования автоматизации Варианты разработки
prebuilt-mortgage.us.1003 • Извлеките ключевые сведения из 1003 приложений на кредит.
Извлечение данных и полей
• Требования к документации по Fannie Mae и Фредди Mac. Document Intelligence Studio
● REST API

● SDK для C#
● Пакет SDK

для Python ● Пакет SDK
для Java для JavaScript

Форма ипотеки США 1004

Снимок экрана: анализ модели документов для ипотеки США 1004 с помощью Document Intelligence Studio.

Model ID Description Варианты использования автоматизации Варианты разработки
prebuilt-mortgage.us.1004 • Извлечение ключевых сведений из 1004 оценки.
Извлечение данных и полей
• Требования к документации по Fannie Mae и Фредди Mac.
• Единый отчет об оценке жилья, чтобы помочь кредитору или клиенту с рыночной стоимостью субъекта собственности.
Document Intelligence Studio
● REST API

● SDK для C#
● Пакет SDK

для Python ● Пакет SDK
для Java для JavaScript

Форма ипотеки США 1005

Снимок экрана: анализ модели документов в ипотеке США 1005 с помощью Document Intelligence Studio.

Model ID Description Варианты использования автоматизации Варианты разработки
prebuilt-mortgage.us.1005 • Извлеките ключевые сведения из 1005 проверки занятости.
Извлечение данных и полей
• Требования к документации по Fannie Mae и Фредди Mac.
• Проверка документа о занятости для определения квалификации в качестве потенциального мортгора.
Document Intelligence Studio
● REST API

● SDK для C#
● Пакет SDK

для Python ● Пакет SDK
для Java для JavaScript

Форма ипотеки США 1008

Снимок экрана: анализ модели документов для ипотеки США 1008 с помощью Document Intelligence Studio.

Model ID Description Варианты использования автоматизации Варианты разработки
prebuilt-mortgage.us.1008 • Извлеките ключевые сведения из универсальной андеррайтинга и сводки передачи.
Извлечение данных и полей
• Обработка подзаписи кредитов с использованием сводных данных. Document Intelligence Studio
● REST API

● SDK для C#
● Пакет SDK

для Python ● Пакет SDK
для Java для JavaScript

Форма раскрытия ипотеки США

Снимок экрана: анализ модели модели документа о закрытии ипотеки США с помощью Document Intelligence Studio.

Model ID Description Варианты использования автоматизации Варианты разработки
prebuilt-mortgage.us.closingDisclosure • Извлеките ключевые сведения из универсальной андеррайтинга и сводки передачи.
Извлечение данных и полей
• Окончательные требования к ипотечным кредитам. Document Intelligence Studio
● REST API

● SDK для C#
● Пакет SDK

для Python ● Пакет SDK
для Java для JavaScript

Модель налогового налога США W-2

Снимок экрана: анализ модели W-2 с помощью Document Intelligence Studio.

Model ID Description Варианты использования автоматизации Варианты разработки
prebuilt-tax.us.W-2 • Извлечение ключевых сведений из налоговых форм IRS US W2 (год 2018-2021).
Извлечение данных и полей
● Автоматизированное управление налоговыми документами.
• Обработка заявки на ипотечный кредит.
Document Intelligence Studio
● REST API

● SDK для C#
● Пакет SDK

для Python ● Пакет SDK
для Java для JavaScript

Формы налога США 1098 (и варианты)

Снимок экрана: налоговая форма US 1098, проанализированная в Студии аналитики документов.

Model ID Description Варианты разработки
prebuilt-tax.us.1098{variation} • Извлечение ключевых сведений из вариантов формы 1098.
Извлечение данных и полей
Document Intelligence Studio
● REST API

● SDK для C#
● Пакет SDK

для Python ● Пакет SDK
для Java для JavaScript

Формы налога США 1099 (и варианты)

Снимок экрана: налоговая форма US 1099, проанализированная в Студии аналитики документов.

Model ID Description Варианты разработки
prebuilt-tax.us.1099{variation} • Извлеките сведения из вариантов формы 1099.
Извлечение данных и полей
Document Intelligence Studio
● REST API

● SDK для C#
● Пакет SDK

для Python ● Пакет SDK
для Java для JavaScript

Формы налога США 1040 (и варианты)

Снимок экрана: анализ модели налоговой формы в США 1040 с помощью Document Intelligence Studio.

Model ID Description Варианты разработки
prebuilt-tax.us.1040{variation} • Извлеките сведения из вариантов формы 1040.
Извлечение данных и полей
Document Intelligence Studio
● REST API

● SDK для C#
● Пакет SDK

для Python ● Пакет SDK
для Java для JavaScript

Унифицированные налоговые формы США

Model ID Description Варианты разработки
prebuilt-tax.us •Извлеките информацию из любой поддерживаемой налоговой формы США. Document Intelligence Studio
● REST API

● SDK для C#
● Пакет SDK

для Python ● Пакет SDK
для Java для JavaScript

Визитная карточка

Снимок экрана: анализ модели визитных карточек с помощью Document Intelligence Studio.

Model ID Description Варианты использования автоматизации Варианты разработки
prebuilt-businessCard • Извлечение ключевых сведений из визитных карточек.
Извлечение данных и полей
• Руководитель продаж и управление маркетингом. Document Intelligence Studio
● REST API

● SDK для C#
● Пакет SDK

для Python ● Пакет SDK
для Java для JavaScript

Обзор пользовательской модели

Снимок экрана: обучение пользовательской модели с помощью Document Intelligence Studio.

О программе Description Варианты использования автоматизации Варианты разработки
Пользовательская модель Извлекает сведения из форм и документов в структурированные данные на основе модели, созданной из набора репрезентативных наборов документов для обучения. Извлеките отдельные данные из форм и документов, относящихся к вашему бизнесу и вариантам использования. Document Intelligence Studio
● REST API
● ПАКЕТ SDK
для C#

Пакет SDK для Java SDK для JavaScript ● Пакет SDK
для JavaScript для Python

Настраиваемое создание (извлечение полей документа)

Снимок экрана: анализ пользовательской модели создания с помощью Azure AI Studio.

Примечание.

Пользовательская модель создания доступна только в Azure AI Studio. Чтобы попробовать пользовательскую модель создания в AI Studio, посетите извлечение полей документа (настраиваемое создание)

О программе Description Варианты использования автоматизации Варианты разработки
Настраиваемая модель создания Пользовательская модель создания используется для извлечения полей из неструктурированных документов или структурированных форм с широким спектром визуальных шаблонов. Модель использует генерированный ИИ для извлечения полей, улучшения качества с использованием только нескольких помеченных примеров и может быть интегрирована в процессы с учетом и оценкой достоверности. Azure AI Studio
● REST API

ПАКЕТ SDK для C#
( Пакет SDK для Java SDK для JavaScript● Пакет SDK
javaScript
для Python)

Настраиваемая нейронная модель

Снимок экрана: анализ пользовательской нейронной модели с помощью Document Intelligence Studio.

Примечание.

Чтобы обучить пользовательскую нейронную модель, задайте buildMode для свойства значение neural. Дополнительные сведения см. в разделе "Обучение нейронной модели"

О программе Description Варианты использования автоматизации Варианты разработки
Пользовательская нейронная модель Пользовательская нейронная модель используется для извлечения помеченных данных из структурированных (опросов, анкет), полуструктурированных (счетов, заказов на покупку) и неструктурированных документов (контракты, письма). Извлечение текстовых данных, флажков и табличных полей из структурированных и неструктурированных документов. Document Intelligence Studio
● REST API
● ПАКЕТ SDK для

Java# ( Пакет SDK java SDK для JavaScript
Пакет SDK
для Python)

Пользовательский шаблон

Снимок экрана: анализ пользовательской модели шаблона с помощью Document Intelligence Studio.

Примечание.

Чтобы обучить пользовательскую модель шаблона, задайте buildMode для свойства значение template. Дополнительные сведения см. в разделе "Обучение модели шаблона"

О программе Description Варианты использования автоматизации Варианты разработки
Пользовательская модель шаблона Пользовательская модель шаблона извлекает помеченные значения и поля из структурированных и полуструктурированных документов.
Извлеките ключевые данные из высокоструктурированных документов с определенными визуальными шаблонами или общими визуальными макетами, формами. Document Intelligence Studio
● REST API

● SDK для C#
● Пакет SDK для Python

sdk для Java ● Пакет SDK
java для JavaScript

Пользовательский состав

Снимок экрана: список составных пользовательских моделей в Document Intelligence Studio.

О программе Description Варианты использования автоматизации Варианты разработки
Создание пользовательских моделей Составная модель создается на основе коллекции настраиваемых моделей, которые назначаются одной модели, созданной из ваших типов форм. Полезно при обучении нескольких моделей и их группировке для анализа аналогичных типов форм, таких как заказы на покупку. Document Intelligence Studio
● REST API
● ПАКЕТ SDK
для C#

Пакет SDK для Java SDK для JavaScript ● Пакет SDK
для JavaScript для Python

Пользовательская модель классификации

Снимок экрана: метка пользовательской модели классификации в Document Intelligence Studio.

О программе Description Варианты использования автоматизации Варианты разработки
Модель составной классификации Пользовательские модели классификации объединяют функции макета и языка для обнаружения, идентификации и классификации документов в входном файле. • Приложение кредита упаковано с формой приложения, payslip и банковским заявлением.
• Коллекция отсканированных счетов.
REST API Аналитики
документов

Azure AI Document Intelligence — это облачная служба ИИ Azure для разработчиков для создания интеллектуальных решений для обработки документов. Аналитика документов применяет оптическое распознавание символов на основе машинного обучения (OCR) и технологии распознавания документов для извлечения текста, таблиц, структуры и пар "ключ-значение" из документов. Вы также можете пометить и обучить пользовательские модели для автоматизации извлечения данных из структурированных, полуструктурированных и неструктурированных документов. Дополнительные сведения о каждой модели см . в статьях о концепциях:

Тип модели Имя модели
Модель анализа документов Модель анализа макета
Предварительно созданные модели Модель выставления счетов ● Модель

квитанции ● Модель удостоверения (ID)
Модель визитной карточки

Пользовательские модели • Пользовательская модель ● Составная модель

Это содержимое относится к: версия 2.1 Последняя версия: флажоксиняя галочка версия 4.0 (предварительная версия) |

Модели аналитики документов и варианты разработки

Совет

  • Для повышения качества и расширенного качества модели попробуйте в Студии аналитики документов версии 3.0.
  • Студия версии 3.0 поддерживает любую модель, обученную с помощью маркированных данных версии 2.1.
  • Подробные сведения о переходе с версии 2.1 на версию 3.0 см. в руководстве по миграции API.

Примечание.

Следующие модели и параметры разработки поддерживаются службой аналитики документов версии 2.1.

Используйте ссылки в таблице, чтобы узнать больше о каждой модели и просмотреть ссылки на API:

Модель Description Варианты разработки
Анализ макета Извлечение и анализ текста, меток выбора и таблиц и координат ограничивающего прямоугольника из форм и документов. Средство
маркировки для аналитики документов●
ПАКЕТ SDK для клиентской библиотеки ( REST
API)
контейнер Docker аналитики документов
Пользовательская модель Извлечение и анализ данных из форм и документов, относящихся к определенным бизнес-данным и вариантам использования. Средство маркировки аналитики документов ● REST API
Пример средства

маркировки● Контейнер Docker аналитики документов
Модель накладных Автоматическая обработка данных и извлечение ключевой информации из счетов продажи. Средство
маркировки для аналитики документов●
ПАКЕТ SDK для клиентской библиотеки ( REST
API)
контейнер Docker аналитики документов
Модель получения Автоматическая обработка данных и извлечение ключевой информации из квитанций продажи. Средство
маркировки для аналитики документов●
ПАКЕТ SDK для клиентской библиотеки ( REST
API)
контейнер Docker аналитики документов
Модель документа удостоверений (ID) Автоматизированная обработка данных и извлечение ключевой информации из заграничных паспортов и водительских удостоверений в США. Средство
маркировки для аналитики документов●
ПАКЕТ SDK для клиентской библиотеки ( REST
API)
контейнер Docker аналитики документов
Модель визитных карточек Автоматическая обработка данных и извлечение ключевой информации из визитных карточек. Средство
маркировки для аналитики документов●
ПАКЕТ SDK для клиентской библиотеки ( REST
API)
контейнер Docker аналитики документов

Конфиденциальность и безопасность данных

Как и во всех службах ИИ, разработчики, использующие службу аналитики документов, должны учитывать политики Майкрософт по данным клиентов. Ознакомьтесь со страницей "Данные, конфиденциальность и безопасность" для аналитики документов.

Следующие шаги

  • Выберите модель аналитики документов.

  • Попробуйте обработать собственные формы и документы с помощью Document Intelligence Studio.

  • Выполните краткое руководство по анализу документов и начните создавать приложение для обработки документов на выбранном языке разработки.

  • Попробуйте обработать собственные формы и документы с помощью средства проверки меток для аналитики документов.

  • Выполните краткое руководство по анализу документов и начните создавать приложение для обработки документов на выбранном языке разработки.