Что такое Аналитика документов Azure ИИ?
Внимание
- Выпуски общедоступной предварительной версии Document Intelligence предоставляют ранний доступ к функциям, которые находятся в активной разработке.
- Функции, подходы и процессы могут изменяться до общедоступной доступности на основе отзывов пользователей.
- Общедоступная предварительная версия клиентских библиотек Аналитики документов по умолчанию использует rest API версии 2024-02-29-preview.
- Общедоступная предварительная версия 2024-02-29-preview в настоящее время доступна только в следующих регионах Azure:
- Восточная часть США
- Западная часть США2
- Западная Европа
Это содержимое относится к: версии 4.0 (предварительная версия) | Предыдущие версии: версия 3.1 (GA) версии 3.0 (GA) версии 2.1 (GA)
Это содержимое относится к: версия 3.1 (GA) | Последняя версия: версия 4.0 (предварительная версия) | Предыдущие версии: версии 3.0 версии 2.1
Это содержимое относится к: версия 3.0 (GA) | Последние версии: v4.0 (предварительная версия) версии 3.1 | Предыдущая версия: версия 2.1
Это содержимое относится к: версия 2.1 Последняя версия: версия 4.0 (предварительная версия) |
Примечание.
Распознаватель документов сейчас Аналитика документов ИИ Azure!
- По состоянию на июль 2023 года службы искусственного интеллекта Azure охватывают все ранее известные как Cognitive Services и приложение Azure лиированные службы искусственного интеллекта.
- Нет изменений в ценах.
- Имена Cognitive Services и приложение Azure lied AI продолжают использоваться в выставлении счетов Azure, анализе затрат, прайс-листе и API цен.
- Критические изменения в интерфейсах программирования приложений (API) или пакетах SDK до версии 3.1 отсутствуют. Начиная с версии 4.0 API и пакеты SDK обновляются до аналитики документов.
- Некоторые платформы по-прежнему ожидают переименования обновления. Все упоминания о Распознаватель документов или аналитике документов в нашей документации относятся к одной службе Azure.
Azure AI Document Intelligence — это облачная служба ИИ Azure, которая позволяет создавать интеллектуальные решения для обработки документов. Большие объемы данных, охватывающие широкий спектр типов данных, хранятся в формах и документах. Аналитика документов позволяет эффективно управлять скоростью сбора и обработки данных и является ключевым фактором для улучшения операций, принятия обоснованных решений на основе данных и просвещенных инноваций.
| ✔️ Модели анализа документов | ✔️ Предварительно созданные модели | ✔️ Пользовательские модели |
Модели анализа документов
Модели анализа документов позволяют извлекать текст из форм и документов и возвращать структурированное бизнес-готовое содержимое, готовое для действий, использования или разработки вашей организации.
Чтение | Извлеките печатный и рукописный
текст.
Макет | Извлечение текста, таблиц
и структуры документов.
Чтение | Извлеките печатный и рукописный
текст.
Макет | Извлечение текста, таблиц
и структуры документов.
Общий документ | Извлечение пар "текст",
"структура" и "ключ-значение".
Предварительно созданные модели
Предварительно созданные модели позволяют добавлять интеллектуальную обработку документов в приложения и потоки без необходимости обучать и создавать собственные модели.
Счет | Извлеките сведения о клиенте и поставщике.
Получение | Извлеките сведения о транзакции продаж.
Удостоверение | Извлеките сведения о проверке.
Ипотека США 1003 | Извлечение сведений о приложении кредита.
Ипотека США 1008 | Извлечение сведений о передаче кредита.
Раскрытие ипотеки США | Извлеките окончательные условия закрытия кредита.
Карточка медицинского страхования | Извлеките сведения о страховании.
Контракт | Извлечение соглашений и сведений о стороне.
Кредитная/дебетовая карта | Извлеките сведения о платной карте.
Свидетельство о браке | Извлеките сертифицированные сведения о браке.
Форма налогового налога США W-2 | Извлечение сведений о компенсации с налогом.
Форма налога США 1098 | Извлечение сведений об ипотечных интересах.
Форма налога США 1098-E | Извлечение сведений о проценте за кредит учащихся.
Форма налога США 1098-T | Извлечение квалифицированных сведений об обучении.
Форма налога США 1099 | Извлечение сведений о вариантах формы 1099.
Форма налога США 1040 | Извлечение сведений о вариантах формы 1040.
Счет | Извлеките сведения о клиенте
и поставщике.
Получение | Извлеките сведения о транзакции продаж
.
Удостоверение | Извлечение сведений об идентификации
и проверке.
Карточка медицинского страхования | Извлеките сведения о медицинском страховании.
Визитная карточка | Извлечение сведений о бизнес-контакте.
Контракт | Извлечение соглашений
и сведений о стороне.
Форма налогового налога США W-2 | Извлечение сведений о компенсации с налогом
.
Форма налога США 1098 | Извлечение сведений об ипотечных интересах.
Форма налога США 1098-E | Извлечение сведений о проценте за кредит учащихся.
Форма налога США 1098-T | Извлечение квалифицированных сведений об обучении.
Пользовательские модели
- Пользовательские модели обучены с помощью помеченных наборов данных для извлечения отдельных данных из форм и документов, относящихся к вашим вариантам использования.
- Изолированные настраиваемые модели можно объединять для создания составных моделей.
✔️ Модели извлечения пользовательских моделей извлечения обучены извлекать помеченные поля из документов.
Пользовательский шаблон | Извлеките данные из статических макетов.
Настраиваемый нейрон | Извлеките данные из документов смешанного типа.
Пользовательский состав | Извлечение данных с помощью коллекции моделей.
- Пользовательские классификаторы модели
✔️ классификации определяют типы документов перед вызовом модели извлечения.
Настраиваемый классификатор | Определите назначенные типы документов (классы)
перед вызовом модели извлечения.
Возможности надстройки
Аналитика документов поддерживает дополнительные функции, которые можно включить и отключить в зависимости от сценария извлечения документов. Для и более поздних выпусков доступны 2023-07-31 (GA)
следующие возможности надстройки:
Аналитика документов поддерживает дополнительные функции, которые можно включить и отключить в зависимости от сценария извлечения документов. Для и 2023-10-31-preview
более поздних выпусков доступны2024-02-29-preview
следующие возможности надстройки:
Функции анализа
Model ID | Извлечение содержимого | Поля запроса | Абзацы | Роли абзаца | Метки выделения | Таблицы | Пары "Ключ-значение" | Языки | Штрихкоды | Анализ документов | Формулы* | Шрифт стиля* | Высокое разрешение* |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
prebuilt-read | ✓ | O | O | O | O | O | |||||||
prebuilt-layout | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | O | O | O | ||
prebuilt-document | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | O | O | O | |
prebuilt-businessCard | ✓ | ✓ | ✓ | ||||||||||
предварительно созданный контракт | ✓ | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||
prebuilt-healthInsuranceCard.us | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-idDocument | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-invoice | ✓ | ✓ | ✓ | ✓ | O | O | O | ✓ | O | O | O | ||
prebuilt-receipt | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-marriageCertificate.us | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
предварительно созданная кредитная карта | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.1003 | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.1008 | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.closingDisclosure | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.w2 | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-tax.us.1098 | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-tax.us.1098E | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-tax.us.1098T | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-tax.us.1099(варианты) | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O | ||||
prebuilt-tax.us.1040(варианты) | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
{ customModelName } | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O |
✓ - Включен O - Необязательный
* - Премиум функции влечет за собой дополнительные расходы
Модели и варианты разработки
Примечание.
Следующие модели и варианты разработки документов поддерживаются службой аналитики документов версии 3.0.
Вы можете использовать аналитику документов для автоматизации обработки документов в приложениях и рабочих процессах, улучшения стратегий на основе данных и обогащения возможностей поиска документов. Используйте ссылки в таблице, чтобы узнать больше о каждой модели и просмотреть параметры разработки.
Читать
Model ID | Description | Варианты использования автоматизации | Варианты разработки |
---|---|---|---|
prebuilt-read | • Извлечение текста из документов. • Извлечение данных |
• Оцифровка любого документа. • Соответствие требованиям и аудит. • Обработка рукописных заметок перед переводом. |
● Document Intelligence Studio ● REST API ● SDK для C# ● Пакет SDK для Python ● Пакет SDK для Java для JavaScript |
Макет
Model ID | Description | Варианты использования автоматизации | Варианты разработки |
---|---|---|---|
prebuilt-layout | ● Извлечение текста и сведений о макете из документов. • Извлечение данных |
• Индексирование документов и извлечение по структуре. • Анализ финансовых и медицинских отчетов. |
● Document Intelligence Studio ● REST API ● SDK для C# ● Пакет SDK для Python ● Пакет SDK для Java для JavaScript |
Общий документ (устаревший в 2023-10-31-preview)
Model ID | Description | Варианты использования автоматизации | Варианты разработки |
---|---|---|---|
предварительно созданный документ | • Извлеките пары "текст", "макет" и " ключ-значение" из документов. • Извлечение данных и полей |
● Извлечение пары "ключ-значение". • Обработка форм. • Сбор и анализ данных опроса. |
● REST API Аналитики документов |
Счет
Model ID | Description | Варианты использования автоматизации | Варианты разработки |
---|---|---|---|
prebuilt-invoice | • Извлечение ключевых сведений из счетов. • Извлечение данных и полей |
• Обработка с оплатой счетов. ● Автоматическая запись налогов и отчетность. |
● Document Intelligence Studio ● REST API ● SDK для C# ● Пакет SDK для Python ● Пакет SDK для Java для JavaScript |
Получение
Model ID | Description | Варианты использования автоматизации | Варианты разработки |
---|---|---|---|
prebuilt-receipt | • Извлечение ключевых сведений из квитанций. • Извлечение данных и полей— модель квитанций версии 3.0 поддерживает обработку квитанций об одностраничных отелях. |
• Управление расходами. • Анализ данных поведения потребителей. • Программа лояльности клиентов. • Обработка возвращаемых товаров. ● Автоматическая запись налогов и отчетность. |
● Document Intelligence Studio ● REST API ● SDK для C# ● Пакет SDK для Python ● Пакет SDK для Java для JavaScript |
Удостоверение (идентификатор)
Model ID | Description | Варианты использования автоматизации | Варианты разработки |
---|---|---|---|
prebuilt-idDocument | • Извлеките ключевые сведения из паспортов и идентификаторов. • Типы документов● Извлечение подтверждений, ограничений и классификаций транспортных средств из водительских лицензий США. |
• Ознакомься с рекомендациями по соответствию требованиям финансовых услуг клиента (KYC). • Управление медицинскими учетными записями. • Контрольные точки идентификации и шлюзы. • Регистрация отеля. |
● Document Intelligence Studio ● REST API ● SDK для C# ● Пакет SDK для Python ● Пакет SDK для Java для JavaScript |
Форма ипотеки США 1003
Model ID | Description | Варианты использования автоматизации | Варианты разработки |
---|---|---|---|
prebuilt-mortgage.us.1003 | • Извлеките ключевые сведения из 1003 приложений на кредит. • Извлечение данных и полей |
• Требования к документации по Fannie Mae и Фредди Mac. | ● Document Intelligence Studio ● REST API ● SDK для C# ● Пакет SDK для Python ● Пакет SDK для Java для JavaScript |
Форма ипотеки США 1008
Model ID | Description | Варианты использования автоматизации | Варианты разработки |
---|---|---|---|
prebuilt-mortgage.us.1008 | • Извлеките ключевые сведения из универсальной андеррайтинга и сводки передачи. • Извлечение данных и полей |
• Обработка подзаписи кредитов с использованием сводных данных. | ● Document Intelligence Studio ● REST API ● SDK для C# ● Пакет SDK для Python ● Пакет SDK для Java для JavaScript |
Форма раскрытия ипотеки США
Model ID | Description | Варианты использования автоматизации | Варианты разработки |
---|---|---|---|
prebuilt-mortgage.us.closingDisclosure | • Извлеките ключевые сведения из универсальной андеррайтинга и сводки передачи. • Извлечение данных и полей |
• Окончательные требования к ипотечным кредитам. | ● Document Intelligence Studio ● REST API ● SDK для C# ● Пакет SDK для Python ● Пакет SDK для Java для JavaScript |
Карточка медицинского страхования
Model ID | Description | Варианты использования автоматизации | Варианты разработки |
---|---|---|---|
prebuilt-healthInsuranceCard.us | • Извлеките ключевые сведения из карт медицинского страхования США. • Извлечение данных и полей |
● Покрытие и проверка прав на получение прав. — прогнозное моделирование. • Аналитика на основе значений. |
● Document Intelligence Studio ● REST API ● SDK для C# ● Пакет SDK для Python ● Пакет SDK для Java для JavaScript |
Модель контракта
Model ID | Description | Варианты разработки |
---|---|---|
предварительно созданный контракт | Извлеките соглашение о контракте и сведения о стороне. • Извлечение данных и полей |
● Document Intelligence Studio ● REST API● REST API ● ПАКЕТ SDK для C# ● Пакет SDK для Python ● Пакет SDK java для Java |
Модель кредитной карты
Model ID | Description | Варианты разработки |
---|---|---|
предварительно созданная кредитная карта | Извлеките соглашение о контракте и сведения о стороне. • Извлечение данных и полей |
● Document Intelligence Studio ● REST API● REST API ● ПАКЕТ SDK для C# ● Пакет SDK для Python ● Пакет SDK java для Java |
Модель сертификата о браке
Model ID | Description | Варианты разработки |
---|---|---|
prebuilt-marriageCertificate.us | Извлеките соглашение о контракте и сведения о стороне. • Извлечение данных и полей |
● Document Intelligence Studio ● REST API● REST API ● ПАКЕТ SDK для C# ● Пакет SDK для Python ● Пакет SDK java для Java |
Модель налогового налога США W-2
Model ID | Description | Варианты использования автоматизации | Варианты разработки |
---|---|---|---|
prebuilt-tax.us.W-2 | • Извлечение ключевых сведений из налоговых форм IRS US W2 (год 2018-2021). • Извлечение данных и полей |
● Автоматизированное управление налоговыми документами. • Обработка заявки на ипотечный кредит. |
● Document Intelligence Studio ● REST API ● SDK для C# ● Пакет SDK для Python ● Пакет SDK для Java для JavaScript |
Форма налога США 1098
Model ID | Description | Варианты разработки |
---|---|---|
prebuilt-tax.us.1098 | Извлечение сведений и сведений об ипотечных интересах. • Извлечение данных и полей |
● Document Intelligence Studio ● REST API ● SDK для C# ● Пакет SDK для Python ● Пакет SDK для Java для JavaScript |
Форма налога США 1098-E
Model ID | Description | Варианты разработки |
---|---|---|
prebuilt-tax.us.1098E | Извлечение сведений и сведений о кредите для учащихся. • Извлечение данных и полей |
● Document Intelligence Studio ● ● REST API ● ПАКЕТ SDK для C# ( Пакет SDK для Python( Пакет SDK для Python для Java( JavaScript) |
Форма налога США 1098-T
Model ID | Description | Варианты разработки |
---|---|---|
prebuilt-tax.us.1098T | Извлеките сведения о обучении и подробные сведения. • Извлечение данных и полей |
● REST API Аналитики документов |
Форма налога США 1099 (и варианты)
Model ID | Description | Варианты разработки |
---|---|---|
prebuilt-tax.us.1099{variation } |
Извлеките сведения из вариантов формы 1099. | ● ● Извлечение данных и полей Document Intelligence Studio ● REST API ● SDK для C# ● Пакет SDK для Python● Пакет SDK для Java для JavaScript |
Форма налога США 1040
Model ID | Description | Варианты разработки |
---|---|---|
prebuilt-tax.us.1040 | Извлеките сведения из вариантов формы 1040. | ● ● Извлечение данных и полей Document Intelligence Studio ● REST API ● SDK для C# ● Пакет SDK для Python● Пакет SDK для Java для JavaScript |
Визитная карточка
Model ID | Description | Варианты использования автоматизации | Варианты разработки |
---|---|---|---|
prebuilt-businessCard | • Извлечение ключевых сведений из визитных карточек. • Извлечение данных и полей |
• Руководитель продаж и управление маркетингом. | ● Document Intelligence Studio ● REST API ● SDK для C# ● Пакет SDK для Python ● Пакет SDK для Java для JavaScript |
Обзор пользовательской модели
О программе | Description | Варианты использования автоматизации | Варианты разработки |
---|---|---|---|
Пользовательская модель | Извлекает сведения из форм и документов в структурированные данные на основе модели, созданной из набора репрезентативных наборов документов для обучения. | Извлеките отдельные данные из форм и документов, относящихся к вашему бизнесу и вариантам использования. | ● Document Intelligence Studio ● REST API ● ПАКЕТ SDK для C# ● Пакет SDK для Java SDK для JavaScript ● Пакет SDK для JavaScript для Python |
Пользовательский шаблон
Примечание.
Чтобы обучить пользовательскую модель шаблона, задайте buildMode
для свойства значение template
.
Дополнительные сведения см. в разделе "Обучение модели шаблона"
О программе | Description | Варианты использования автоматизации | Варианты разработки |
---|---|---|---|
Пользовательская модель шаблона | Пользовательская модель шаблона извлекает помеченные значения и поля из структурированных и полуструктурированных документов. |
Извлеките ключевые данные из высокоструктурированных документов с определенными визуальными шаблонами или общими визуальными макетами, формами. | ● Document Intelligence Studio ● REST API ● SDK для C# ● Пакет SDK для Python sdk для Java ● Пакет SDK java для JavaScript |
Настраиваемая нейронная модель
Примечание.
Чтобы обучить пользовательскую нейронную модель, задайте buildMode
для свойства значение neural
.
Дополнительные сведения см. в разделе "Обучение нейронной модели"
О программе | Description | Варианты использования автоматизации | Варианты разработки |
---|---|---|---|
Пользовательская нейронная модель | Пользовательская нейронная модель используется для извлечения помеченных данных из структурированных (опросов, анкет), полуструктурированных (счетов, заказов на покупку) и неструктурированных документов (контракты, письма). | Извлечение текстовых данных, флажков и табличных полей из структурированных и неструктурированных документов. | Document Intelligence Studio ● REST API ● ПАКЕТ SDK для Java# ( Пакет SDK java SDK для JavaScript ● Пакет SDK для Python) |
Пользовательский состав
О программе | Description | Варианты использования автоматизации | Варианты разработки |
---|---|---|---|
Создание пользовательских моделей | Составная модель создается на основе коллекции настраиваемых моделей, которые назначаются одной модели, созданной из ваших типов форм. | Полезно при обучении нескольких моделей и их группировке для анализа аналогичных типов форм, таких как заказы на покупку. | ● Document Intelligence Studio ● REST API ● ПАКЕТ SDK для C# ● Пакет SDK для Java SDK для JavaScript ● Пакет SDK для JavaScript для Python |
Пользовательская модель классификации
О программе | Description | Варианты использования автоматизации | Варианты разработки |
---|---|---|---|
Модель составной классификации | Пользовательские модели классификации объединяют функции макета и языка для обнаружения, идентификации и классификации документов в входном файле. | • Приложение кредита упаковано с формой приложения, payslip и банковским заявлением. • Коллекция отсканированных счетов. |
● REST API Аналитики документов |
Azure AI Document Intelligence — это облачная служба ИИ Azure для разработчиков для создания интеллектуальных решений для обработки документов. Аналитика документов применяет оптическое распознавание символов на основе машинного обучения (OCR) и технологии распознавания документов для извлечения текста, таблиц, структуры и пар "ключ-значение" из документов. Вы также можете пометить и обучить пользовательские модели для автоматизации извлечения данных из структурированных, полуструктурированных и неструктурированных документов. Дополнительные сведения о каждой модели см . в статьях о концепциях:
Тип модели | Имя модели |
---|---|
Модель анализа документов | • Модель анализа макета |
Предварительно созданные модели | • Модель выставления счетов ● Модель квитанции ● Модель удостоверения (ID) ● Модель визитной карточки |
Пользовательские модели | • Пользовательская модель ● Составная модель |
Это содержимое относится к: версия 2.1 Последняя версия: версия 4.0 (предварительная версия) |
Модели аналитики документов и варианты разработки
Совет
- Для повышения качества и расширенного качества модели попробуйте в Студии аналитики документов версии 3.0.
- Студия версии 3.0 поддерживает любую модель, обученную с помощью маркированных данных версии 2.1.
- Подробные сведения о переходе с версии 2.1 на версию 3.0 см. в руководстве по миграции API.
Примечание.
Следующие модели и параметры разработки поддерживаются службой аналитики документов версии 2.1.
Используйте ссылки в таблице, чтобы узнать больше о каждой модели и просмотреть ссылки на API:
Конфиденциальность и безопасность данных
Как и во всех службах ИИ, разработчики, использующие службу аналитики документов, должны учитывать политики Майкрософт по данным клиентов. Ознакомьтесь со страницей "Данные, конфиденциальность и безопасность" для аналитики документов.
Следующие шаги
Выберите модель аналитики документов.
Попробуйте обработать собственные формы и документы с помощью Document Intelligence Studio.
Выполните краткое руководство по анализу документов и начните создавать приложение для обработки документов на выбранном языке разработки.
Попробуйте обработать собственные формы и документы с помощью средства проверки меток для аналитики документов.
Выполните краткое руководство по анализу документов и начните создавать приложение для обработки документов на выбранном языке разработки.
Обратная связь
https://aka.ms/ContentUserFeedback.
Ожидается в ближайшее время: в течение 2024 года мы постепенно откажемся от GitHub Issues как механизма обратной связи для контента и заменим его новой системой обратной связи. Дополнительные сведения см. в разделеОтправить и просмотреть отзыв по