Начало работы с анализом изображений в Azure

Завершено

Аналитика документов Azure состоит из функций, сгруппированных по типу модели:

  • Предварительно созданные модели — предварительно обученные модели, созданные для обработки распространенных типов документов, таких как счета, бизнес-карта, документы идентификаторов и многое другое. Эти модели предназначены для распознавания и извлечения определенных полей, важных для каждого типа документа.
  • Пользовательские модели — можно обучить определять определенные поля, которые не включены в существующие предварительно обученные модели.
  • Анализ документов — общий анализ документов, возвращающий структурированные представления данных, включая интересующие регионы и их межобязания.

Предварительно созданные модели

Предварительно созданные модели применяют расширенное машинное обучение для точного определения и извлечения текста, пар "ключ-значение", таблиц и структур из форм и документов. К этим возможностям относятся извлечение:

  • сведения о клиенте и поставщике из счетов
  • сведения о продажах и транзакциях из квитанций
  • сведения об идентификации и проверке документов удостоверений
  • Сведения о медицинском страховании
  • Сведения о бизнес-контакте
  • соглашение и сведения о стороне из контрактов
  • налогооблагаемая компенсация, ипотечные проценты, сведения о студенческом кредите и многое другое

Например, рассмотрим предварительно созданную модель квитанций. Он обрабатывает квитанции по следующим компонентам:

  • Сопоставление имен полей со значениями
  • Определение таблиц данных
  • Определение определенных полей, таких как даты, номера телефонов, адреса, итоги и другие

Модель квитанций была обучена распознавать данные о нескольких различных типах квитанций, таких как тепловые квитанции (напечатанные на теплочувствительной бумаге), квитанции о отелях, квитанции о газе, кредитные карта квитанции и квитанции парковки.

К полям, распознаваемым, относятся:

  • Имя, адрес и номер телефона торговца
  • Дата и время покупки
  • Имя, количество и цена каждого приобретенного элемента
  • Итоговые, промежуточные итоги и налоговые значения

Каждая пара полей и данных имеет уровень достоверности, указывающий на вероятный уровень точности. Это можно использовать для автоматического идентификации, когда человеку нужно проверить квитанцию.

Модель была обучена распознавать несколько разных языков в зависимости от типа квитанции. Для получения наилучших результатов при использовании предварительно созданной модели квитанций изображения должны быть следующими:

  • ФОРМАТ JPEG, PNG, BMP, PDF или TIFF
  • Размер файла менее 500 МБ для платного уровня (S0) и 4 МБ бесплатного уровня (F0)
  • От 50 x 50 пикселей до 10000 x 10000 пикселей
  • Для PDF-документов, размер которых не превышает 17 x 17 дюймов
  • Одна квитанция на документ

Вы можете приступить к обучению моделей в Studio Document Intelligence, пользовательском интерфейсе для тестирования анализа документов, предварительно созданных моделей и создания пользовательских моделей.

Ресурс аналитики документов Azure ИИ

Чтобы использовать Аналитику документов Azure, создайте ресурс аналитики документов или служб ИИ Azure в подписке Azure. Если вы еще не использовали аналитику документов, выберите бесплатный уровень при создании ресурса. Существуют некоторые ограничения на бесплатный уровень, например только первые две страницы обрабатываются для документов PDF или TIFF.

После создания ресурса можно создать клиентские приложения, использующие ключ и конечную точку для подключения форм для анализа, или использовать ресурс в Document Intelligence Studio.