Поделиться через


Модель документа аналитики документов

Внимание

  • Выпуски общедоступной предварительной версии Document Intelligence предоставляют ранний доступ к функциям, которые находятся в активной разработке. Функции, подходы и процессы могут изменяться до общедоступной доступности на основе отзывов пользователей.
  • Общедоступная предварительная версия клиентских библиотек Аналитики документов по умолчанию использует REST API версии 2024-07-31-preview.
  • Общедоступная предварительная версия 2024-07-31-preview в настоящее время доступна только в следующих регионах Azure. Обратите внимание, что пользовательская модель создания (извлечение полей документов) в AI Studio доступна только в регионе "Северная часть США":
    • Восточная часть США
    • Западная часть США2
    • Западная Европа
    • Северная часть США

Это содержимое относится к: версии 4.0 (предварительная версия) | Предыдущие версии: флажоксиняя галочка версия 3.1 (GA) версии 3.0 (GA) синяя галочка версии 2.1 (GA) синяя галочка

Это содержимое относится к: версия 3.1 (GA) | Последняя версия: фиолетовый флажокфлажок версия 4.0 (предварительная версия) | Предыдущие версии: синяя галочка версии 3.0синяя галочка версии 2.1

Это содержимое относится к: версия 3.0 (GA) | Последние версии: флажок фиолетовый флажок v4.0 (предварительная версия) фиолетовый флажок версии 3.1 | Предыдущая версия: синяя галочка версия 2.1

Это содержимое относится к: версия 2.1 Последняя версия: флажоксиняя галочка версия 4.0 (предварительная версия) |

Модель документа удостоверений аналитики документов (ID) объединяет оптическое распознавание символов (OCR) с моделями глубокого обучения для анализа и извлечения ключевых сведений из документов удостоверений. API анализирует документы удостоверений (включая следующие) и возвращает структурированное представление данных JSON:

  • Паспортная книга, паспортная карта по всему миру
  • Водительская лицензия от США, Европы, Индии, Канады и Австралии
  • США идентификационные карточки, разрешение на проживание (зеленая карта), карточка социального страхования, военный идентификатор
  • Европейские идентификационные карточки, разрешения на проживание
  • Индия PAN карточка, Aadhaar карточка
  • Идентификационные карточки Канады, разрешение на проживание (карта maple)
  • Фотокарта Австралии, идентификатор ключа(включая цифровую версию)

Аналитика документов может анализировать и извлекать информацию из документов идентификации, выданных правительством, с помощью предварительно созданной модели идентификаторов. Он сочетает в себе мощные возможности оптического распознавания символов (OCR) с возможностью распознавания идентификаторов, чтобы извлечь ключевые сведения из международных паспортов и водительских прав США (все 50 штатов и округ Колумбия). API идентификаторов извлекает ключевые сведения из этих документов удостоверений, таких как имя, фамилия, дата рождения, номер документа и многое другое. Этот API доступен в аналитике документов версии 2.1 как облачная служба.

Обработка документов удостоверений

Обработка документов удостоверений включает извлечение данных из документов удостоверений вручную или с помощью технологии на основе OCR. Обработка документов идентификатора является важным шагом в любой бизнес-операции, требующей подтверждения удостоверения. Примеры включают проверку клиентов в банках и других финансовых учреждениях, ипотечных приложениях, медицинских визитах, обработке утверждений, индустрии гостеприимства и т. д. Лица предоставляют некоторые доказательства их личности с помощью водительских лицензий, паспортов и других аналогичных документов, чтобы бизнес смог эффективно проверить их перед предоставлением услуг и преимуществ.

Пример лицензии водителя США, обработанный с помощью Document Intelligence Studio

Изображение с примером водительского удостоверения.

Извлечение данных

Предварительно созданная служба идентификаторов извлекает ключевые значения из международных паспортов и водительских прав США и возвращает их в организованном структурированном ответе JSON.

Водительские права

Пример водительских прав

Паспорт

Пример паспорта

Варианты разработки

Аналитика документов версии 4.0 (2024-07-31-preview) поддерживает следующие средства, приложения и библиотеки:

Функция Ресурсы Model ID
Модель документа идентификатора Аналитика
документов• REST API
• ПАКЕТ SDK
для C#
• Пакет SDK для Python• Пакет SDK для Java • Пакет SDK
java для JavaScript
prebuilt-idDocument

Аналитика документов версии 3.1 поддерживает следующие средства, приложения и библиотеки:

Функция Ресурсы Model ID
Модель документа идентификатора Аналитика
документов• REST API
• ПАКЕТ SDK
для C#
• Пакет SDK для Python• Пакет SDK для Java • Пакет SDK
java для JavaScript
prebuilt-idDocument

Аналитика документов версии 3.0 поддерживает следующие средства, приложения и библиотеки:

Функция Ресурсы Model ID
Модель документа идентификатора Аналитика
документов• REST API
• ПАКЕТ SDK
для C#
• Пакет SDK для Python• Пакет SDK для Java • Пакет SDK
java для JavaScript
prebuilt-idDocument

Аналитика документов версии 2.1 поддерживает следующие средства, приложения и библиотеки:

Функция Ресурсы
Модель документа идентификатора Средство
аналитики документов • REST API
пакет SDK
для клиентской библиотеки • Контейнер Docker аналитики документов

Требования к входным данным

  • Поддерживаемые форматы файлов:

    Модель PDF Изображение:
    JPEG/JPG, , BMPPNGTIFFHEIF
    Microsoft Office:
    Word (), Excel (XLSXDOCX), PowerPoint (PPTX), HTML
    Читать
    Макет ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
    Документ общего назначения
    Готовое
    Настраиваемая функция извлечения
    Настраиваемая классификация ✔ (2024-07-31-preview, 2024-02-29-preview)
  • Для получения наилучших результатов предоставьте одну четкую фотографию или скан-копию документа высокого качества.

  • Для PDF и TIFF можно обрабатывать до 2000 страниц (с подпиской на бесплатный уровень только первые две страницы обрабатываются).

  • Размер файла для анализа документов составляет 500 МБ для платного уровня (S0) и 4 МБ для бесплатного уровня (F0).

  • Размеры изображения должны составлять от 50 пикселей до 50 пикселей и 10 000 пикселей x 10 000 пикселей.

  • Если PDF-файлы заблокированы паролем, перед отправкой необходимо снять блокировку.

  • Минимальная высота извлекаемого текста составляет 12 пикселей для изображения размером 1024 x 768 пикселей. Это измерение соответствует тексту 8 точки в 150 точек на дюйм (DPI).

  • Для обучения пользовательской модели максимальный объем обучающих данных составляет 500 страниц для пользовательской модели шаблона и 50 000 страниц для пользовательской нейронной модели.

    • Для обучения пользовательской модели извлечения общий размер обучающих данных составляет 50 МБ для модели шаблона и 1 ГБ для нейронной модели.

    • Для обучения пользовательской модели классификации общий размер обучающих данных составляет 1 ГБ не более 10 000 страниц. Для 2024-07-31-preview и более поздних версий общий размер обучающих данных составляет 2 ГБ с максимальным количеством 10 000 страниц.

  • Поддерживаемые форматы файлов: JPEG, PNG, PDF и TIFF.

  • Поддерживаемо количество страниц для PDF-файлов и TIFF: до 2000 страниц или только первых двух страниц для подписчиков бесплатного уровня.

  • Поддерживаемый размер файла: менее 50 МБ; минимальные пиксели: 50 x 50 пикселей; максимум пикселей 10 000 x 10 000 пикселей.

Извлечение данных модели документов идентификатора

Извлеките данные, включая имя, дату рождения и дату окончания срока действия, из документов идентификатора. Вам потребуются следующие ресурсы:

  • Подписка Azure — ее можно создать бесплатно.

  • Экземпляр аналитики документов в портал Azure. Вы можете использовать ценовую категорию "Бесплатный" (F0), чтобы поработать со службой. После развертывания ресурса выберите Перейти к ресурсу, чтобы получить ключ и конечную точку.

Снимок экрана: расположение ключей и конечной точки на портале Azure.

Примечание.

Document Intelligence Studio доступна с API версии 3.1 и версии 3.0 и более поздними версиями.

  1. На домашней странице Document Intelligence Studio выберите документы удостоверений.

  2. Вы можете проанализировать пример счета или отправить собственные файлы.

  3. Нажмите кнопку "Выполнить анализ", а при необходимости настройте параметры анализа:

    Снимок экрана: кнопки

Средство разработки меток аналитики документов

  1. Перейдите к инструменту аналитики документов.

  2. На домашней странице примера инструмента выберите предварительно созданную модель, чтобы получить плитку данных .

    Снимок экрана: операция анализа результатов модели макета.

  3. Выберите тип формы для анализа из раскрывающегося меню.

  4. Выберите URL-адрес для файла, который необходимо проанализировать, в одном из следующих вариантов:

  5. В поле Источник выберите URL-адрес в раскрывающемся меню, вставьте выбранный URL-адрес и нажмите кнопку Получить.

    Снимок экрана с раскрывающимся меню расположения источника.

  6. В поле конечной точки службы аналитики документов вставьте конечную точку, полученную в подписке Аналитики документов.

  7. В поле ключа вставьте ключ, полученный из ресурса аналитики документов.

    Снимок экрана: раскрывающееся меню типа документа.

  8. Щелкните элемент Run analysis (Выполнить анализ). Средство аналитики документов вызывает предварительно созданный API анализа и анализирует документ.

  9. Просмотрите результаты. Просмотрите пары "ключ-значение", извлеченные, элементы строки, извлеченные текст и обнаруженные таблицы.

    Снимок экрана: операция анализа результатов модели удостоверений.

  10. Скачайте выходной файл в формате JSON для просмотра подробных результатов.

    • Узел readResults содержит каждую строку текста и соответствующее расположение ограничивающего прямоугольника на странице.
    • Узел selectionMarks отображает каждую метку выбора (флажок, переключатель) и указывает, выбрано ли его состояние или не выбрано.
    • В разделе pageResults содержатся извлеченные таблицы. Для каждой таблицы аналитика документов извлекает текст, индекс строки и столбца, диапазон строк и столбцов, ограничивающее поле и многое другое.
    • Поле documentResults содержит сведения о парах "ключ-значение" и об элементах строк для наиболее релевантных частей документа.

Примечание.

Пример средства маркировки данных не поддерживает файлы в формате BMP. Это ограничение средства, а не службы аналитики документов.

Поддерживаемые типы документов

Область/регион Типы документов
По всему миру Passport Book, Passport Card
Соединенные Штаты Водительская лицензия, идентификационный карточка, разрешение на проживание (зеленая карта), карточка социального страхования, военный идентификатор
Европа Водительское удостоверение, идентификационный карточка, разрешение на проживание
Индия Водительские лицензии, PAN Card, Aadhaar Card
Канада Водительская лицензия, идентификационный карточка, разрешение на проживание (карта maple)
Австралия Водительская лицензия, фотокарта, идентификатор ключа (включая цифровую версию)

Извлечение полей

Сведения о поддерживаемых полях извлечения документов см. на странице схемы модели идентификаторов в примере репозитория GitHub.

Поддерживаемые типы документов

Модель документов id в настоящее время поддерживает лицензии водителя США и биографическую страницу из международных паспортов (за исключением виз и других документов для путешествий).

Извлеченные поля

Имя. Тип Описание Значение
Country country Код страны соответствует стандарту ISO 3166 "USA"
dateOfBirth Дата Дата рождения в формате ГГГГ-ММ-ДД "1980-01-01"
DateOfExpiration Дата Дата окончания срока действия в формате ГГГГ-ММ-ДД "2019-05-05"
DocumentNumber строка Соответствующий номер паспорта, номер водительских прав и т. д. "340020013"
FirstName строка Извлеченные имя и инициалы, если применимо "JENNIFER"
LastName строка Извлеченная фамилия "BROOKS"
Национальность country Код страны соответствует стандарту ISO 3166 "USA"
Пол пол Возможные извлеченные значения включают "M" "F" "X" "F"
MachineReadableZone объект Извлеченный паспорт MRZ , включая две строки из 44 символов каждый "P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816"
DocumentType строка Тип документа, например паспорт, водительские права "passport"
Адрес строка Извлеченный адрес (только для водительских прав) "123 УЛИЦА ГОРОД WA 99999-1234"
Область/регион строка Извлеченный регион, штат, провинция и т. д. (только для водительских прав) "Washington"

Руководство по миграции

  • Следуйте руководству по миграции с помощью аналитики документов версии 3.1, чтобы узнать, как использовать версию версии 3.0 в приложениях и рабочих процессах.

Следующие шаги

  • Попробуйте обработать собственные формы и документы с помощью Document Intelligence Studio.

  • Выполните краткое руководство по анализу документов и начните создавать приложение для обработки документов на выбранном языке разработки.

  • Попробуйте обработать собственные формы и документы с помощью средства проверки меток для аналитики документов.

  • Выполните краткое руководство по анализу документов и начните создавать приложение для обработки документов на выбранном языке разработки.