Модель документа аналитики документов
Внимание
- Выпуски общедоступной предварительной версии Document Intelligence предоставляют ранний доступ к функциям, которые находятся в активной разработке. Функции, подходы и процессы могут изменяться до общедоступной доступности на основе отзывов пользователей.
- Общедоступная предварительная версия клиентских библиотек Аналитики документов по умолчанию использует REST API версии 2024-07-31-preview.
- Общедоступная предварительная версия 2024-07-31-preview в настоящее время доступна только в следующих регионах Azure. Обратите внимание, что пользовательская модель создания (извлечение полей документов) в AI Studio доступна только в регионе "Северная часть США":
- Восточная часть США
- Западная часть США2
- Западная Европа
- Северная часть США
Это содержимое относится к: версии 4.0 (предварительная версия) | Предыдущие версии: версия 3.1 (GA) версии 3.0 (GA) версии 2.1 (GA)
Это содержимое относится к: версия 3.1 (GA) | Последняя версия: версия 4.0 (предварительная версия) | Предыдущие версии: версии 3.0 версии 2.1
Это содержимое относится к: версия 3.0 (GA) | Последние версии: v4.0 (предварительная версия) версии 3.1 | Предыдущая версия: версия 2.1
Это содержимое относится к: версия 2.1 Последняя версия: версия 4.0 (предварительная версия) |
Модель документа удостоверений аналитики документов (ID) объединяет оптическое распознавание символов (OCR) с моделями глубокого обучения для анализа и извлечения ключевых сведений из документов удостоверений. API анализирует документы удостоверений (включая следующие) и возвращает структурированное представление данных JSON:
- Паспортная книга, паспортная карта по всему миру
- Водительская лицензия от США, Европы, Индии, Канады и Австралии
- США идентификационные карточки, разрешение на проживание (зеленая карта), карточка социального страхования, военный идентификатор
- Европейские идентификационные карточки, разрешения на проживание
- Индия PAN карточка, Aadhaar карточка
- Идентификационные карточки Канады, разрешение на проживание (карта maple)
- Фотокарта Австралии, идентификатор ключа(включая цифровую версию)
Аналитика документов может анализировать и извлекать информацию из документов идентификации, выданных правительством, с помощью предварительно созданной модели идентификаторов. Он сочетает в себе мощные возможности оптического распознавания символов (OCR) с возможностью распознавания идентификаторов, чтобы извлечь ключевые сведения из международных паспортов и водительских прав США (все 50 штатов и округ Колумбия). API идентификаторов извлекает ключевые сведения из этих документов удостоверений, таких как имя, фамилия, дата рождения, номер документа и многое другое. Этот API доступен в аналитике документов версии 2.1 как облачная служба.
Обработка документов удостоверений
Обработка документов удостоверений включает извлечение данных из документов удостоверений вручную или с помощью технологии на основе OCR. Обработка документов идентификатора является важным шагом в любой бизнес-операции, требующей подтверждения удостоверения. Примеры включают проверку клиентов в банках и других финансовых учреждениях, ипотечных приложениях, медицинских визитах, обработке утверждений, индустрии гостеприимства и т. д. Лица предоставляют некоторые доказательства их личности с помощью водительских лицензий, паспортов и других аналогичных документов, чтобы бизнес смог эффективно проверить их перед предоставлением услуг и преимуществ.
Пример лицензии водителя США, обработанный с помощью Document Intelligence Studio
Извлечение данных
Предварительно созданная служба идентификаторов извлекает ключевые значения из международных паспортов и водительских прав США и возвращает их в организованном структурированном ответе JSON.
Водительские права
Паспорт
Варианты разработки
Аналитика документов версии 4.0 (2024-07-31-preview) поддерживает следующие средства, приложения и библиотеки:
Функция | Ресурсы | Model ID |
---|---|---|
Модель документа идентификатора | • Аналитика документов• REST API • ПАКЕТ SDK для C# • Пакет SDK для Python• Пакет SDK для Java • Пакет SDK java для JavaScript |
prebuilt-idDocument |
Аналитика документов версии 3.1 поддерживает следующие средства, приложения и библиотеки:
Функция | Ресурсы | Model ID |
---|---|---|
Модель документа идентификатора | • Аналитика документов• REST API • ПАКЕТ SDK для C# • Пакет SDK для Python• Пакет SDK для Java • Пакет SDK java для JavaScript |
prebuilt-idDocument |
Аналитика документов версии 3.0 поддерживает следующие средства, приложения и библиотеки:
Функция | Ресурсы | Model ID |
---|---|---|
Модель документа идентификатора | • Аналитика документов• REST API • ПАКЕТ SDK для C# • Пакет SDK для Python• Пакет SDK для Java • Пакет SDK java для JavaScript |
prebuilt-idDocument |
Аналитика документов версии 2.1 поддерживает следующие средства, приложения и библиотеки:
Функция | Ресурсы |
---|---|
Модель документа идентификатора | • Средство аналитики документов • REST API • пакет SDK для клиентской библиотеки • Контейнер Docker аналитики документов |
Требования к входным данным
Поддерживаемые форматы файлов:
Модель PDF Изображение: JPEG/JPG
, ,BMP
PNG
TIFF
HEIF
Microsoft Office:
Word (), Excel (XLSX
DOCX
), PowerPoint (PPTX
), HTMLЧитать ✔ ✔ ✔ Макет ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview) Документ общего назначения ✔ ✔ Готовое ✔ ✔ Настраиваемая функция извлечения ✔ ✔ Настраиваемая классификация ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview) Для получения наилучших результатов предоставьте одну четкую фотографию или скан-копию документа высокого качества.
Для PDF и TIFF можно обрабатывать до 2000 страниц (с подпиской на бесплатный уровень только первые две страницы обрабатываются).
Размер файла для анализа документов составляет 500 МБ для платного уровня (S0) и
4
МБ для бесплатного уровня (F0).Размеры изображения должны составлять от 50 пикселей до 50 пикселей и 10 000 пикселей x 10 000 пикселей.
Если PDF-файлы заблокированы паролем, перед отправкой необходимо снять блокировку.
Минимальная высота извлекаемого текста составляет 12 пикселей для изображения размером 1024 x 768 пикселей. Это измерение соответствует тексту
8
точки в 150 точек на дюйм (DPI).Для обучения пользовательской модели максимальный объем обучающих данных составляет 500 страниц для пользовательской модели шаблона и 50 000 страниц для пользовательской нейронной модели.
Для обучения пользовательской модели извлечения общий размер обучающих данных составляет 50 МБ для модели шаблона и
1
ГБ для нейронной модели.Для обучения пользовательской модели классификации общий размер обучающих данных составляет
1
ГБ не более 10 000 страниц. Для 2024-07-31-preview и более поздних версий общий размер обучающих данных составляет2
ГБ с максимальным количеством 10 000 страниц.
Поддерживаемые форматы файлов: JPEG, PNG, PDF и TIFF.
Поддерживаемо количество страниц для PDF-файлов и TIFF: до 2000 страниц или только первых двух страниц для подписчиков бесплатного уровня.
Поддерживаемый размер файла: менее 50 МБ; минимальные пиксели: 50 x 50 пикселей; максимум пикселей 10 000 x 10 000 пикселей.
Извлечение данных модели документов идентификатора
Извлеките данные, включая имя, дату рождения и дату окончания срока действия, из документов идентификатора. Вам потребуются следующие ресурсы:
Подписка Azure — ее можно создать бесплатно.
Экземпляр аналитики документов в портал Azure. Вы можете использовать ценовую категорию "Бесплатный" (
F0
), чтобы поработать со службой. После развертывания ресурса выберите Перейти к ресурсу, чтобы получить ключ и конечную точку.
Примечание.
Document Intelligence Studio доступна с API версии 3.1 и версии 3.0 и более поздними версиями.
На домашней странице Document Intelligence Studio выберите документы удостоверений.
Вы можете проанализировать пример счета или отправить собственные файлы.
Нажмите кнопку "Выполнить анализ", а при необходимости настройте параметры анализа:
Средство разработки меток аналитики документов
Перейдите к инструменту аналитики документов.
На домашней странице примера инструмента выберите предварительно созданную модель, чтобы получить плитку данных .
Выберите тип формы для анализа из раскрывающегося меню.
Выберите URL-адрес для файла, который необходимо проанализировать, в одном из следующих вариантов:
В поле Источник выберите URL-адрес в раскрывающемся меню, вставьте выбранный URL-адрес и нажмите кнопку Получить.
В поле конечной точки службы аналитики документов вставьте конечную точку, полученную в подписке Аналитики документов.
В поле ключа вставьте ключ, полученный из ресурса аналитики документов.
Щелкните элемент Run analysis (Выполнить анализ). Средство аналитики документов вызывает предварительно созданный API анализа и анализирует документ.
Просмотрите результаты. Просмотрите пары "ключ-значение", извлеченные, элементы строки, извлеченные текст и обнаруженные таблицы.
Скачайте выходной файл в формате JSON для просмотра подробных результатов.
- Узел readResults содержит каждую строку текста и соответствующее расположение ограничивающего прямоугольника на странице.
- Узел selectionMarks отображает каждую метку выбора (флажок, переключатель) и указывает, выбрано ли его состояние или не выбрано.
- В разделе pageResults содержатся извлеченные таблицы. Для каждой таблицы аналитика документов извлекает текст, индекс строки и столбца, диапазон строк и столбцов, ограничивающее поле и многое другое.
- Поле documentResults содержит сведения о парах "ключ-значение" и об элементах строк для наиболее релевантных частей документа.
Примечание.
Пример средства маркировки данных не поддерживает файлы в формате BMP. Это ограничение средства, а не службы аналитики документов.
Поддерживаемые типы документов
Область/регион | Типы документов |
---|---|
По всему миру | Passport Book, Passport Card |
Соединенные Штаты | Водительская лицензия, идентификационный карточка, разрешение на проживание (зеленая карта), карточка социального страхования, военный идентификатор |
Европа | Водительское удостоверение, идентификационный карточка, разрешение на проживание |
Индия | Водительские лицензии, PAN Card, Aadhaar Card |
Канада | Водительская лицензия, идентификационный карточка, разрешение на проживание (карта maple) |
Австралия | Водительская лицензия, фотокарта, идентификатор ключа (включая цифровую версию) |
Извлечение полей
Сведения о поддерживаемых полях извлечения документов см. на странице схемы модели идентификаторов в примере репозитория GitHub.
Поддерживаемые типы документов
Модель документов id в настоящее время поддерживает лицензии водителя США и биографическую страницу из международных паспортов (за исключением виз и других документов для путешествий).
Извлеченные поля
Имя. | Тип | Описание | Значение |
---|---|---|---|
Country | country | Код страны соответствует стандарту ISO 3166 | "USA" |
dateOfBirth | Дата | Дата рождения в формате ГГГГ-ММ-ДД | "1980-01-01" |
DateOfExpiration | Дата | Дата окончания срока действия в формате ГГГГ-ММ-ДД | "2019-05-05" |
DocumentNumber | строка | Соответствующий номер паспорта, номер водительских прав и т. д. | "340020013" |
FirstName | строка | Извлеченные имя и инициалы, если применимо | "JENNIFER" |
LastName | строка | Извлеченная фамилия | "BROOKS" |
Национальность | country | Код страны соответствует стандарту ISO 3166 | "USA" |
Пол | пол | Возможные извлеченные значения включают "M" "F" "X" | "F" |
MachineReadableZone | объект | Извлеченный паспорт MRZ , включая две строки из 44 символов каждый |
"P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816" |
DocumentType | строка | Тип документа, например паспорт, водительские права | "passport" |
Адрес | строка | Извлеченный адрес (только для водительских прав) | "123 УЛИЦА ГОРОД WA 99999-1234" |
Область/регион | строка | Извлеченный регион, штат, провинция и т. д. (только для водительских прав) | "Washington" |
Руководство по миграции
- Следуйте руководству по миграции с помощью аналитики документов версии 3.1, чтобы узнать, как использовать версию версии 3.0 в приложениях и рабочих процессах.
Следующие шаги
Попробуйте обработать собственные формы и документы с помощью Document Intelligence Studio.
Выполните краткое руководство по анализу документов и начните создавать приложение для обработки документов на выбранном языке разработки.
Попробуйте обработать собственные формы и документы с помощью средства проверки меток для аналитики документов.
Выполните краткое руководство по анализу документов и начните создавать приложение для обработки документов на выбранном языке разработки.