Модель кредитной карты аналитики документов
Это содержимое относится к: версии 4.0 (предварительная версия)
Модель кредитной и дебетовой карты аналитики документов использует мощные возможности оптического распознавания символов (OCR) для анализа и извлечения ключевых полей из кредитных и дебетовых карт. Кредитные карты и дебетовые карты могут иметь различные форматы и качество, включая изображения, захваченные телефоном, сканированные документы и цифровые PDF-файлы. API анализирует текст документа; извлекает ключевые сведения, такие как номер карты, выдача банка и дата окончания срока действия; и возвращает структурированное представление данных JSON. В настоящее время модель поддерживает форматы документов на английском языке.
Автоматическая обработка карточек
Автоматическая обработка кредитной и дебетовой карты — это процесс извлечения ключевых полей из банковских карт. Исторически процесс анализа банковских карт достигается вручную и, следовательно, очень много времени. Точное извлечение ключевых данных из банковских карт обычно является первым и одним из наиболее важных шагов в процессе автоматизации контрактов.
Варианты разработки
Аналитика документов версии 4.0 (2024-02-29-preview) поддерживает следующие средства, приложения и библиотеки:
Функция | Ресурсы | Model ID |
---|---|---|
Модель контракта | • Аналитика документов• REST API • ПАКЕТ SDK для C# • Пакет SDK для Python• Пакет SDK для Java • Пакет SDK java для JavaScript |
предварительно созданная кредитная карта |
Требования к входным данным
Для получения наилучших результатов предоставьте одну четкую фотографию или скан-копию документа высокого качества.
Поддерживаемые форматы файлов:
Модель PDF Изображение:
JPEG/JPG, PNG, BMP, TIFF, HEIFMicrosoft Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX) и HTMLЧитать ✔ ✔ ✔ Макет ✔ ✔ ✔ (2024-02-29-preview, 2023-10-31-preview) Документ общего назначения ✔ ✔ Готовое ✔ ✔ Настраиваемая функция извлечения ✔ ✔ Настраиваемая классификация ✔ ✔ ✔ (2024-02-29-preview) В файлах формата PDF и TIFF обрабатывается до 2000 страниц (с подпиской уровня "Бесплатный" обрабатываются только первые две страницы).
Размер файла для анализа документов составляет 500 МБ для платного уровня (S0) и 4 МБ для бесплатного уровня (F0).
Изображения должны иметь размеры в пределах от 50 x 50 до 10 000 x 10 000 пикселей.
Если PDF-файлы заблокированы паролем, перед отправкой необходимо снять блокировку.
Минимальная высота извлекаемого текста составляет 12 пикселей для изображения размером 1024 x 768 пикселей. Это измерение соответствует тексту о
8
точке в 150 точек на дюйм (DPI).Для обучения пользовательской модели максимальный объем обучающих данных составляет 500 страниц для пользовательской модели шаблона и 50 000 страниц для пользовательской нейронной модели.
Для обучения пользовательской модели извлечения общий размер обучающих данных составляет 50 МБ для модели шаблона и 1G-МБ для нейронной модели.
Для обучения пользовательской модели классификации общий размер обучающих данных составляет
1GB
не более 10 000 страниц.
Попробуйте извлечь данные кредитной карты
Чтобы узнать, как работает извлечение данных для службы кредитной и дебетовой карты, вам потребуется следующее:
Подписка Azure — ее можно создать бесплатно.
Экземпляр аналитики документов в портал Azure. Вы можете использовать ценовую категорию "Бесплатный" (
F0
), чтобы поработать со службой. После развертывания ресурса выберите Перейти к ресурсу, чтобы получить ключ и конечную точку.
Document Intelligence Studio
На домашней странице Document Intelligence Studio выберите кредитную или дебетовую карту.
Вы можете проанализировать примеры налоговых документов или отправить собственные файлы.
Нажмите кнопку "Выполнить анализ ", а при необходимости настройте параметры анализа:
Поддерживаемые языки и языковые стандарты
См . страницу предварительно созданных моделей для полного списка поддерживаемых языков.
Извлечение полей
Ниже приведены поля, извлеченные из контракта в ответе выходных данных JSON.
Имя. | Тип | Описание | Пример результата |
---|---|---|---|
CardNumber | Строка | Уникальный идентификатор карточки | 4275 0000 0000 0000 |
Выдающий банк | Строка | Имя банка, выдавшего карту | Woodgrove Bank |
PaymentNetwork | Строка | Сеть оплаты, обрабатывающая транзакцию карты | VISA |
CardHolderName | Строка | Имя лица, которому принадлежит карточка | ДЖОН СМИТ |
CardHolderCompanyName | Строка | Имя компании, с которым связана карточка | Contoso, Ltd. |
ValidDate | Дата | Допустимый из даты | 01/16 |
ExpirationDate | Дата | Срок действия | 01/19 |
CardVerificationValue | Строка | Значение проверки карты (CVV) | 764 |
CustomerServicePhoneNumbers | Массив | Список номеров поддержки | +1 (555) 123-4567 |
Пары "ключ-значение" банковских карт и извлеченные элементы строки находятся в documentResults
разделе выходных данных JSON.
Следующие шаги
Попробуйте обработать собственные формы и документы с помощью Document Intelligence Studio.
Выполните краткое руководство по анализу документов и начните создавать приложение для обработки документов на выбранном языке разработки.
Обратная связь
https://aka.ms/ContentUserFeedback.
Ожидается в ближайшее время: в течение 2024 года мы постепенно откажемся от GitHub Issues как механизма обратной связи для контента и заменим его новой системой обратной связи. Дополнительные сведения см. в разделеОтправить и просмотреть отзыв по