Поделиться через


Модель инструкции банка аналитики документов

Модель инструкции банка аналитики документов объединяет мощные возможности оптического распознавания символов (OCR) с моделями глубокого обучения для анализа и извлечения данных из банковских инструкций США. API анализирует печатные банковские выписки; извлекает ключевые сведения, такие как номер счета, банковские сведения, сведения о инструкции, сведения о транзакциях и сборы; и возвращает структурированное представление данных JSON. С помощью версии 4.0 GA теперь можно извлечь контрольные таблицы в банковских инструкциях США.

Функция версия Идентификатор модели
Модель банковских инструкций v4.0: 2024-11-30 (GA) prebuilt-bankStatement.us

Извлечение данных о банковских инструкциях

Банковский оператор помогает просматривать действия счета в течение указанного периода. Это официальное заявление, которое помогает выявлять мошенничество, отслеживать расходы, ошибки учета и записывать действия периода. Узнайте, как извлекаются данные с помощью prebuilt-bankStatement.us модели. Вам потребуются следующие ресурсы:

  • Подписка Azure — создайте бесплатную учетную запись

  • Экземпляр аналитики документов в портал Azure. Вы можете использовать ценовую категорию "Бесплатный" (F0), чтобы поработать со службой. После развертывания ресурса выберите Перейти к ресурсу, чтобы получить ключ и конечную точку.

    Снимок экрана: расположение ключей и конечной точки на портале Azure.

Document Intelligence Studio

  1. На домашней странице Document Intelligence Studio выберите банковские инструкции.

  2. Вы можете проанализировать пример банковского оператора или отправить собственные файлы.

  3. Нажмите кнопку "Выполнить анализ ", а при необходимости настройте параметры анализа:

    Снимок экрана: кнопки

Требования к входным данным

Поддерживаются следующие форматы файлов.

Модель PDF Изображение:
JPEG/JPG, PNG, BMP, TIFF, HEIF
Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Читать
Макет
Общий документ
Готовое
Настраиваемая функция извлечения
Настраиваемая классификация
  • Фотографии и сканы: для получения наилучших результатов укажите одну чистую фотографию или высококачественную проверку на документ.
  • PDF и TIFFs: для PDF-файлов и TIFFs можно обрабатывать до 2000 страниц. (С подпиской на бесплатный уровень обрабатываются только первые две страницы.)
  • Размер файла: размер файла для анализа документов составляет 500 МБ для платного уровня (S0) и 4 МБ для бесплатного уровня (F0).
  • Размеры изображения: размеры должны находиться в диапазоне от 50 пикселей до 10 000 пикселей x 10 000 пикселей.
  • Блокировки паролей. Если pdf-файлы заблокированы паролем, необходимо удалить блокировку перед отправкой.
  • Высота текста: минимальная высота извлеченного текста составляет 12 пикселей для изображения 1024 x 768 пикселей. Это измерение соответствует примерно 8-точечным тексту в 150 точек на дюйм.
  • Обучение пользовательской модели: максимальное количество страниц для обучающих данных составляет 500 для пользовательской модели шаблона и 50 000 для пользовательской нейронной модели.
  • Обучение пользовательской модели извлечения: общий размер обучающих данных составляет 50 МБ для модели шаблона и 1 ГБ для нейронной модели.
  • Обучение пользовательской модели классификации: общий размер обучающих данных составляет 1 ГБ, не более 10 000 страниц. Для 2024-11-30 (GA) общий размер обучающих данных составляет 2 ГБ с максимум 10 000 страниц.
  • Типы файлов Office (DOCX, XLSX, PPTX): максимальная длина строки составляет 8 миллионов символов.

Поддерживаемые языки и языковые стандарты

Полный список поддерживаемых языков см . на странице поддержки языка предварительно созданной модели.

Извлечение полей

Поддерживаемые поля извлечения документов см . на странице схемы модели банковских инструкций в нашем примере репозитория GitHub.

Поддерживаемые языковые стандарты

Prebuilt-bankStatement.us версии 2027-11-30 поддерживает языковой стандарт en-us.

Следующие шаги

  • Попробуйте обработать собственные формы и документы с помощью Document Intelligence Studio

  • Выполните краткое руководство по анализу документов и начните создавать приложение для обработки документов на выбранном языке разработки.