Модель квитанции аналитики документов

Внимание

  • Выпуски общедоступной предварительной версии Document Intelligence предоставляют ранний доступ к функциям, которые находятся в активной разработке.
  • Функции, подходы и процессы могут изменяться до общедоступной доступности на основе отзывов пользователей.
  • Общедоступная предварительная версия клиентских библиотек Аналитики документов по умолчанию использует rest API версии 2024-02-29-preview.
  • Общедоступная предварительная версия 2024-02-29-preview в настоящее время доступна только в следующих регионах Azure:
  • Восточная часть США
  • Западная часть США2
  • Западная Европа

Это содержимое относится к:v4.0 (предварительная версия) | Предыдущие версии:синий проверка markфлажокv3.1 (GA)v3.0 (GA)синий проверка markсиний проверка markv2.1 (GA)

Это содержимое относится к:v3.1 (GA)Последняя версияфиолетовый проверка mark:v4.0 (предварительная версия) | | Предыдущие версии:флажоксиний проверка markv3.0синий проверка markверсии 2.1

Это содержимое относится к:v3.0 (GA) | Последние версии:фиолетовый проверка markv4.0 (предварительная версия)фиолетовый проверка mark3.1 | Предыдущая версия:флажоксиний проверка markv2.1

Это содержимое относится к:v2.1 Последняя версиясиний проверка mark:флажокv4.0 (предварительная версия) |

Модель квитанции аналитики документов объединяет мощные возможности оптического распознавания символов (OCR) с моделями глубокого обучения для анализа и извлечения ключевых сведений из квитанций о продажах. Квитанции могут иметь различные форматы и качество, они могут быть не только печатными, но и рукописными. API извлекает ключевые сведения, такие как имя и номер телефона продавца, дата транзакции, налог, итоговая сумма транзакции, и возвращает структурированные данные JSON.

Поддерживаемые типы квитанций:

  • Термальных
  • Кредитная карта
  • Gas
  • Парковка
  • Отель
  • сторонними
  • Коммуникации
  • Развлечения
  • Перелет
  • Обучение
  • Аптека или медицинское

Извлечение данных квитанции

Оцифровка квитанций включает преобразование различных типов квитанций, включая сканированные, сфотографированные и печатные копии, в цифровой формат для упрощенной обработки нижестоящего потока. Примеры включают управление затратами, анализ поведения потребителей, автоматизацию налогов и т. д. Использование технологии аналитики документов с OCR (оптическое распознавание символов) может извлекать и интерпретировать данные из этих различных форматов квитанций. Обработка аналитики документов упрощает процесс преобразования, но также значительно сокращает необходимое время и усилия, что упрощает эффективное управление данными и получение.

Пример квитанции, обработанный с помощью Document Intelligence Studio:

Снимок экрана: пример квитанции, обработанный в Студии аналитики документов.

Пример квитанции, обрабатываемый с помощью средства проверки меток аналитики документов:

Снимок экрана: пример квитанции, обработанный с помощью средства маркировки образца формы.

Варианты разработки

Аналитика документов версии 4.0 (2024-02-29-preview, 2023-10-31-preview) поддерживает следующие средства, приложения и библиотеки:

Функция Ресурсы Model ID
Модель получения Аналитика
документов• REST API
• ПАКЕТ SDK
для C#

• Пакет SDK для Python• Пакет SDK для Java • Пакет SDK
java для JavaScript
prebuilt-receipt

Аналитика документов версии 3.1 поддерживает следующие средства, приложения и библиотеки:

Функция Ресурсы Model ID
Модель получения Аналитика
документов• REST API
• ПАКЕТ SDK
для C#

• Пакет SDK для Python• Пакет SDK для Java • Пакет SDK
java для JavaScript
prebuilt-receipt

Аналитика документов версии 3.0 поддерживает следующие средства, приложения и библиотеки:

Функция Ресурсы Model ID
Модель получения Аналитика
документов• REST API
• ПАКЕТ SDK
для C#

• Пакет SDK для Python• Пакет SDK для Java • Пакет SDK
java для JavaScript
prebuilt-receipt

Аналитика документов версии 2.1 поддерживает следующие средства, приложения и библиотеки:

Функция Ресурсы
Модель получения Средство
аналитики документов • REST API
пакет SDK
для клиентской библиотеки • Контейнер Docker аналитики документов

Требования к входным данным

  • Для получения наилучших результатов предоставьте одну четкую фотографию или скан-копию документа высокого качества.

  • Поддерживаемые форматы файлов:

    Модель PDF Изображение:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) и HTML
    Читать
    Макет ✔ (2024-02-29-preview, 2023-10-31-preview)
    Документ общего назначения
    Готовое
    Настраиваемая функция извлечения
    Настраиваемая классификация ✔ (2024-02-29-preview)
  • В файлах формата PDF и TIFF обрабатывается до 2000 страниц (с подпиской уровня "Бесплатный" обрабатываются только первые две страницы).

  • Размер файла для анализа документов составляет 500 МБ для платного уровня (S0) и 4 МБ бесплатного уровня (F0).

  • Изображения должны иметь размеры в пределах от 50 x 50 до 10 000 x 10 000 пикселей.

  • Если PDF-файлы заблокированы паролем, перед отправкой необходимо снять блокировку.

  • Минимальная высота извлекаемого текста составляет 12 пикселей для изображения размером 1024 x 768 пикселей. Это измерение соответствует тексту о 8точке в 150 точек на дюйм (DPI).

  • Для обучения пользовательской модели максимальный объем обучающих данных составляет 500 страниц для пользовательской модели шаблона и 50 000 страниц для пользовательской нейронной модели.

    • Для обучения пользовательской модели извлечения общий размер обучающих данных составляет 50 МБ для модели шаблона и 1G-МБ для нейронной модели.

    • Для обучения пользовательской модели классификации общий размер обучающих данных составляет 1GB не более 10 000 страниц.

  • Поддерживаемые форматы файлов: JPEG, PNG, PDF и TIFF.
  • Поддерживаемая квота на страницы для PDF и TIFF: Аналитика документов может обрабатывать до 2000 страниц для подписчиков уровня "Стандартный" или только первые две страницы для подписчиков бесплатного уровня.
  • Поддерживаемый размер файла: менее 50 МБ; минимальный размер пикселей 50 x 50 пикселей; максимум 10 000 x 10 000 пикселей.

Извлечение данных модели квитанций

Узнайте, как аналитика документов извлекает данные, включая время и дату транзакций, сведения о продавце и суммы из квитанций. Вам потребуются следующие ресурсы:

  • Подписка Azure — ее можно создать бесплатно.

  • Экземпляр аналитики документов в портал Azure. Вы можете использовать ценовую категорию "Бесплатный" (F0), чтобы поработать со службой. После развертывания ресурса выберите Перейти к ресурсу, чтобы получить ключ и конечную точку.

Снимок экрана: расположение ключей и конечной точки на портале Azure.

Примечание.

Document Intelligence Studio доступна с API версии 3.1 и версии 3.0 и более поздними версиями.

  1. На домашней странице Document Intelligence Studio выберите "Квитанции".

  2. Вы можете проанализировать пример квитанции или отправить собственные файлы.

  3. Нажмите кнопку "Выполнить анализ", а при необходимости настройте параметры анализа:

    Снимок экрана: кнопки

Средство разработки меток аналитики документов

  1. Перейдите к инструменту аналитики документов.

  2. На домашней странице примера инструмента выберите предварительно созданную модель, чтобы получить плитку данных .

    Снимок экрана: процесс анализа результатов модели макета.

  3. Выберите тип формы для анализа из раскрывающегося меню.

  4. Выберите URL-адрес для файла, который необходимо проанализировать, в одном из следующих вариантов:

  5. В поле Источник выберите URL-адрес в раскрывающемся меню, вставьте выбранный URL-адрес и нажмите кнопку Получить.

    Снимок экрана с раскрывающимся меню расположения источника.

  6. В поле конечной точки службы аналитики документов вставьте конечную точку, полученную в подписке Аналитики документов.

  7. В поле ключа вставьте ключ, полученный из ресурса аналитики документов.

    Снимок экрана: раскрывающееся меню

  8. Щелкните элемент Run analysis (Выполнить анализ). Средство аналитики документов вызывает предварительно созданный API анализа и анализирует документ.

  9. Просмотрите результаты. Просмотрите пары "ключ-значение", извлеченные, элементы строки, извлеченные текст и обнаруженные таблицы.

    Снимок экрана: операция анализа результатов модели макета.

Примечание.

Пример средства маркировки данных не поддерживает файлы в формате BMP. Это ограничение средства, а не службы аналитики документов.

Поддерживаемые языки и языковые стандарты

См . страницу предварительно созданных моделей для полного списка поддерживаемых языков.

Извлечение полей

Имя. Тип Описание Стандартизованные выходные данные
ReceiptType Строка Тип уведомления о продажах Itemized
MerchantName Строка Имя продавца, выдавшего квитанцию
MerchantPhoneNumber phoneNumber Указанные номера телефонов продавца +1 xxx xxx xxxx
MerchantAddress Строка Указанный адрес продавца
TransactionDate Дата Дата выдачи квитанции гггг-мм-дд
TransactionTime Время Время выдачи квитанции чч-мм-сс (24 часа)
Итог Число (долл. США) Полная сумма транзакции по квитанции Число с плавающей точкой и двумя десятичными знаками
Промежуточный итог Число (долл. США) Промежуточная сумма квитанции, часто перед вычетом налогов Число с плавающей точкой и двумя десятичными знаками
Налоги Число (долл. США) Общий налог на получение (часто налог на продажу или эквивалентный). Переименовано в TotalTax в версии 2022-06-30. Число с плавающей точкой и двумя десятичными знаками
Совет Число (долл. США) Чаевые покупателя Число с плавающей точкой и двумя десятичными знаками
Товаров Массив объектов Извлеченные позиции с именем, количеством, ценой за единицу и общей ценой
Имя. Строка Описание элемента. Переименовано в Description в версии 2022-06-30.
Количество Число Количество по каждой позиции Число с плавающей точкой и двумя десятичными знаками
Цена, Число Отдельная цена за единицу по каждой позиции Число с плавающей точкой и двумя десятичными знаками
Общая стоимость Число Общая цена позиции Число с плавающей точкой и двумя десятичными знаками

Аналитика документов версии 3.0 и более поздних версий содержит несколько новых функций и возможностей. В дополнение к тепловым квитанциям модель квитанций поддерживает обработку квитанций о одностраничных отелях и извлечение налоговых сведений для всех типов квитанций.

Аналитика документов версии 4.0 и более поздних версий предоставляет поддержку валюты для всех полей, связанных с ценами, для тепловых и гостиничных квитанций.

Получение

Поле Тип Описание Пример
MerchantName string Имя продавца, выдавшего квитанцию Contoso
MerchantPhoneNumber phoneNumber Указанные номера телефонов продавца 987-654-3210
MerchantAddress address Указанный адрес продавца 123 Главный Сент-Редмонд, Вашингтон 98052
Total number Полная сумма транзакции по квитанции 14,34 долл.
TransactionDate date Дата выдачи квитанции 06 июня 2019 г.
TransactionTime time Время выдачи квитанции 16:49
Subtotal number Промежуточная сумма квитанции, часто перед вычетом налогов 12,34 долл.
TotalTax number Налог на получение, часто налог на продажу или эквивалентный $2,00
Tip number Чаевые покупателя 1,00 долл.
Items array
Items.* object Извлеченный элемент строки 1
Surface Pro 6
999,00 долл. США
999,00 долл. США
Items.*.TotalPrice number Общая цена позиции 999,00 долл. США
Items.*.Description string Описание номенклатуры Surface Pro 6
Items.*.Quantity number Количество по каждой позиции 1
Items.*.Price number Отдельная цена за единицу по каждой позиции 999,00 долл. США
Items.*.ProductCode string Код продукта, номер продукта или номер SKU конкретной позиции A123
Items.*.QuantityUnit string Единица количества каждого элемента
TaxDetails array
TaxDetails.* object Извлеченный элемент строки 1
Surface Pro 6
999,00 долл. США
999,00 долл. США
TaxDetails.*.Amount currency Сумма налоговых сведений 999,00 долл. США

receipt.retailMeal

Поле Тип Описание Пример
MerchantName string Имя продавца, выдавшего квитанцию Contoso
MerchantPhoneNumber phoneNumber Указанные номера телефонов продавца 987-654-3210
MerchantAddress address Указанный адрес продавца 123 Главный Сент-Редмонд, Вашингтон 98052
Total number Полная сумма транзакции по квитанции 14,34 долл.
TransactionDate date Дата выдачи квитанции 06 июня 2019 г.
TransactionTime time Время выдачи квитанции 16:49
Subtotal number Промежуточная сумма квитанции, часто перед вычетом налогов 12,34 долл.
TotalTax number Налог на получение, часто налог на продажу или эквивалентный $2,00
Tip number Чаевые покупателя 1,00 долл.
Items array
Items.* object Извлеченный элемент строки 1
Surface Pro 6
999,00 долл. США
999,00 долл. США
Items.*.TotalPrice number Общая цена позиции 999,00 долл. США
Items.*.Description string Описание номенклатуры Surface Pro 6
Items.*.Quantity number Количество по каждой позиции 1
Items.*.Price number Отдельная цена за единицу по каждой позиции 999,00 долл. США
Items.*.ProductCode string Код продукта, номер продукта или номер SKU конкретной позиции A123
Items.*.QuantityUnit string Единица количества каждого элемента
TaxDetails array
TaxDetails.* object Извлеченный элемент строки 1
Surface Pro 6
999,00 долл. США
999,00 долл. США
TaxDetails.*.Amount currency Сумма налоговых сведений 999,00 долл. США

receipt.creditCard

Поле Тип Описание Пример
MerchantName string Имя продавца, выдавшего квитанцию Contoso
MerchantPhoneNumber phoneNumber Указанные номера телефонов продавца 987-654-3210
MerchantAddress address Указанный адрес продавца 123 Главный Сент-Редмонд, Вашингтон 98052
Total number Полная сумма транзакции по квитанции 14,34 долл.
TransactionDate date Дата выдачи квитанции 06 июня 2019 г.
TransactionTime time Время выдачи квитанции 16:49
Subtotal number Промежуточная сумма квитанции, часто перед вычетом налогов 12,34 долл.
TotalTax number Налог на получение, часто налог на продажу или эквивалентный $2,00
Tip number Чаевые покупателя 1,00 долл.
Items array
Items.* object Извлеченный элемент строки 1
Surface Pro 6
999,00 долл. США
999,00 долл. США
Items.*.TotalPrice number Общая цена позиции 999,00 долл. США
Items.*.Description string Описание номенклатуры Surface Pro 6
Items.*.Quantity number Количество по каждой позиции 1
Items.*.Price number Отдельная цена за единицу по каждой позиции 999,00 долл. США
Items.*.ProductCode string Код продукта, номер продукта или номер SKU конкретной позиции A123
Items.*.QuantityUnit string Единица количества каждого элемента
TaxDetails array
TaxDetails.* object Извлеченный элемент строки 1
Surface Pro 6
999,00 долл. США
999,00 долл. США
TaxDetails.*.Amount currency Сумма налоговых сведений 999,00 долл. США

receipt.gas

Поле Тип Описание Пример
MerchantName string Имя продавца, выдавшего квитанцию Contoso
MerchantPhoneNumber phoneNumber Указанные номера телефонов продавца 987-654-3210
MerchantAddress address Указанный адрес продавца 123 Главный Сент-Редмонд, Вашингтон 98052
Total number Полная сумма транзакции по квитанции 14,34 долл.
TransactionDate date Дата выдачи квитанции 06 июня 2019 г.
TransactionTime time Время выдачи квитанции 16:49
Subtotal number Промежуточная сумма квитанции, часто перед вычетом налогов 12,34 долл.
TotalTax number Налог на получение, часто налог на продажу или эквивалентный $2,00
Tip number Чаевые покупателя 1,00 долл.
Items array
Items.* object Извлеченный элемент строки 1
Surface Pro 6
999,00 долл. США
999,00 долл. США
Items.*.TotalPrice number Общая цена позиции 999,00 долл. США
Items.*.Description string Описание номенклатуры Surface Pro 6
Items.*.Quantity number Количество по каждой позиции 1
Items.*.Price number Отдельная цена за единицу по каждой позиции 999,00 долл. США
Items.*.ProductCode string Код продукта, номер продукта или номер SKU конкретной позиции A123
Items.*.QuantityUnit string Единица количества каждого элемента
TaxDetails array
TaxDetails.* object Извлеченный элемент строки 1
Surface Pro 6
999,00 долл. США
999,00 долл. США
TaxDetails.*.Amount currency Сумма налоговых сведений 999,00 долл. США

receipt.parking

Поле Тип Описание Пример
MerchantName string Имя продавца, выдавшего квитанцию Contoso
MerchantPhoneNumber phoneNumber Указанные номера телефонов продавца 987-654-3210
MerchantAddress address Указанный адрес продавца 123 Главный Сент-Редмонд, Вашингтон 98052
Total number Полная сумма транзакции по квитанции 14,34 долл.
TransactionDate date Дата выдачи квитанции 06 июня 2019 г.
TransactionTime time Время выдачи квитанции 16:49
Subtotal number Промежуточная сумма квитанции, часто перед вычетом налогов 12,34 долл.
TotalTax number Налог на получение, часто налог на продажу или эквивалентный $2,00
Tip number Чаевые покупателя 1,00 долл.
Items array
Items.* object Извлеченный элемент строки 1
Surface Pro 6
999,00 долл. США
999,00 долл. США
Items.*.TotalPrice number Общая цена позиции 999,00 долл. США
Items.*.Description string Описание номенклатуры Surface Pro 6
Items.*.Quantity number Количество по каждой позиции 1
Items.*.Price number Отдельная цена за единицу по каждой позиции 999,00 долл. США
Items.*.ProductCode string Код продукта, номер продукта или номер SKU конкретной позиции A123
Items.*.QuantityUnit string Единица количества каждого элемента
TaxDetails array
TaxDetails.* object Извлеченный элемент строки 1
Surface Pro 6
999,00 долл. США
999,00 долл. США
TaxDetails.*.Amount currency Сумма налоговых сведений 999,00 долл. США

receipt.hotel

Поле Тип Описание Пример
MerchantName string Имя продавца, выдавшего квитанцию Contoso
MerchantPhoneNumber phoneNumber Указанные номера телефонов продавца 987-654-310
MerchantAddress address Указанный адрес продавца 123 Главный Сент-Редмонд, Вашингтон 98052
Total number Полная сумма транзакции по квитанции 14,34 долл.
ArrivalDate date Дата прибытия 27Mar21
DepartureDate date Дата отправления 28Mar21
Currency string Валютная единица квитанций (ISO 4217) или MIXED, если найдено несколько значений USD
MerchantAliases array
MerchantAliases.* string Альтернативное имя продавца Contoso (R)
Items array
Items.* object Извлеченный элемент строки 1
Surface Pro 6
999,00 долл. США
999,00 долл. США
Items.*.TotalPrice number Общая цена позиции 999,00 долл. США
Items.*.Description string Описание номенклатуры Плата за номер
Items.*.Date date Дата элемента 27Mar21
Items.*.Category string Категория элементов Комната

Руководство по миграции и REST API версии 3.1

  • Следуйте руководству по миграции с помощью аналитики документов версии 3.1, чтобы узнать, как использовать версию 3.1 в приложениях и рабочих процессах.

Следующие шаги

  • Попробуйте обработать собственные формы и документы с помощью Document Intelligence Studio.

  • Выполните краткое руководство по анализу документов и начните создавать приложение для обработки документов на выбранном языке разработки.

  • Попробуйте обработать собственные формы и документы с помощью средства проверки меток для аналитики документов.

  • Выполните краткое руководство по анализу документов и начните создавать приложение для обработки документов на выбранном языке разработки.