Модель счета аналитики документов

Внимание

  • Выпуски общедоступной предварительной версии Document Intelligence предоставляют ранний доступ к функциям, которые находятся в активной разработке.
  • Функции, подходы и процессы могут изменяться до общедоступной доступности на основе отзывов пользователей.
  • Общедоступная предварительная версия клиентских библиотек Аналитики документов по умолчанию использует rest API версии 2024-02-29-preview.
  • Общедоступная предварительная версия 2024-02-29-preview в настоящее время доступна только в следующих регионах Azure:
  • Восточная часть США
  • Западная часть США2
  • Западная Европа

Это содержимое относится к:v4.0 (предварительная версия) | Предыдущие версии:синий проверка markфлажокv3.1 (GA)v3.0 (GA)синий проверка markсиний проверка markv2.1 (GA)

Это содержимое относится к:v3.1 (GA)Последняя версияфиолетовый проверка mark:v4.0 (предварительная версия) | | Предыдущие версии:флажоксиний проверка markv3.0синий проверка markверсии 2.1

Это содержимое относится к:v3.0 (GA) | Последние версии:фиолетовый проверка markv4.0 (предварительная версия)фиолетовый проверка mark3.1 | Предыдущая версия:флажоксиний проверка markv2.1

Это содержимое относится к:v2.1 Последняя версиясиний проверка mark:флажокv4.0 (предварительная версия) |

Модель счета аналитики документов использует мощные возможности оптического распознавания символов (OCR) для анализа и извлечения ключевых полей и элементов строки из счетов по продажам, счетов за служебные услуги и заказов на покупку. Счета могут иметь различные форматы и качество изображения, включая фотографии, полученные с камеры телефона, отсканированные документы и цифровые PDF-файлы. API анализирует текст счета, извлекает ключевые сведения (например, имя заказчика, адрес выставления счета, дату и сумму оплаты) и возвращает структурированное представление данных в формате JSON. В настоящее время модель поддерживает счета на 27 языках.

Поддерживаемые типы документов:

  • Счета
  • Счета за коммунальные услуги
  • Заказы на продажу
  • Заказы на покупку

Автоматическая обработка счетов

Автоматическая обработка счетов — это процесс извлечения полей с оплатой ключевых счетов из документов счета выставления счетов. Извлеченные данные включают элементы строк из счетов, интегрированных с рабочими процессами с оплатой счетов (AP) для проверок и платежей. Исторически процесс оплаты счетов выполняется вручную и, следовательно, очень много времени. Точное извлечение ключевых данных из счетов обычно является первым и одним из наиболее важных шагов в процессе автоматизации счетов.

Пример счета, обработанного с помощью Document Intelligence Studio:

Снимок экрана: пример счета, проанализированного в Студии аналитики документов.

Пример счета, обработанный с помощью средства создания меток для аналитики документов:

Снимок экрана с примером накладной.

Варианты разработки

Аналитика документов версии 4.0 (2024-02-29-preview, 2023-10-31-preview) поддерживает следующие средства, приложения и библиотеки:

Функция Ресурсы Model ID
Модель накладных Аналитика
документов• REST API
• ПАКЕТ SDK
для C#

• Пакет SDK для Python• Пакет SDK для Java • Пакет SDK
java для JavaScript
prebuilt-invoice

Аналитика документов версии 3.1 поддерживает следующие средства, приложения и библиотеки:

Функция Ресурсы Model ID
Модель накладных Аналитика
документов• REST API
• ПАКЕТ SDK
для C#

• Пакет SDK для Python• Пакет SDK для Java • Пакет SDK
java для JavaScript
prebuilt-invoice

Аналитика документов версии 3.0 поддерживает следующие средства, приложения и библиотеки:

Функция Ресурсы Model ID
Модель накладных Аналитика
документов• REST API
• ПАКЕТ SDK
для C#

• Пакет SDK для Python• Пакет SDK для Java • Пакет SDK
java для JavaScript
prebuilt-invoice

Аналитика документов версии 2.1 поддерживает следующие средства, приложения и библиотеки:

Функция Ресурсы
Модель накладных Средство
аналитики документов • REST API
пакет SDK
для клиентской библиотеки • Контейнер Docker аналитики документов

Требования к входным данным

  • Для получения наилучших результатов предоставьте одну четкую фотографию или скан-копию документа высокого качества.

  • Поддерживаемые форматы файлов:

    Модель PDF Изображение:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) и HTML
    Читать
    Макет ✔ (2024-02-29-preview, 2023-10-31-preview)
    Документ общего назначения
    Готовое
    Настраиваемая функция извлечения
    Настраиваемая классификация ✔ (2024-02-29-preview)
  • В файлах формата PDF и TIFF обрабатывается до 2000 страниц (с подпиской уровня "Бесплатный" обрабатываются только первые две страницы).

  • Размер файла для анализа документов составляет 500 МБ для платного уровня (S0) и 4 МБ бесплатного уровня (F0).

  • Изображения должны иметь размеры в пределах от 50 x 50 до 10 000 x 10 000 пикселей.

  • Если PDF-файлы заблокированы паролем, перед отправкой необходимо снять блокировку.

  • Минимальная высота извлекаемого текста составляет 12 пикселей для изображения размером 1024 x 768 пикселей. Это измерение соответствует тексту о 8точке в 150 точек на дюйм (DPI).

  • Для обучения пользовательской модели максимальный объем обучающих данных составляет 500 страниц для пользовательской модели шаблона и 50 000 страниц для пользовательской нейронной модели.

    • Для обучения пользовательской модели извлечения общий размер обучающих данных составляет 50 МБ для модели шаблона и 1G-МБ для нейронной модели.

    • Для обучения пользовательской модели классификации общий размер обучающих данных составляет 1GB не более 10 000 страниц.

  • Поддерживаемые форматы файлов: JPEG, PNG, PDF и TIFF.
  • Обрабатываются поддерживаемые PDF-файлы и TIFF до 2000 страниц. Для подписчиков уровня "Бесплатный" обрабатываются только две первые страницы.
  • Поддерживаемый размер файла должен быть меньше 50 МБ и размеров не менее 50 x 50 пикселей и не более 10 000 x 10 000 пикселей.

Извлечение данных модели счета

Узнайте, как данные, включая сведения о клиентах, сведения о поставщике и элементы строки, извлекаются из счетов. Вам потребуются следующие ресурсы:

  • Подписка Azure — ее можно создать бесплатно.

  • Экземпляр аналитики документов в портал Azure. Вы можете использовать ценовую категорию "Бесплатный" (F0), чтобы поработать со службой. После развертывания ресурса выберите Перейти к ресурсу, чтобы получить ключ и конечную точку.

Снимок экрана: расположение ключей и конечной точки на портале Azure.

  1. На домашней странице Document Intelligence Studio выберите "Счета".

  2. Вы можете проанализировать пример счета или отправить собственные файлы.

  3. Нажмите кнопку "Выполнить анализ ", а при необходимости настройте параметры анализа:

    Снимок экрана: кнопки

Средство разработки меток аналитики документов

  1. Перейдите к инструменту аналитики документов.

  2. На домашней странице примера инструмента выберите предварительно созданную модель, чтобы получить плитку данных .

    Снимок экрана: процесс анализа результатов модели макета.

  3. Выберите тип формы для анализа из раскрывающегося меню.

  4. Выберите URL-адрес для файла, который необходимо проанализировать, в одном из следующих вариантов:

  5. В поле Источник выберите URL-адрес в раскрывающемся меню, вставьте выбранный URL-адрес и нажмите кнопку Получить.

    Снимок экрана с раскрывающимся меню расположения источника.

  6. В поле конечной точки службы аналитики документов вставьте конечную точку, полученную в подписке Аналитики документов.

  7. В поле ключа вставьте ключ, полученный из ресурса аналитики документов.

    Снимок экрана: раскрывающееся меню выбора типа.

  8. Щелкните элемент Run analysis (Выполнить анализ). Средство аналитики документов вызывает предварительно созданный API анализа и анализирует документ.

  9. Просмотрите результаты. Просмотрите пары "ключ-значение", извлеченные, элементы строки, извлеченные текст и обнаруженные таблицы.

    Снимок экрана: операция анализа результатов модели макета.

Примечание.

Пример средства маркировки данных не поддерживает файлы в формате BMP. Это ограничение средства, а не службы аналитики документов.

Поддерживаемые языки и языковые стандарты

См . страницу предварительно созданных моделей для полного списка поддерживаемых языков.

Извлечение полей

Имя. Тип Описание Стандартизованные выходные данные
CustomerName строка Заказчик по счету Корпорация Майкрософт
CustomerId строка Ссылочный идентификатор заказчика CID-12345
PurchaseOrder строка Ссылочный номер заказа на покупку PO-3333
InvoiceId строка Идентификатор этого конкретного счета (часто номер счета) INV-100
InvoiceDate Дата дата выдачи счета мм-дд-гггг
DueDate Дата Дата оплаты для этого счета должна быть вызвана мм-дд-гггг
VendorName строка Поставщик, создавший этот счет CONTOSO LTD.
VendorAddress address Почтовый адрес поставщика 123 456-й Санкт, Нью-йорк, NY 10001
VendorAddressRecipient строка Имя, связанное с VendorAddress Головные офисы Contoso
CustomerAddress address Почтовый адрес для Клиента 123 Other St, Redmond WA, 98052
CustomerAddressRecipient строка Имя, связанное с CustomerAddress Корпорация Майкрософт
BillingAddress address Действительный платежный адрес клиента 123 Bill St, Redmond, WA, 98052
BillingAddressRecipient строка Имя, связанное с BillingAddress Службы Microsoft
ShippingAddress address Действительный адрес доставки клиента 123 Ship St, Redmond WA, 98052
ShippingAddressRecipient строка Имя, связанное с ShippingAddress Доставка Майкрософт
Промежуточный итог валюта Поле промежуточного итога, определенное в этом счете 100,00 долларов США
TotalDiscount валюта Общая скидка, примененная к счету 5,00 долл. США
TotalTax валюта Поле общей суммы налога, определенной в этом счете 10,00 долларов США
InvoiceTotal валюта Всего новых расходов, связанных с этим счетом 10,00 долларов США
AmountDue валюта Общая сумма, причитающаяся поставщику $610
PreviousUnpaidBalance валюта Действительный ранее невыплаченный остаток 500,00 долл.
RemittanceAddress address Действительный адрес для перевода или платежа клиента 123 Remit St New York, NY, 10001
RemittanceAddressRecipient строка Имя, связанное с RemittanceAddress Выставление счетов Contoso
ServiceAddress address Действительный адрес службы или адрес свойства для клиента 123 Service St, Redmond WA, 98052
ServiceAddressRecipient строка Имя, связанное с ServiceAddress Службы Microsoft
ServiceStartDate Дата Первая дата для периода обслуживания (например, период обслуживания счета) мм-дд-гггг
ServiceEndDate Дата Конечная дата для периода обслуживания (например, период обслуживания счета) мм-дд-гггг
VendorTaxId строка Номер налогоплательщика, связанный с поставщиком 123456-7
CustomerTaxId строка Номер налогоплательщика, связанный с заказчиком 765432-1
PaymentTerm строка Условия оплаты по счету Net90
KVKNumber строка Уникальный идентификатор для предприятий, зарегистрированных в Нидерландах (только NL) 12345678
CurrencyCode строка Код валюты, связанный с извлеченным объемом
PaymentDetails array Массив, содержащий сведения о варианте оплаты, например IBAN,SWIFT, BPayBillerCode(AU)BPayReference(AU)
TaxDetails array Массив, содержащий налоговые данные, такие как сумма и ставка
TaxDetails array Массив AN, содержащий добавленную налоговую информацию, например CGST, IGSTи SGST. В настоящее время этот элемент строки доступен только для Германии (), Испании (de), Португалии (ptes) и английского языка Канады (en-CA)

Массив элементов строки

Ниже приведены элементы строки, извлеченные из счета в ответе выходных данных JSON (следующие выходные данные используют этот пример счета:

Имя. Тип Описание Значение (стандартизованные выходные данные)
Сумма валюта Сумма позиции 60,00 долл.
Дата Дата Дата, соответствующая каждой позиции. Часто это дата отправки товара данной позиции 04.03.2021
Description строка Текстовое описание позиции счета Консультационные услуги
Количество number Количество для этой позиции счета 2
ProductCode строка Код продукта, номер продукта или номер SKU конкретной позиции A123
Налоги валюта Налог, связанный с каждой позицией. Возможные значения включают налоговую сумму и налог Y/N 6,00 долл. США
TaxRate строка Налоговая ставка, связанная с каждым элементом строки. 18%
Единица измерения строка Единица измерения позиции (например кг, фунт и т. д.) часов
UnitPrice number Чистая или фактурная цена (в зависимости от настройки фактурного счета) одной позиции 30,00 долларов США

Пары ключ-значение счета и извлеченные позиции находятся в разделе documentResults выходных данных JSON.

Пары "ключ-значение"

Предварительно созданный счет 2022-06-30 и более поздние выпуски поддерживают необязательный возврат пар "ключ-значение". По умолчанию возврат пар "ключ-значение" отключен. Пары "ключ-значение" — это отдельные фрагменты внутри счета, которые определяют метку или ключ и связанный с ними ответ или значение. В счете эти пары могут быть меткой и значением, введенным пользователем для этого поля или номера телефона. Модель искусственного интеллекта предназначена для извлечения идентифицируемых ключей и значений на основе широкого спектра типов документов, форматов и структур.

Ключи также могут существовать в изоляции, когда модель обнаруживает, что ключ существует, но с ним не связано ни одно значение, или при обработке необязательных полей. Например, поле промежуточного имени можно оставить пустым в форме в некоторых экземплярах. Пары "ключ-значение" всегда являются диапазонами текста, содержащегося в документе. Для документов, в которых одно и то же значение описано разными способами, например клиент или пользователь, связанный ключ является клиентом или пользователем (в зависимости от контекста).

Извлеченные поля

Служба счетов извлекает текст, таблицы и 26 полей счета. Ниже приведены поля, извлеченные из счета в ответе выходных данных JSON (следующие выходные данные используют этот пример счета).

Имя. Тип Описание Текст Значение (стандартизованные выходные данные)
CustomerName строка Клиент, которому выставляется счет Корпорация Майкрософт
CustomerId строка Ссылочный идентификатор для клиента CID-12345
PurchaseOrder строка Ссылочный номер заказа на покупку PO-3333
InvoiceId строка Идентификатор для этого конкретного счета (часто "номер счета") INV-100
InvoiceDate Дата Дата выставления счета 15.11.2019 15.11.2019
DueDate Дата Дата оплаты этого счета 15.12.2019 15.12.2019
VendorName строка Поставщик, создавший счет CONTOSO
VendorAddress строка Почтовый адрес для Поставщика 123 456th Нью-Йорк, NY, 10001
VendorAddressRecipient строка Имя, связанное с VendorAddress Головные офисы Contoso
CustomerAddress строка Почтовый адрес для Клиента 123 Other Street, Редмонд, Вашингтон, 98052
CustomerAddressRecipient строка Имя, связанное с CustomerAddress Корпорация Майкрософт
BillingAddress строка Действительный платежный адрес клиента 123 Билл-стрит, Редмонд, Вашингтон, 98052
BillingAddressRecipient строка Имя, связанное с BillingAddress Службы Microsoft
ShippingAddress строка Действительный адрес доставки клиента 123 Ship Street, Редмонд, Вашингтон, 98052
ShippingAddressRecipient строка Имя, связанное с ShippingAddress Доставка Майкрософт
Промежуточный итог number Поле промежуточного итога, определенное в этом счете 100,00 долларов США 100
TotalTax number Поле общей суммы налога, определенной в этом счете 10,00 долларов США 10
InvoiceTotal number Всего новых расходов, связанных с этим счетом 110,00 долл. 110
AmountDue number Общая сумма, причитающаяся поставщику 610,00 долл. 610
ServiceAddress строка Действительный адрес службы или адрес свойства для клиента 123 Service Street, Редмонд, Вашингтон, 98052
ServiceAddressRecipient строка Имя, связанное с ServiceAddress Службы Microsoft
RemittanceAddress строка Действительный адрес для перевода или платежа клиента 123 Remit St New York, NY, 10001
RemittanceAddressRecipient строка Имя, связанное с RemittanceAddress Выставление счетов Contoso
ServiceStartDate Дата Первая дата для периода обслуживания (например, период обслуживания счета) 10/14/2019 2019-10-14
ServiceEndDate Дата Конечная дата для периода обслуживания (например, период обслуживания счета) 14.11.2019 14.11.2019
PreviousUnpaidBalance number Действительный ранее невыплаченный остаток 500,00 долл. 500

Ниже приведены элементы строки, извлеченные из счета в выходном ответе JSON, и используется этот пример счета:

Имя. Тип Описание Текст (позиция #1) Значение (стандартизованные выходные данные)
Товаров строка Строка полного текста строки данной позиции 04.03.2021 A123 Консультационные услуги 2 часа 30,00 долл. 10 % 60,00 долл.
Сумма number Сумма позиции 60,00 долл. 100
Description строка Текстовое описание позиции счета Консультационные услуги Консультационные услуги
Количество number Количество для этой позиции счета 2 2
UnitPrice number Чистая или фактурная цена (в зависимости от настройки фактурного счета) одной позиции 30,00 долларов США 30
ProductCode строка Код продукта, номер продукта или номер SKU конкретной позиции A123
Единица измерения строка Единица измерения позиции (например кг, фунт и т. д.) hours
Дата Дата Дата, соответствующая каждой позиции. Часто это дата отправки товара данной позиции 04.03.2021 04.03.2021
Налоги number Налог, связанный с каждой позицией. Возможные значения: сумма налогов, налоговый % и налог Y/N 10%

Ниже приведены сложные поля, извлеченные из счета в ответе выходных данных JSON:

TaxDetails

Налоговые данные направлены на разбиение различных налогов, применяемых к общей сумме счета.

Имя. Тип Описание Текст (позиция #1) Значение (стандартизованные выходные данные)
Товаров строка Строка полнострочного текста налогового элемента V.A.T. 15% $ 60,00
Сумма number Сумма налога налоговой позиции 60,00 60
Ставка строка Налоговая ставка налогового пункта 15 %

PaymentDetails

Список всех обнаруженных параметров оплаты, обнаруженных в поле.

Имя. Тип Описание Текст (позиция #1) Значение (стандартизованные выходные данные)
IBAN строка Номер внутреннего банковского счета GB33BU КБ 20201555555555
SWIFT строка SWIFT-код BU КБ GB22
BPayBillerCode строка Австралийский код счета за счет B-Payer 12345
BPayReference строка Австралийский справочный код B-Pay 98765432100

Выходные данные JSON

Выходные данные JSON состоят из трех частей:

  • Узел "readResults" содержит весь распознанный текст и все метки выделения. Текст организован по страницам, а затем по строкам, а затем по отдельным словам.
  • "pageResults" узел содержит таблицы и ячейки, извлеченные с ограничивающими прямоугольниками, уверенностью и ссылкой на строки и слова в readResults.
  • В узле "documentResults" содержатся специфичные для счета значения и позиции, обнаруженные моделью. Здесь можно найти все поля из счета, например идентификатора счета, отправки, выставления счетов, клиента, общего объема, элементов строки и многое другое.

Руководство по миграции

  • Следуйте руководству по миграции с помощью аналитики документов версии 3.1, чтобы узнать, как использовать версию версии 3.0 в приложениях и рабочих процессах.

Следующие шаги

  • Попробуйте обработать собственные формы и документы с помощью Document Intelligence Studio.

  • Выполните краткое руководство по анализу документов и начните создавать приложение для обработки документов на выбранном языке разработки.

  • Попробуйте обработать собственные формы и документы с помощью средства проверки меток для аналитики документов.

  • Выполните краткое руководство по анализу документов и начните создавать приложение для обработки документов на выбранном языке разработки.