Поделиться через


Модель счета аналитики документов

Внимание

  • Выпуски общедоступной предварительной версии Document Intelligence предоставляют ранний доступ к функциям, которые находятся в активной разработке. Функции, подходы и процессы могут изменяться до общедоступной доступности на основе отзывов пользователей.
  • Общедоступная предварительная версия клиентских библиотек Аналитики документов по умолчанию использует REST API версии 2024-07-31-preview.
  • Общедоступная предварительная версия 2024-07-31-preview в настоящее время доступна только в следующих регионах Azure. Обратите внимание, что пользовательская модель создания (извлечение полей документов) в AI Studio доступна только в регионе "Северная часть США":
    • Восточная часть США
    • Западная часть США2
    • Западная Европа
    • Северная часть США

Это содержимое относится к: версии 4.0 (предварительная версия) | Предыдущие версии: флажоксиняя галочка версия 3.1 (GA) версии 3.0 (GA) синяя галочка версии 2.1 (GA) синяя галочка

Это содержимое относится к: версия 3.1 (GA) | Последняя версия: фиолетовый флажокфлажок версия 4.0 (предварительная версия) | Предыдущие версии: синяя галочка версии 3.0синяя галочка версии 2.1

Это содержимое относится к: версия 3.0 (GA) | Последние версии: флажок фиолетовый флажок v4.0 (предварительная версия) фиолетовый флажок версии 3.1 | Предыдущая версия: синяя галочка версия 2.1

Это содержимое относится к: версия 2.1 Последняя версия: флажоксиняя галочка версия 4.0 (предварительная версия) |

Модель счета аналитики документов использует мощные возможности оптического распознавания символов (OCR) для анализа и извлечения ключевых полей и элементов строки из счетов по продажам, счетов за служебные услуги и заказов на покупку. Счета могут иметь различные форматы и качество изображения, включая фотографии, полученные с камеры телефона, отсканированные документы и цифровые PDF-файлы. API анализирует текст счета, извлекает ключевые сведения (например, имя заказчика, адрес выставления счета, дату и сумму оплаты) и возвращает структурированное представление данных в формате JSON. В настоящее время модель поддерживает счета на 27 языках.

Поддерживаемые типы документов:

  • Счета
  • Счета за коммунальные услуги
  • Заказы на продажу
  • Заказы на покупку

Автоматическая обработка счетов

Автоматическая обработка счетов — это процесс извлечения ключевых accounts payable полей из документов учетной записи выставления счетов. Извлеченные данные включают элементы строк из счетов, интегрированных с рабочими процессами с оплатой счетов (AP) для проверок и платежей. Исторически процесс оплаты счетов выполняется вручную и, следовательно, очень много времени. Точное извлечение ключевых данных из счетов обычно является первым и одним из наиболее важных шагов в процессе автоматизации счетов.

Пример счета, обработанного с помощью Document Intelligence Studio:

Снимок экрана: пример счета, проанализированного в Студии аналитики документов.

Пример счета, обработанный с помощью средства создания меток для аналитики документов:

Снимок экрана с примером накладной.

Варианты разработки

Аналитика документов версии 4.0 (2024-07-31-preview) поддерживает следующие средства, приложения и библиотеки:

Функция Ресурсы Model ID
Модель накладных Аналитика
документов• REST API
• ПАКЕТ SDK
для C#
• Пакет SDK для Python• Пакет SDK для Java • Пакет SDK
java для JavaScript
prebuilt-invoice

Аналитика документов версии 3.1 поддерживает следующие средства, приложения и библиотеки:

Функция Ресурсы Model ID
Модель накладных Аналитика
документов• REST API
• ПАКЕТ SDK
для C#
• Пакет SDK для Python• Пакет SDK для Java • Пакет SDK
java для JavaScript
prebuilt-invoice

Аналитика документов версии 3.0 поддерживает следующие средства, приложения и библиотеки:

Функция Ресурсы Model ID
Модель накладных Аналитика
документов• REST API
• ПАКЕТ SDK
для C#
• Пакет SDK для Python• Пакет SDK для Java • Пакет SDK
java для JavaScript
prebuilt-invoice

Аналитика документов версии 2.1 поддерживает следующие средства, приложения и библиотеки:

Функция Ресурсы
Модель накладных Средство
аналитики документов • REST API
пакет SDK
для клиентской библиотеки • Контейнер Docker аналитики документов

Требования к входным данным

  • Поддерживаемые форматы файлов:

    Модель PDF Изображение:
    JPEG/JPG, , BMPPNGTIFFHEIF
    Microsoft Office:
    Word (), Excel (XLSXDOCX), PowerPoint (PPTX), HTML
    Читать
    Макет ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
    Документ общего назначения
    Готовое
    Настраиваемая функция извлечения
    Настраиваемая классификация ✔ (2024-07-31-preview, 2024-02-29-preview)
  • Для получения наилучших результатов предоставьте одну четкую фотографию или скан-копию документа высокого качества.

  • Для PDF и TIFF можно обрабатывать до 2000 страниц (с подпиской на бесплатный уровень только первые две страницы обрабатываются).

  • Размер файла для анализа документов составляет 500 МБ для платного уровня (S0) и 4 МБ для бесплатного уровня (F0).

  • Размеры изображения должны составлять от 50 пикселей до 50 пикселей и 10 000 пикселей x 10 000 пикселей.

  • Если PDF-файлы заблокированы паролем, перед отправкой необходимо снять блокировку.

  • Минимальная высота извлекаемого текста составляет 12 пикселей для изображения размером 1024 x 768 пикселей. Это измерение соответствует тексту 8 точки в 150 точек на дюйм (DPI).

  • Для обучения пользовательской модели максимальный объем обучающих данных составляет 500 страниц для пользовательской модели шаблона и 50 000 страниц для пользовательской нейронной модели.

    • Для обучения пользовательской модели извлечения общий размер обучающих данных составляет 50 МБ для модели шаблона и 1 ГБ для нейронной модели.

    • Для обучения пользовательской модели классификации общий размер обучающих данных составляет 1 ГБ не более 10 000 страниц. Для 2024-07-31-preview и более поздних версий общий размер обучающих данных составляет 2 ГБ с максимальным количеством 10 000 страниц.

  • Поддерживаемые форматы файлов: JPEG, PNG, PDF и TIFF.
  • Обрабатываются поддерживаемые PDF-файлы и TIFF до 2000 страниц. Для подписчиков уровня "Бесплатный" обрабатываются только две первые страницы.
  • Поддерживаемый размер файла должен быть меньше 50 МБ и размеров не менее 50 x 50 пикселей и не более 10 000 x 10 000 пикселей.

Извлечение данных модели счета

Узнайте, как данные, включая сведения о клиентах, сведения о поставщике и элементы строки, извлекаются из счетов. Вам потребуются следующие ресурсы:

  • Подписка Azure — ее можно создать бесплатно.

  • Экземпляр аналитики документов в портал Azure. Вы можете использовать ценовую категорию "Бесплатный" (F0), чтобы поработать со службой. После развертывания ресурса выберите Перейти к ресурсу, чтобы получить ключ и конечную точку.

Снимок экрана: расположение ключей и конечной точки на портале Azure.

  1. На домашней странице Document Intelligence Studio выберите "Счета".

  2. Вы можете проанализировать пример счета или отправить собственные файлы.

  3. Нажмите кнопку "Выполнить анализ ", а при необходимости настройте параметры анализа:

    Снимок экрана: кнопки

Средство разработки меток аналитики документов

  1. Перейдите к инструменту аналитики документов.

  2. На домашней странице примера инструмента выберите предварительно созданную модель, чтобы получить плитку данных .

    Снимок экрана: процесс анализа результатов модели макета.

  3. Выберите тип формы для анализа из раскрывающегося меню.

  4. Выберите URL-адрес для файла, который необходимо проанализировать, в одном из следующих вариантов:

  5. В поле Источник выберите URL-адрес в раскрывающемся меню, вставьте выбранный URL-адрес и нажмите кнопку Получить.

    Снимок экрана с раскрывающимся меню расположения источника.

  6. В поле конечной точки службы аналитики документов вставьте конечную точку, полученную в подписке Аналитики документов.

  7. В поле ключа вставьте ключ, полученный из ресурса аналитики документов.

    Снимок экрана: раскрывающееся меню выбора типа.

  8. Щелкните элемент Run analysis (Выполнить анализ). Средство аналитики документов вызывает предварительно созданный API анализа и анализирует документ.

  9. Просмотрите результаты. Просмотрите пары "ключ-значение", извлеченные, элементы строки, извлеченные текст и обнаруженные таблицы.

    Снимок экрана: операция анализа результатов модели макета.

Примечание.

Пример средства маркировки данных не поддерживает файлы в формате BMP. Это ограничение средства, а не службы аналитики документов.

Поддерживаемые языки и языковые стандарты

Полный список поддерживаемых языков см . на странице поддержки языка предварительно созданной модели.

Извлечение полей

  • Сведения о поддерживаемых полях извлечения документов см. на странице схемы модели счета в нашем примере репозитория GitHub.

  • Пары ключ-значение счета и извлеченные позиции находятся в разделе documentResults выходных данных JSON.

Пары "ключ-значение"

Предварительно созданный счет 2022-06-30 и более поздние выпуски поддерживают необязательный возврат пар "ключ-значение". По умолчанию возврат пар "ключ-значение" отключен. Пары "ключ-значение" — это отдельные фрагменты внутри счета, которые определяют метку или ключ и связанный с ними ответ или значение. В счете эти пары могут быть меткой и значением, введенным пользователем для этого поля или номера телефона. Модель искусственного интеллекта предназначена для извлечения идентифицируемых ключей и значений на основе широкого спектра типов документов, форматов и структур.

Ключи также могут существовать в изоляции, когда модель обнаруживает, что ключ существует, но с ним не связано ни одно значение, или при обработке необязательных полей. Например, поле промежуточного имени можно оставить пустым в форме в некоторых экземплярах. Пары "ключ-значение" всегда являются диапазонами текста, содержащегося в документе. Для документов, в которых одно и то же значение описано разными способами, например клиент или пользователь, связанный ключ является клиентом или пользователем (в зависимости от контекста).

Извлеченные поля

Служба счетов извлекает текст, таблицы и 26 полей счета. Ниже приведены поля, извлеченные из счета в ответе выходных данных JSON (следующие выходные данные используют этот пример счета).

Имя. Тип Описание Текст Значение (стандартизованные выходные данные)
CustomerName строка Клиент, которому выставляется счет Корпорация Майкрософт
CustomerId строка Ссылочный идентификатор для клиента CID-12345
PurchaseOrder строка Ссылочный номер заказа на покупку PO-3333
InvoiceId строка Идентификатор для этого конкретного счета (часто "номер счета") INV-100
InvoiceDate Дата Дата выставления счета 15.11.2019 15.11.2019
DueDate Дата Дата оплаты этого счета 15.12.2019 15.12.2019
VendorName строка Поставщик, создавший счет CONTOSO
VendorAddress строка Почтовый адрес для Поставщика 123 456th Нью-Йорк, NY, 10001
VendorAddressRecipient строка Имя, связанное с VendorAddress Головные офисы Contoso
CustomerAddress строка Почтовый адрес для Клиента 123 Other Street, Редмонд, Вашингтон, 98052
CustomerAddressRecipient строка Имя, связанное с CustomerAddress Корпорация Майкрософт
BillingAddress строка Действительный платежный адрес клиента 123 Билл-стрит, Редмонд, Вашингтон, 98052
BillingAddressRecipient строка Имя, связанное с BillingAddress Службы Microsoft
ShippingAddress строка Действительный адрес доставки клиента 123 Ship Street, Редмонд, Вашингтон, 98052
ShippingAddressRecipient строка Имя, связанное с ShippingAddress Доставка Майкрософт
Промежуточная сумма number Поле промежуточного итога, определенное в этом счете 100,00 долларов США 100
TotalTax number Поле общей суммы налога, определенной в этом счете 10,00 долларов США 10
InvoiceTotal number Всего новых расходов, связанных с этим счетом 110,00 долл. 110
AmountDue number Общая сумма, причитающаяся поставщику 610,00 долл. 610
ServiceAddress строка Действительный адрес службы или адрес свойства для клиента 123 Service Street, Редмонд, Вашингтон, 98052
ServiceAddressRecipient строка Имя, связанное с ServiceAddress Службы Microsoft
RemittanceAddress строка Действительный адрес для перевода или платежа клиента 123 Remit St New York, NY, 10001
RemittanceAddressRecipient строка Имя, связанное с RemittanceAddress Выставление счетов Contoso
ServiceStartDate Дата Первая дата для периода обслуживания (например, период обслуживания счета) 10/14/2019 2019-10-14
ServiceEndDate Дата Конечная дата для периода обслуживания (например, период обслуживания счета) 14.11.2019 14.11.2019
PreviousUnpaidBalance number Действительный ранее невыплаченный остаток 500,00 долл. 500

Ниже приведены элементы строки, извлеченные из счета в выходном ответе JSON, и используется этот пример счета:

Имя. Тип Описание Текст (позиция #1) Значение (стандартизованные выходные данные)
Товаров строка Строка полного текста строки данной позиции 04.03.2021 A123 Консультационные услуги 2 часа 30,00 долл. 10 % 60,00 долл.
Сумма number Сумма позиции 60,00 долл. 100
Description строка Текстовое описание позиции счета Консультационные услуги Консультационные услуги
Количество number Количество для этой позиции счета 2 2
UnitPrice number Чистая или фактурная цена (в зависимости от настройки фактурного счета) одной позиции 30,00 долларов США 30
ProductCode строка Код продукта, номер продукта или номер SKU конкретной позиции A123
Единица измерения строка Единица измерения позиции (например кг, фунт и т. д.) hours
Дата Дата Дата, соответствующая каждой позиции. Часто это дата отправки товара данной позиции 04.03.2021 04.03.2021
Налоги number Налог, связанный с каждой позицией. Возможные значения: сумма налогов, налоговый % и налог Y/N 10%

Ниже приведены сложные поля, извлеченные из счета в ответе выходных данных JSON:

TaxDetails

Налоговые данные определяют конкретные налоги, применяемые к общей сумме счета.

Имя. Тип Описание Текст (позиция #1) Значение (стандартизованные выходные данные)
Товаров строка Строка полнострочного текста налогового элемента V.A.T. 15% $ 60,00
Сумма number Сумма налога налоговой позиции 60,00 60
Ставка строка Налоговая ставка налогового пункта 15 %

PaymentDetails

Список всех обнаруженных параметров оплаты, обнаруженных в поле.

Имя. Тип Описание Текст (позиция #1) Значение (стандартизованные выходные данные)
IBAN строка Номер внутреннего банковского счета GB33BUKB20201555555555
SWIFT строка SWIFT-код BUKBGB22
BankAccountNumber строка Номер банковского счета, уникальный идентификатор для банковского счета 123456
BPayBillerCode строка Австралийский код счета за счет B-Payer 12345
BPayReference строка Австралийский справочный код B-Pay 98765432100

Выходные данные JSON

Выходные данные JSON состоят из трех частей:

  • Узел "readResults" содержит весь распознанный текст и все метки выделения. Текст организован по страницам, а затем по строкам, а затем по отдельным словам.
  • "pageResults" узел содержит таблицы и ячейки, извлеченные с ограничивающими прямоугольниками, уверенностью и ссылкой на строки и слова в readResults.
  • В узле "documentResults" содержатся специфичные для счета значения и позиции, обнаруженные моделью. Здесь можно найти все поля из счета, например идентификатора счета, отправки, выставления счетов, клиента, общего объема, элементов строки и многое другое.

Руководство по миграции

  • Следуйте руководству по миграции с помощью аналитики документов версии 3.1, чтобы узнать, как использовать версию версии 3.0 в приложениях и рабочих процессах.

Следующие шаги

  • Попробуйте обработать собственные формы и документы с помощью Document Intelligence Studio.

  • Выполните краткое руководство по анализу документов и начните создавать приложение для обработки документов на выбранном языке разработки.

  • Попробуйте обработать собственные формы и документы с помощью средства проверки меток для аналитики документов.

  • Выполните краткое руководство по анализу документов и начните создавать приложение для обработки документов на выбранном языке разработки.