Модель счета аналитики документов
Внимание
- Выпуски общедоступной предварительной версии Document Intelligence предоставляют ранний доступ к функциям, которые находятся в активной разработке. Функции, подходы и процессы могут изменяться до общедоступной доступности на основе отзывов пользователей.
- Общедоступная предварительная версия клиентских библиотек Аналитики документов по умолчанию использует REST API версии 2024-07-31-preview.
- Общедоступная предварительная версия 2024-07-31-preview в настоящее время доступна только в следующих регионах Azure. Обратите внимание, что пользовательская модель создания (извлечение полей документов) в AI Studio доступна только в регионе "Северная часть США":
- Восточная часть США
- Западная часть США2
- Западная Европа
- Северная часть США
Это содержимое относится к: версии 4.0 (предварительная версия) | Предыдущие версии: версия 3.1 (GA) версии 3.0 (GA) версии 2.1 (GA)
Это содержимое относится к: версия 3.1 (GA) | Последняя версия: версия 4.0 (предварительная версия) | Предыдущие версии: версии 3.0 версии 2.1
Это содержимое относится к: версия 3.0 (GA) | Последние версии: v4.0 (предварительная версия) версии 3.1 | Предыдущая версия: версия 2.1
Это содержимое относится к: версия 2.1 Последняя версия: версия 4.0 (предварительная версия) |
Модель счета аналитики документов использует мощные возможности оптического распознавания символов (OCR) для анализа и извлечения ключевых полей и элементов строки из счетов по продажам, счетов за служебные услуги и заказов на покупку. Счета могут иметь различные форматы и качество изображения, включая фотографии, полученные с камеры телефона, отсканированные документы и цифровые PDF-файлы. API анализирует текст счета, извлекает ключевые сведения (например, имя заказчика, адрес выставления счета, дату и сумму оплаты) и возвращает структурированное представление данных в формате JSON. В настоящее время модель поддерживает счета на 27 языках.
Поддерживаемые типы документов:
- Счета
- Счета за коммунальные услуги
- Заказы на продажу
- Заказы на покупку
Автоматическая обработка счетов
Автоматическая обработка счетов — это процесс извлечения ключевых accounts payable
полей из документов учетной записи выставления счетов. Извлеченные данные включают элементы строк из счетов, интегрированных с рабочими процессами с оплатой счетов (AP) для проверок и платежей. Исторически процесс оплаты счетов выполняется вручную и, следовательно, очень много времени. Точное извлечение ключевых данных из счетов обычно является первым и одним из наиболее важных шагов в процессе автоматизации счетов.
Пример счета, обработанного с помощью Document Intelligence Studio:
Пример счета, обработанный с помощью средства создания меток для аналитики документов:
Варианты разработки
Аналитика документов версии 4.0 (2024-07-31-preview) поддерживает следующие средства, приложения и библиотеки:
Функция | Ресурсы | Model ID |
---|---|---|
Модель накладных | • Аналитика документов• REST API • ПАКЕТ SDK для C# • Пакет SDK для Python• Пакет SDK для Java • Пакет SDK java для JavaScript |
prebuilt-invoice |
Аналитика документов версии 3.1 поддерживает следующие средства, приложения и библиотеки:
Функция | Ресурсы | Model ID |
---|---|---|
Модель накладных | • Аналитика документов• REST API • ПАКЕТ SDK для C# • Пакет SDK для Python• Пакет SDK для Java • Пакет SDK java для JavaScript |
prebuilt-invoice |
Аналитика документов версии 3.0 поддерживает следующие средства, приложения и библиотеки:
Функция | Ресурсы | Model ID |
---|---|---|
Модель накладных | • Аналитика документов• REST API • ПАКЕТ SDK для C# • Пакет SDK для Python• Пакет SDK для Java • Пакет SDK java для JavaScript |
prebuilt-invoice |
Аналитика документов версии 2.1 поддерживает следующие средства, приложения и библиотеки:
Функция | Ресурсы |
---|---|
Модель накладных | • Средство аналитики документов • REST API • пакет SDK для клиентской библиотеки • Контейнер Docker аналитики документов |
Требования к входным данным
Поддерживаемые форматы файлов:
Модель PDF Изображение: JPEG/JPG
, ,BMP
PNG
TIFF
HEIF
Microsoft Office:
Word (), Excel (XLSX
DOCX
), PowerPoint (PPTX
), HTMLЧитать ✔ ✔ ✔ Макет ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview) Документ общего назначения ✔ ✔ Готовое ✔ ✔ Настраиваемая функция извлечения ✔ ✔ Настраиваемая классификация ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview) Для получения наилучших результатов предоставьте одну четкую фотографию или скан-копию документа высокого качества.
Для PDF и TIFF можно обрабатывать до 2000 страниц (с подпиской на бесплатный уровень только первые две страницы обрабатываются).
Размер файла для анализа документов составляет 500 МБ для платного уровня (S0) и
4
МБ для бесплатного уровня (F0).Размеры изображения должны составлять от 50 пикселей до 50 пикселей и 10 000 пикселей x 10 000 пикселей.
Если PDF-файлы заблокированы паролем, перед отправкой необходимо снять блокировку.
Минимальная высота извлекаемого текста составляет 12 пикселей для изображения размером 1024 x 768 пикселей. Это измерение соответствует тексту
8
точки в 150 точек на дюйм (DPI).Для обучения пользовательской модели максимальный объем обучающих данных составляет 500 страниц для пользовательской модели шаблона и 50 000 страниц для пользовательской нейронной модели.
Для обучения пользовательской модели извлечения общий размер обучающих данных составляет 50 МБ для модели шаблона и
1
ГБ для нейронной модели.Для обучения пользовательской модели классификации общий размер обучающих данных составляет
1
ГБ не более 10 000 страниц. Для 2024-07-31-preview и более поздних версий общий размер обучающих данных составляет2
ГБ с максимальным количеством 10 000 страниц.
- Поддерживаемые форматы файлов: JPEG, PNG, PDF и TIFF.
- Обрабатываются поддерживаемые PDF-файлы и TIFF до 2000 страниц. Для подписчиков уровня "Бесплатный" обрабатываются только две первые страницы.
- Поддерживаемый размер файла должен быть меньше 50 МБ и размеров не менее 50 x 50 пикселей и не более 10 000 x 10 000 пикселей.
Извлечение данных модели счета
Узнайте, как данные, включая сведения о клиентах, сведения о поставщике и элементы строки, извлекаются из счетов. Вам потребуются следующие ресурсы:
Подписка Azure — ее можно создать бесплатно.
Экземпляр аналитики документов в портал Azure. Вы можете использовать ценовую категорию "Бесплатный" (
F0
), чтобы поработать со службой. После развертывания ресурса выберите Перейти к ресурсу, чтобы получить ключ и конечную точку.
На домашней странице Document Intelligence Studio выберите "Счета".
Вы можете проанализировать пример счета или отправить собственные файлы.
Нажмите кнопку "Выполнить анализ ", а при необходимости настройте параметры анализа:
Средство разработки меток аналитики документов
Перейдите к инструменту аналитики документов.
На домашней странице примера инструмента выберите предварительно созданную модель, чтобы получить плитку данных .
Выберите тип формы для анализа из раскрывающегося меню.
Выберите URL-адрес для файла, который необходимо проанализировать, в одном из следующих вариантов:
В поле Источник выберите URL-адрес в раскрывающемся меню, вставьте выбранный URL-адрес и нажмите кнопку Получить.
В поле конечной точки службы аналитики документов вставьте конечную точку, полученную в подписке Аналитики документов.
В поле ключа вставьте ключ, полученный из ресурса аналитики документов.
Щелкните элемент Run analysis (Выполнить анализ). Средство аналитики документов вызывает предварительно созданный API анализа и анализирует документ.
Просмотрите результаты. Просмотрите пары "ключ-значение", извлеченные, элементы строки, извлеченные текст и обнаруженные таблицы.
Примечание.
Пример средства маркировки данных не поддерживает файлы в формате BMP. Это ограничение средства, а не службы аналитики документов.
Поддерживаемые языки и языковые стандарты
Полный список поддерживаемых языков см . на странице поддержки языка предварительно созданной модели.
Извлечение полей
Сведения о поддерживаемых полях извлечения документов см. на странице схемы модели счета в нашем примере репозитория GitHub.
Пары ключ-значение счета и извлеченные позиции находятся в разделе
documentResults
выходных данных JSON.
Пары "ключ-значение"
Предварительно созданный счет 2022-06-30 и более поздние выпуски поддерживают необязательный возврат пар "ключ-значение". По умолчанию возврат пар "ключ-значение" отключен. Пары "ключ-значение" — это отдельные фрагменты внутри счета, которые определяют метку или ключ и связанный с ними ответ или значение. В счете эти пары могут быть меткой и значением, введенным пользователем для этого поля или номера телефона. Модель искусственного интеллекта предназначена для извлечения идентифицируемых ключей и значений на основе широкого спектра типов документов, форматов и структур.
Ключи также могут существовать в изоляции, когда модель обнаруживает, что ключ существует, но с ним не связано ни одно значение, или при обработке необязательных полей. Например, поле промежуточного имени можно оставить пустым в форме в некоторых экземплярах. Пары "ключ-значение" всегда являются диапазонами текста, содержащегося в документе. Для документов, в которых одно и то же значение описано разными способами, например клиент или пользователь, связанный ключ является клиентом или пользователем (в зависимости от контекста).
Извлеченные поля
Служба счетов извлекает текст, таблицы и 26 полей счета. Ниже приведены поля, извлеченные из счета в ответе выходных данных JSON (следующие выходные данные используют этот пример счета).
Имя. | Тип | Описание | Текст | Значение (стандартизованные выходные данные) |
---|---|---|---|---|
CustomerName | строка | Клиент, которому выставляется счет | Корпорация Майкрософт | |
CustomerId | строка | Ссылочный идентификатор для клиента | CID-12345 | |
PurchaseOrder | строка | Ссылочный номер заказа на покупку | PO-3333 | |
InvoiceId | строка | Идентификатор для этого конкретного счета (часто "номер счета") | INV-100 | |
InvoiceDate | Дата | Дата выставления счета | 15.11.2019 | 15.11.2019 |
DueDate | Дата | Дата оплаты этого счета | 15.12.2019 | 15.12.2019 |
VendorName | строка | Поставщик, создавший счет | CONTOSO | |
VendorAddress | строка | Почтовый адрес для Поставщика | 123 456th Нью-Йорк, NY, 10001 | |
VendorAddressRecipient | строка | Имя, связанное с VendorAddress | Головные офисы Contoso | |
CustomerAddress | строка | Почтовый адрес для Клиента | 123 Other Street, Редмонд, Вашингтон, 98052 | |
CustomerAddressRecipient | строка | Имя, связанное с CustomerAddress | Корпорация Майкрософт | |
BillingAddress | строка | Действительный платежный адрес клиента | 123 Билл-стрит, Редмонд, Вашингтон, 98052 | |
BillingAddressRecipient | строка | Имя, связанное с BillingAddress | Службы Microsoft | |
ShippingAddress | строка | Действительный адрес доставки клиента | 123 Ship Street, Редмонд, Вашингтон, 98052 | |
ShippingAddressRecipient | строка | Имя, связанное с ShippingAddress | Доставка Майкрософт | |
Промежуточная сумма | number | Поле промежуточного итога, определенное в этом счете | 100,00 долларов США | 100 |
TotalTax | number | Поле общей суммы налога, определенной в этом счете | 10,00 долларов США | 10 |
InvoiceTotal | number | Всего новых расходов, связанных с этим счетом | 110,00 долл. | 110 |
AmountDue | number | Общая сумма, причитающаяся поставщику | 610,00 долл. | 610 |
ServiceAddress | строка | Действительный адрес службы или адрес свойства для клиента | 123 Service Street, Редмонд, Вашингтон, 98052 | |
ServiceAddressRecipient | строка | Имя, связанное с ServiceAddress | Службы Microsoft | |
RemittanceAddress | строка | Действительный адрес для перевода или платежа клиента | 123 Remit St New York, NY, 10001 | |
RemittanceAddressRecipient | строка | Имя, связанное с RemittanceAddress | Выставление счетов Contoso | |
ServiceStartDate | Дата | Первая дата для периода обслуживания (например, период обслуживания счета) | 10/14/2019 | 2019-10-14 |
ServiceEndDate | Дата | Конечная дата для периода обслуживания (например, период обслуживания счета) | 14.11.2019 | 14.11.2019 |
PreviousUnpaidBalance | number | Действительный ранее невыплаченный остаток | 500,00 долл. | 500 |
Ниже приведены элементы строки, извлеченные из счета в выходном ответе JSON, и используется этот пример счета:
Имя. | Тип | Описание | Текст (позиция #1) | Значение (стандартизованные выходные данные) |
---|---|---|---|---|
Товаров | строка | Строка полного текста строки данной позиции | 04.03.2021 A123 Консультационные услуги 2 часа 30,00 долл. 10 % 60,00 долл. | |
Сумма | number | Сумма позиции | 60,00 долл. | 100 |
Description | строка | Текстовое описание позиции счета | Консультационные услуги | Консультационные услуги |
Количество | number | Количество для этой позиции счета | 2 | 2 |
UnitPrice | number | Чистая или фактурная цена (в зависимости от настройки фактурного счета) одной позиции | 30,00 долларов США | 30 |
ProductCode | строка | Код продукта, номер продукта или номер SKU конкретной позиции | A123 | |
Единица измерения | строка | Единица измерения позиции (например кг, фунт и т. д.) | hours | |
Дата | Дата | Дата, соответствующая каждой позиции. Часто это дата отправки товара данной позиции | 04.03.2021 | 04.03.2021 |
Налоги | number | Налог, связанный с каждой позицией. Возможные значения: сумма налогов, налоговый % и налог Y/N | 10% |
Ниже приведены сложные поля, извлеченные из счета в ответе выходных данных JSON:
TaxDetails
Налоговые данные определяют конкретные налоги, применяемые к общей сумме счета.
Имя. | Тип | Описание | Текст (позиция #1) | Значение (стандартизованные выходные данные) |
---|---|---|---|---|
Товаров | строка | Строка полнострочного текста налогового элемента | V.A.T. 15% $ 60,00 | |
Сумма | number | Сумма налога налоговой позиции | 60,00 | 60 |
Ставка | строка | Налоговая ставка налогового пункта | 15 % |
PaymentDetails
Список всех обнаруженных параметров оплаты, обнаруженных в поле.
Имя. | Тип | Описание | Текст (позиция #1) | Значение (стандартизованные выходные данные) |
---|---|---|---|---|
IBAN |
строка | Номер внутреннего банковского счета | GB33BUKB20201555555555 | |
SWIFT |
строка | SWIFT-код | BUKBGB22 | |
BankAccountNumber | строка | Номер банковского счета, уникальный идентификатор для банковского счета | 123456 | |
BPayBillerCode | строка | Австралийский код счета за счет B-Payer | 12345 | |
BPayReference | строка | Австралийский справочный код B-Pay | 98765432100 |
Выходные данные JSON
Выходные данные JSON состоят из трех частей:
- Узел
"readResults"
содержит весь распознанный текст и все метки выделения. Текст организован по страницам, а затем по строкам, а затем по отдельным словам. "pageResults"
узел содержит таблицы и ячейки, извлеченные с ограничивающими прямоугольниками, уверенностью и ссылкой на строки и слова в readResults.- В узле
"documentResults"
содержатся специфичные для счета значения и позиции, обнаруженные моделью. Здесь можно найти все поля из счета, например идентификатора счета, отправки, выставления счетов, клиента, общего объема, элементов строки и многое другое.
Руководство по миграции
- Следуйте руководству по миграции с помощью аналитики документов версии 3.1, чтобы узнать, как использовать версию версии 3.0 в приложениях и рабочих процессах.
Следующие шаги
Попробуйте обработать собственные формы и документы с помощью Document Intelligence Studio.
Выполните краткое руководство по анализу документов и начните создавать приложение для обработки документов на выбранном языке разработки.
Попробуйте обработать собственные формы и документы с помощью средства проверки меток для аналитики документов.
Выполните краткое руководство по анализу документов и начните создавать приложение для обработки документов на выбранном языке разработки.