Модели обработки документов

2024-12-12

Это содержимое относится к: версии 4.0 (GA) | Предыдущие версии: v3.1 (GA) версии 3.0 (GA) версии 2.1 (GA)

Это содержимое относится к: версия 3.1 (GA) | Последняя версия: версия 4.0 (GA) | Предыдущие версии: v3.0версии 2.1

Это содержимое относится к: версия 3.0 (GA) | Последние версии:версия 4.0 (GA) версии 3.1 | Предыдущая версия:версия 2.1

Это содержимое относится к: версии 2.1 Последняя версия: версия 4.0 (GA) |

Azure AI Document Intelligence поддерживает широкий спектр моделей, позволяющих добавлять интеллектуальную обработку документов в приложения и потоки. Вы можете использовать предварительно созданную модель для конкретного домена или обучить пользовательскую модель, адаптированную к конкретным бизнес-потребностям и вариантам использования. Аналитика документов может использоваться с клиентскими библиотеками REST API или Python, C#, Java и JavaScript.

Примечание.

Проекты обработки документов, включающие финансовые данные, защищенные данные о работоспособности, персональные данные или высокочувствительные данные, требуют тщательного внимания.
Обязательно соблюдайте все национальные или региональные и отраслевые требования.

Общие сведения о модели

В следующей таблице показаны доступные модели для каждого стабильного API:

Тип модели	Модель	• 2024-11-30 (GA)	2023-07-31 (GA)	2022-08-31 (GA)	v2.1 (GA)
Модели анализа документов	Чтение	✔️	✔️	✔️	Н/Д
Модели анализа документов	Макет	✔️	✔️	✔️	✔️
Модели анализа документов	Документ общего назначения;	перемещен в макет**	✔️	✔️	Н/Д
Предварительно созданные модели	Банковский контроль	✔️	Недоступно	н/д	Недоступно
Предварительно созданные модели	Банковский оператор	✔️	Недоступно	н/д	Недоступно
Предварительно созданные модели	Paystub	✔️	Недоступно	н/д	Недоступно
Предварительно созданные модели	Контракт	✔️	✔️	Недоступно	Недоступно
Предварительно созданные модели	Карточка медицинского страхования	✔️	✔️	✔️	Н/Д
Предварительно созданные модели	Удостоверение	✔️	✔️	✔️	✔️
Предварительно созданные модели	Счет-фактура	✔️	✔️	✔️	✔️
Предварительно созданные модели	Квитанция	✔️	✔️	✔️	✔️
Предварительно созданные модели	Единый налог США*	✔️	Недоступно	н/д	Недоступно
Предварительно созданные модели	Налог США 1040*	✔️	✔️	Недоступно	Недоступно
Предварительно созданные модели	Налог США 1095*	✔️	Недоступно	н/д	Недоступно
Предварительно созданные модели	US 1098 Tax*	✔️	Недоступно	н/д	Недоступно
Предварительно созданные модели	US 1099 Tax*	✔️	Недоступно	н/д	Недоступно
Предварительно созданные модели	Налог НА W2 США	✔️	✔️	✔️	Н/Д
Предварительно созданные модели	Налог W4 в США	✔️	Недоступно	н/д	Недоступно
Предварительно созданные модели	US Ипотека 1003 URLA	✔️	Недоступно	н/д	Недоступно
Предварительно созданные модели	US Ипотека 1004 URAR	✔️	Недоступно	н/д	Недоступно
Предварительно созданные модели	Ипотека США 1005	✔️	Недоступно	н/д	Недоступно
Предварительно созданные модели	Сводка по ипотеке США 1008	✔️	Недоступно	н/д	Недоступно
Предварительно созданные модели	Раскрытие информации о закрытии ипотеки США	✔️	Недоступно	н/д	Недоступно
Предварительно созданные модели	Свидетельство о браке	✔️	Недоступно	н/д	Недоступно
Предварительно созданные модели	Кредитная карта	✔️	Недоступно	н/д	Недоступно
Предварительно созданные модели	Визитная карточка	устарело	✔️	✔️	✔️
Пользовательская модель классификации	Настраиваемый классификатор	✔️	✔️	Недоступно	Недоступно
Пользовательская модель извлечения	Настраиваемая нейронная	✔️	✔️	✔️	Н/Д
Пользовательская модель извлечения	Пользовательский шаблон	✔️	✔️	✔️	✔️
Пользовательская модель извлечения	Пользовательский состав	✔️	✔️	✔️	✔️
Все модели	Возможности надстройки	✔️	✔️	Недоступно	Недоступно

* — содержит подмодели. Сведения о конкретной модели см. в поддерживаемых вариантах и подтипах.
**- Все возможности модели общего документа доступны в модели макета. Общая модель больше не поддерживается.

Задержка

Задержка — это количество времени, затрачиваемого сервером API на обработку входящего запроса и предоставление исходящего ответа клиенту. Время анализа документа зависит от размера (например, количества страниц) и связанного содержимого на каждой странице. Аналитика документов — это мультитенантная служба, в которой задержка для аналогичных документов сравнима, но не всегда идентична. В любой микрослужбе, без отслеживания состояния, асинхронной службе, которая обрабатывает изображения и большие документы в большом масштабе. Несмотря на то, что мы постоянно масштабируем оборудование и емкость и возможности масштабирования, могут возникнуть проблемы с задержкой во время выполнения.

Возможность надстройки

Ниже приведена возможность надстройки, доступная в аналитике документов. Для всех моделей, кроме бизнес-карты, аналитика документов теперь поддерживает возможности надстройки, чтобы обеспечить более сложный анализ. Эти необязательные возможности можно включить и отключить в зависимости от сценария извлечения документов. Для общедоступной версии API доступны 2023-07-31 семь возможностей надстройки:

ocrHighResolution
formulas
styleFont
barcodes
languages
keyValuePairs
queryFields Not available with the US.Tax models
searchablePDF Only available for Read Model

Возможность надстройки	Надстройка или бесплатная	• 2024-11-30 (GA)	`2023-07-31` (GA)	`2022-08-31` (GA)	v2.1 (GA)
Извлечение свойств шрифта	Надстройка	✔️	✔️	Недоступно	Недоступно
Извлечение формул	Надстройка	✔️	✔️	Недоступно	Недоступно
Извлечение высокого разрешения	Надстройка	✔️	✔️	Недоступно	Недоступно
Извлечение штрихкодов	Бесплатно	✔️	✔️	Недоступно	Недоступно
Распознавание языка	Бесплатно	✔️	✔️	Недоступно	Недоступно
Пары "ключ — значение"	Бесплатно	✔️	Недоступно	н/д	Недоступно
Поля запроса	Надстройка*	✔️	Недоступно	н/д	Недоступно
Pdf с возможностью поиска	Надстройка*	✔️	Недоступно	н/д	Недоступно

Функции анализа моделей

Model ID	Извлечение содержимого	Поля запроса	Абзацы	Роли абзаца	Метки выделения	Таблицы	Пары "Ключ-значение"	Языки	Штрихкоды	Анализ документов	Формулы*	Шрифт стиля*	Высокое разрешение*	Pdf-файл, доступный для поиска
prebuilt-read	✓		✓					O	O		O	O	O	O
prebuilt-layout	✓	✓	✓	✓	✓	✓	O	O	O		O	O	O
предварительно созданный контракт	✓	✓	✓	✓	✓			O	O	✓	O	O
prebuilt-healthInsuranceCard.us	✓	✓						O	O	✓	O	O	O
prebuilt-idDocument	✓	✓						O	O	✓	O	O	O
prebuilt-invoice	✓	✓			✓	✓	O	O	O	✓	O	O	O
prebuilt-receipt	✓	✓						O	O	✓	O	O	O
prebuilt-marriageCertificate.us	✓	✓			✓			O	O	✓	O	O	O
предварительно созданная кредитная карта	✓	✓						O	O	✓	O	O	O
prebuilt-check.us	✓	✓						O	O	✓	O	O	O
prebuilt-payStub.us	✓	✓						O	O	✓	O	O	O
prebuilt-bankStatement	✓	✓						O	O	✓	O	O	O
prebuilt-mortgage.us.1003	✓	✓			✓			O	O	✓	O	O	O
prebuilt-mortgage.us.1004	✓	✓			✓			O	O	✓	O	O	O
prebuilt-mortgage.us.1005	✓	✓			✓			O	O	✓	O	O	O
prebuilt-mortgage.us.1008	✓	✓			✓			O	O	✓	O	O	O
prebuilt-mortgage.us.closingDisclosure	✓	✓			✓			O	O	✓	O	O	O
prebuilt-tax.us	✓	✓			✓			O	O	✓	O	O	O
prebuilt-tax.us.w2	✓	✓			✓			O	O	✓	O	O	O
prebuilt-tax.us.w4	✓	✓						O	O	✓	O	O	O
prebuilt-tax.us.1040 (различные)	✓	✓			✓			O	O	✓	O	O	O
prebuilt-tax.us.1095A	✓	✓						O	O	✓	O	O	O
prebuilt-tax.us.1095C	✓	✓						O	O	✓	O	O	O
prebuilt-tax.us.1098	✓	✓			✓			O	O	✓	O	O	O
prebuilt-tax.us.1098E	✓	✓			✓			O	O	✓	O	O	O
prebuilt-tax.us.1098T	✓	✓			✓			O	O	✓	O	O	O
prebuilt-tax.us.1099 (различные)	✓	✓			✓			O	O	✓	O	O	O
prebuilt-tax.us.1099SSA	✓	✓						O	O	✓	O	O	O
{ customModelName }	✓	✓	✓	✓	✓	✓		O	O	✓	O	O	O

✓ - Включен O - Необязательный

* - Премиум функции влечет за собой дополнительные расходы

Надстройка* — поля запросов отличаются от других функций надстройки. Подробные сведения см. в разделе Цены.

Ограничивающие координаты поля и многоугольника

Ограничивающий прямоугольник (polygon в версиях 3.0 и более поздних версиях) — это абстрактный прямоугольник, который окружает текстовые элементы в документе, используемом в качестве эталонной точки для обнаружения объектов.

Ограничивающий прямоугольник указывает позицию с помощью плоскости координат x и y, представленной в массиве из четырех числовых пар. Каждая пара представляет угол поля в следующем порядке: верхний левый, верхний правый, нижний правый, нижний левый.
Координаты изображения представлены в пикселях. Для PDF координаты представлены в дюймах.

Поддержка языков

Универсальные модели на основе глубокого обучения в Аналитике документов поддерживают множество языков, которые могут извлекать многоязычный текст из изображений и документов, включая текстовые строки с смешанными языками. Поддержка языка зависит от функциональных возможностей службы аналитики документов. Полный список см. в следующих статьях:

Доступность в регионах

Аналитика документов общедоступна во многих из 60 и более поздних регионов глобальной инфраструктуры Azure.

Дополнительные сведения см . на странице географических регионов Azure, чтобы помочь выбрать регион, который лучше всего подходит для вас и ваших клиентов.

Сведения о модели

В этом разделе описаны выходные данные, которые можно ожидать от каждой модели. Вы можете расширить выходные данные большинства моделей с помощью функций надстройки.

Чтение OCR

API чтения анализирует и извлекает строки, слова, их расположения, обнаруженные языки и рукописный стиль при обнаружении.

Пример документа, обработанный с помощью Студии аналитики документов:

Снимок экрана: пример документа, обработанный с помощью Document Intelligence Studio Read

Дополнительные сведения: модель чтения

Анализ макета

Модель анализа макета анализирует и извлекает текст, таблицы, знаки выделения и другие элементы структуры, такие как заголовки, заголовки разделов, заголовки страниц, нижние колонтитулы страницы и многое другое.

Пример документа, обработанный с помощью Студии аналитики документов:

Снимок экрана: пример страницы газеты, обработанной с помощью Document Intelligence Studio.

Дополнительные сведения: модель макета

Карточка медицинского страхования

Модель карты медицинского страхования объединяет мощные возможности оптического распознавания символов (OCR) с моделями глубокого обучения для анализа и извлечения ключевых сведений из карт медицинского страхования США.

Пример карты медицинского страхования США, обработанной с помощью Document Intelligence Studio:

Дополнительные сведения: модель карты медицинского страхования

Налоговые документы США

Модели налоговых документов США анализируют и извлекают ключевые поля и элементы строки из выбранной группы налоговых документов. API поддерживает анализ налоговых документов НА английском языке США различных форматов и качества, включая захваченные телефоном изображения, сканированные документы и цифровые PDF-файлы. В настоящее время поддерживаются следующие модели:

Модель	Description	Идентификатор модели
Налог США W-2	Извлечение сведений о компенсации с налогом.	prebuilt-tax.us.w2
Налог США W-4	Извлечение сведений о компенсации с налогом.	prebuilt-tax.us.w4
Налог США 1040	Извлечение сведений об ипотечных интересах.	prebuilt-tax.us.1040(варианты)
Налог США 1095	Извлеките сведения о медицинском страховании.	prebuilt-tax.us.1095(варианты)
Налог США 1098	Извлечение сведений об ипотечных интересах.	prebuilt-tax.us.1098(варианты)
Налог США 1099	Извлечение дохода, полученного из источников, отличных от работодателя.	prebuilt-tax.us.1099(варианты)

Пример документа W-2, обработанный с помощью Document Intelligence Studio:

Снимок экрана примера W-2.

Дополнительные сведения: модели налоговых документов

Ипотечные документы США

Модели ипотечных документов США анализируют и извлекают ключевые поля, включая заемщик, кредит и информацию о собственности из выбранной группы ипотечных документов. API поддерживает анализ документов ипотеки на английском языке США различных форматов и качества, включая изображения, захваченные телефоном, сканированные документы и цифровые PDF-файлы. В настоящее время поддерживаются следующие модели:

Модель	Description	Идентификатор модели
Лицензионное соглашение 1003 (EULA)	Извлечение кредита, заемщика, сведений о собственности.	prebuilt-mortgage.us.1003
1004 Универсальный отчет об оценке жилых домов (URAR))	Извлечение кредита, заемщика, сведений о собственности.	prebuilt-mortgage.us.1004
1005 Проверка занятости	Извлечение кредита, заемщика, сведений о собственности.	prebuilt-mortgage.us.1005
Сводный документ 1008	Извлеките заемщик, продавец, недвижимость, ипотеку и детали подзаписи.	prebuilt-mortgage.us.1008
Закрытие раскрытия	Извлечение закрывающих, транзакционных затрат и сведений о кредите.	prebuilt-mortgage.us.closingDisclosure

Пример документа о закрытии раскрытия, обработанного с помощью Document Intelligence Studio:

Снимок экрана: пример закрытия раскрытия.

Дополнительные сведения: модели ипотечных документов

Contract

Модель контракта анализирует и извлекает ключевые поля и элементы линии из договорных соглашений, включая стороны, юрисдикции, идентификатор контракта и название. В настоящее время модель поддерживает документы контракта на английском языке.

Пример контракта, обработанный с помощью Document Intelligence Studio:

Снимок экрана: извлечение модели контракта с помощью Document Intelligence Studio.

Дополнительные сведения: модель контракта

Проверка банка США

Модель контракта анализирует и извлекает ключевые поля из проверки, включая сведения о проверке, сведения о счете, сумму, memo, извлекается из проверок банка США.

Пример проверки банка, обработанный с помощью Document Intelligence Studio:

Снимок экрана: извлечение модели проверки банка с помощью Document Intelligence Studio.

Дополнительные сведения: модель контракта

Заявление банка США

Модель банковских инструкций анализирует и извлекает ключевые поля и элементы строк из номера счета банковских инструкций США, банковских сведений, сведений о инструкции и сведений о транзакциях.

Пример банковских инструкций, обработанных с помощью Document Intelligence Studio:

Снимок экрана: извлечение модели банковских инструкций с помощью Document Intelligence Studio.

Дополнительные сведения: модель контракта

PayStub

Модель paystub анализирует и извлекает ключевые поля и элементы строки из документов и файлов с соответствующими сведениями о заработной плате.

Пример оплаты, обработанный с помощью Document Intelligence Studio:

Снимок экрана: извлечение модели заглушки с помощью Document Intelligence Studio.

Дополнительные сведения: модель контракта

Счет

Модель счета автоматизирует обработку счетов для извлечения имени клиента, адреса выставления счетов, даты выполнения и суммы, элементов строки и других ключевых данных.

Пример счета, обработанный с помощью Document Intelligence Studio:

Дополнительные сведения: модель счета

Получение

Используйте модель квитанций для сканирования квитанций о продажах для имени продавца, дат, элементов строки, количества и итогов от печатных и рукописных квитанций. Версия 3.0 также поддерживает обработку квитанций об одностраничных отелях.

Пример квитанции, обработанный с помощью Document Intelligence Studio:

Дополнительные сведения: модель квитанции

Документ удостоверения (идентификатор)

Используйте модель документа удостоверений (ID) для обработки лицензий водителя США (все 50 штатов и округа Колумбия) и биографические страницы из международных паспортов (за исключением виз и других документов для путешествий) для извлечения ключевых полей.

Пример лицензии водителя США, обработанный с помощью Document Intelligence Studio:

Дополнительные сведения: модель удостоверения

Свидетельство о браке

Используйте модель сертификата брака для обработки сертификатов браков США для извлечения ключевых полей, включая лиц, дату и расположение.

Пример сертификата о браке США, обработанный с помощью Document Intelligence Studio:

Дополнительные сведения: модель удостоверения

Кредитная карта

Используйте модель кредитной карты для обработки кредитных и дебетовых карт для извлечения ключевых полей.

Пример кредитной карты, обработанной с помощью Document Intelligence Studio:

Дополнительные сведения: модель удостоверения

Пользовательские модели

Пользовательские модели могут быть широко классифицированы по двум типам. Пользовательские модели классификации, поддерживающие классификацию типа документа и пользовательские модели извлечения, которые могут извлекать определенную схему из определенного типа документа.

Схема типов пользовательских моделей и связанных режимов сборки модели.

Пользовательские модели документов анализируют и извлекают данные из форм и документов, относящихся к вашей организации. Они распознают поля формы в отдельном содержимом и извлекают пары "ключ-значение" и данные таблицы. Чтобы приступить к работе, вам потребуется только один пример типа формы.

Версия 3.0 и более поздние пользовательские модели поддерживают обнаружение подписей в пользовательских шаблонах (форме) и межстраничных таблицах как в шаблонах, так и в нейронных моделях. Обнаружение подписи ищет наличие подписи, а не удостоверение пользователя, который подписывает документ. Если модель возвращает без знака для обнаружения подписей, модель не обнаружила подпись в определенном поле.

Пример пользовательского шаблона, обработанного с помощью Document Intelligence Studio:

Снимок экрана: окно анализа пользовательской формы средства аналитики документов.

Дополнительные сведения: настраиваемая модель

Настраиваемая функция извлечения

Пользовательская модель извлечения может быть одной из двух типов, пользовательских шаблонов, пользовательских нейронных данных. Чтобы создать пользовательскую модель извлечения, наклейте набор данных документов со значениями, которые требуется извлечь и обучить модель в помеченном наборе данных. Для начала работы вам потребуется всего пять примеров формы или документа одного типа.

Пример пользовательского извлечения, обработанный с помощью Document Intelligence Studio:

Снимок экрана: анализ пользовательской модели извлечения в Document Intelligence Studio.

Дополнительные сведения: пользовательская модель шаблона

Дополнительные сведения: настраиваемая нейронная модель

Настраиваемый классификатор

Пользовательская модель классификации позволяет определить тип документа перед вызовом модели извлечения. Модель классификации доступна начиная с 2023-07-31 (GA) API. Для обучения пользовательской модели классификации требуется по крайней мере два отдельных класса и не менее пяти выборок для каждого класса.

Дополнительные сведения: пользовательская модель классификации

Составные модели

Составная модель создается на основе коллекции настраиваемых моделей, которые назначаются одной модели, созданной из ваших типов форм. Вы можете назначить несколько пользовательских моделей составной модели с одним идентификатором модели. Вы можете назначить до 200 обученных пользовательских моделей одной составной модели.

Диалоговое окно создания модели в Document Intelligence Studio:

Снимок экрана: диалоговое окно создания пользовательской модели в Studio Document Intelligence Studio.

Дополнительные сведения: настраиваемая модель

Требования к входным данным

Поддерживаемые форматы файлов:

Модель	PDF	Изображение: `JPEG/JPG`, , `BMPPNGTIFFHEIF`	Microsoft Office: Word (), Excel (`XLSXDOCX`), PowerPoint (`PPTX`), HTML
Читать	✔	✔	✔
Макет	✔	✔	✔
Документ общего назначения	✔	✔
Готовое	✔	✔
Настраиваемая функция извлечения	✔	✔
Настраиваемая классификация	✔	✔	✔

Для получения наилучших результатов предоставьте одну четкую фотографию или скан-копию документа высокого качества.
Для PDF и TIFF можно обрабатывать до 2000 страниц (с подпиской на бесплатный уровень только первые две страницы обрабатываются).
Размер файла для анализа документов составляет 500 МБ для платного уровня (S0) и 4 МБ для бесплатного уровня (F0).
Размеры изображения должны составлять от 50 пикселей до 50 пикселей и 10 000 пикселей x 10 000 пикселей.
Если PDF-файлы заблокированы паролем, перед отправкой необходимо снять блокировку.
Минимальная высота извлекаемого текста составляет 12 пикселей для изображения размером 1024 x 768 пикселей. Это измерение соответствует тексту 8 точки в 150 точек на дюйм (DPI).
Для обучения пользовательской модели максимальный объем обучающих данных составляет 500 страниц для пользовательской модели шаблона и 50 000 страниц для пользовательской нейронной модели.
- Для обучения пользовательской модели извлечения общий размер обучающих данных составляет 50 МБ для модели шаблона и 1 ГБ для нейронной модели.
- Для обучения пользовательской модели классификации общий размер обучающих данных составляет 1 ГБ не более 10 000 страниц. Для 2024-11-30 (GA) общий размер обучающих данных составляет 2 ГБ с не более чем 10 000 страниц.

Примечание.

Пример средства маркировки данных не поддерживает файлы в формате BMP. Это ограничение средства, а не службы аналитики документов.

Миграция между версиями

Узнайте, как использовать аналитику документов версии 3.0 в приложениях, следуя руководству по миграции с помощью аналитики документов версии 3.1

Модель	Description
Анализ документов
Макет	Извлечение текста и сведений о макете из документов.
Предварительно созданная
Счет-фактура	Извлечение ключевых данных из счетов на английском и испанском языках.
Квитанция	Извлечение ключевых данных из квитанций на английском языке.
Удостоверение	Извлечение ключевых данных из американских водительских прав и заграничных паспортов.
Визитная карточка	Извлечение ключевых данных из визитных карточек на английском языке.
Пользовательское
Пользовательское	Извлечение данных из форм и документов, относящихся к вашему бизнесу. Настраиваемые модели обучаются именно для ваших данных и вариантов использования.
Составленная	Создание коллекции настраиваемых моделей и назначение их одной модели, созданной на основе типов форм.

Макет

API макета анализирует и извлекает из документов текст, таблицы и заголовки, метки выделения и сведения о структуре.

Пример документа, обработанный с помощью средства маркировки образца:

Снимок экрана: анализ макета с помощью средства маркировки образца.

Дополнительные сведения: модель макета

Счет

Модель счета анализирует и извлекает ключевые сведения из счетов продажи. Этот API анализирует счета в различных форматах и извлекает ключевые сведения (например, имя заказчика, адрес выставления счета, дату и сумму оплаты).

Пример счета, обработанный с помощью средства маркировки образца:

Снимок экрана: пример анализа счетов с помощью средства

Дополнительные сведения: модель счета

Получение

Модель квитанции анализирует и извлекает ключевые данные из печатных и рукописных чеков.

Пример квитанции, обработанный с помощью средства маркировки примера:

Дополнительные сведения: модель квитанции

Удостоверение

Модель удостоверения анализирует и извлекает ключевые данные из следующих документов:

Водительское удостоверение США (все 50 штатов и округ Колумбия)
Страницы с биографическими данными из международных паспортов (за исключением виз и других выездных документов). Этот API анализирует удостоверяющие документы и извлекает

Пример лицензии драйвера США, обработанный с помощью средства маркировки примера:

Снимок экрана с примером идентификационной карточки.

Дополнительные сведения: модель удостоверения

Визитная карточка

Модель визитной карточки анализирует и извлекает ключевые данные с изображений визитных карточек.

Пример визитной карточки, обработанный с помощью средства маркировки примера:

Снимок экрана с примером визитной карточки.

Дополнительные сведения: модель визитной карточки

Пользовательское

Пользовательские модели анализируют и извлекают данные из форм и документов, характерных для вашей компании. API — это программа машинного обучения, обученная для распознавания полей форм в определенном содержимом, а также извлечения пар "ключ-значение" и данных таблиц. Для начала работы необходимо лишь пять примеров одного типа формы, и настраиваемую модель можно обучить на наборах данных с метками или без таких наборов данных.

Пример пользовательской обработки модели с помощью средства маркировки примеров:

Снимок экрана: окно анализа пользовательской формы средства аналитики документов.

Дополнительные сведения: настраиваемая модель

Составная настраиваемая модель

Составная модель создается на основе коллекции настраиваемых моделей, которые назначаются одной модели, созданной из ваших типов форм. Вы можете назначить несколько пользовательских моделей составной модели с одним идентификатором модели. Вы можете назначить для одной составной модели до 100 обученных настраиваемых моделей.

Диалоговое окно создания модели с помощью средства маркировки примера:

Снимок экрана: диалоговое окно создания пользовательской модели в Studio Document Intelligence Studio.

Дополнительные сведения: настраиваемая модель

Извлечение данных модели

Модель	Извлечение текста	Метки выделения	Таблицы	Пунктах	Роли абзаца	Пары "ключ-значение"	Поля
Макет	✓	✓	✓	✓	✓
Счет-фактура	✓	✓	✓	✓		✓	✓
Квитанция	✓			✓			✓
Удостоверение	✓			✓			✓
Визитная карточка	✓			✓			✓
Настраиваемая форма	✓	✓	✓	✓			✓

Требования к входным данным

Поддерживаемые форматы файлов:

Модель	PDF	Изображение: `JPEG/JPG`, , `BMPPNGTIFFHEIF`	Microsoft Office: Word (), Excel (`XLSXDOCX`), PowerPoint (`PPTX`), HTML
Читать	✔	✔	✔
Макет	✔	✔	✔
Документ общего назначения	✔	✔
Готовое	✔	✔
Настраиваемая функция извлечения	✔	✔
Настраиваемая классификация	✔	✔	✔

Для получения наилучших результатов предоставьте одну четкую фотографию или скан-копию документа высокого качества.
Для PDF и TIFF можно обрабатывать до 2000 страниц (с подпиской на бесплатный уровень только первые две страницы обрабатываются).
Размер файла для анализа документов составляет 500 МБ для платного уровня (S0) и 4 МБ для бесплатного уровня (F0).
Размеры изображения должны составлять от 50 пикселей до 50 пикселей и 10 000 пикселей x 10 000 пикселей.
Если PDF-файлы заблокированы паролем, перед отправкой необходимо снять блокировку.
Минимальная высота извлекаемого текста составляет 12 пикселей для изображения размером 1024 x 768 пикселей. Это измерение соответствует тексту 8 точки в 150 точек на дюйм (DPI).
Для обучения пользовательской модели максимальный объем обучающих данных составляет 500 страниц для пользовательской модели шаблона и 50 000 страниц для пользовательской нейронной модели.
- Для обучения пользовательской модели извлечения общий размер обучающих данных составляет 50 МБ для модели шаблона и 1 ГБ для нейронной модели.
- Для обучения пользовательской модели классификации общий размер обучающих данных составляет 1 ГБ не более 10 000 страниц. Для 2024-11-30 (GA) общий размер обучающих данных составляет 2 ГБ с не более чем 10 000 страниц.

Примечание.

Миграция между версиями

Вы можете узнать, как использовать аналитику документов версии 3.0 в приложениях, следуя руководству по миграции с помощью аналитики документов версии 3.1.

Следующие шаги

Попробуйте обработать собственные формы и документы с помощью Document Intelligence Studio.
Выполните краткое руководство по анализу документов и начните создавать приложение для обработки документов на выбранном языке разработки.

Попробуйте обработать собственные формы и документы с помощью средства проверки меток для аналитики документов.
Выполните краткое руководство по анализу документов и начните создавать приложение для обработки документов на выбранном языке разработки.

Поделиться через

Модели обработки документов

Общие сведения о модели

Задержка

Возможность надстройки

Функции анализа моделей

Ограничивающие координаты поля и многоугольника

Поддержка языков

Доступность в регионах

Сведения о модели

Чтение OCR

Анализ макета

Карточка медицинского страхования

Налоговые документы США

Ипотечные документы США

Contract

Проверка банка США

Заявление банка США

PayStub

Счет

Получение

Документ удостоверения (идентификатор)

Свидетельство о браке

Кредитная карта

Пользовательские модели

Настраиваемая функция извлечения

Настраиваемый классификатор

Составные модели

Требования к входным данным

Миграция между версиями

Макет

Счет

Получение

Удостоверение

Визитная карточка

Пользовательское

Составная настраиваемая модель

Извлечение данных модели

Требования к входным данным

Миграция между версиями

Следующие шаги

Обратная связь

Дополнительные ресурсы