Пользовательская нейронная модель аналитики документов

Статья
09/02/2024

Внимание

Выпуски общедоступной предварительной версии Document Intelligence предоставляют ранний доступ к функциям, которые находятся в активной разработке. Функции, подходы и процессы могут изменяться до общедоступной доступности на основе отзывов пользователей.
Общедоступная предварительная версия клиентских библиотек Аналитики документов по умолчанию использует REST API версии 2024-07-31-preview.
Общедоступная предварительная версия 2024-07-31-preview в настоящее время доступна только в следующих регионах Azure. Обратите внимание, что пользовательская модель создания (извлечение полей документов) в AI Studio доступна только в регионе "Северная часть США":
- Восточная часть США
- Западная часть США2
- Западная Европа
- Северная часть США

Это содержимое относится к: версии 4.0 (предварительная версия) | Предыдущие версии: v3.1 (GA) версии 3.0 (GA)

Это содержимое относится к: версия 3.1 (GA) | Последняя версия: версия 4.0 (предварительная версия) | Предыдущие версии: v3.0

Это содержимое относится к: версии 3.0 (GA) | Последние версии: версии 4.0 (предварительная версия) версии 3.1

Пользовательские модели нейронных документов или нейронные модели — это тип модели глубокого обучения, который объединяет функции макета и языка для точного извлечения помеченных полей из документов. Базовая настраиваемая нейронная модель обучена различным типам документов, что позволяет обученным для извлечения полей из структурированных и полуструктурированных документов. Пользовательские нейронные модели доступны в моделях версии 3.0 и более поздних моделей . В таблице ниже перечислены распространенные типы документов для каждой категории:

Документы	Примеры
структурированные	Опросы, анкеты
частично структурированные	Счета, заказы на покупку

Пользовательские нейронные модели используют те же формат меток и стратегию, что и модели пользовательских шаблонов. В настоящее время пользовательские нейронные модели поддерживают только подмножество типов полей, поддерживаемых пользовательскими моделями шаблонов.

Возможности модели

Внимание

Начиная с версии 2024-02-29-preview API пользовательские нейронные модели добавляют поддержку перекрывающихся полей и достоверности ячеек таблицы.

Пользовательские нейронные модели в настоящее время поддерживают пары "ключ-значение" и метки выбора и структурированные поля (таблицы).

Поля формы	Метки выделения	Табличные поля	Подпись	Метки регионов	Перекрывающиеся поля
Поддерживается	Поддерживаемые	Поддерживается	Не поддерживается	Поддерживается ¹	Поддерживается ²

¹ Метки регионов в пользовательских нейронных моделях используют результаты из API макета для указанного региона. Эта функция отличается от моделей шаблонов, в которых при отсутствии значения текст создается во время обучения.
² Перекрывающиеся поля поддерживаются начиная с версии 2024-02-29-previewREST API. Перекрывающиеся поля имеют некоторые ограничения. Дополнительные сведения см . в перекрывающихся полях.

Режим создания

Операция Build поддерживает шаблонные и нейронные пользовательские модели. Предыдущие версии REST API и клиентских библиотек поддерживают только один режим сборки, который теперь называется режимом шаблона .

Нейронные модели поддерживают документы с одинаковыми сведениями, но разной структурой страниц. Примеры этих документов включают США формы W2, которые имеют одинаковую информацию, но могут различаться в разных компаниях. Дополнительные сведения см. в разделе "Режим сборки пользовательской модели".

Перекрывающиеся поля

Благодаря выпуску версий API и более поздних пользовательских 2024-02-29-preview нейронных моделей поддерживаются перекрывающиеся поля:

Перекрывающиеся поля

В выпуске API версии 2024-07-31-preview и более поздних версий пользовательские нейронные модели будут поддерживать перекрывающиеся поля:

Чтобы использовать перекрывающиеся поля, набор данных должен содержать по крайней мере один пример с ожидаемым перекрытием. Чтобы пометить перекрытие, используйте метку регионов для обозначения каждого диапазона содержимого (с перекрытием) для каждого поля. Сбой при выделении поля (выделение значения) в Студии, так как метка региона является единственным поддерживаемым средством маркировки для указания перекрытия полей. Поддержка перекрытия включает:

Полное перекрытие. Один и тот же набор маркеров помечен для двух разных полей.
Частичное перекрытие. Некоторые маркеры относятся к обоим полям, но есть маркеры, которые являются только частью одного поля или другого.

Перекрывающиеся поля имеют некоторые ограничения:

Любой маркер или слово можно пометить только как два поля.
Перекрывающиеся поля в таблице не могут охватывать строки таблицы.
Перекрывающиеся поля можно распознать только в том случае, если хотя бы один пример в наборе данных содержит перекрывающиеся метки для этих полей.

Чтобы использовать перекрывающиеся поля, пометьте набор данных с перекрывающимися данными и обучите модель версией 2024-02-29-preview API или более поздней.

Табличные поля

В выпуске API версии 2022-06-30-preview и более поздних версий пользовательские нейронные модели поддерживают табличные поля (таблицы) для анализа данных таблицы, строки и ячейки с добавленной уверенностью:

Модели, обученные с помощью API версии 2022-06-30-preview или более поздней, будут принимать метки табличных полей.
Документы, проанализированные с помощью пользовательских нейронных моделей с использованием API версии 2022-06-30-preview или более поздней, будут создавать табличные поля, агрегированные по таблицам.
Результаты можно найти в массиве documents объекта analyzeResult, который возвращается после операции анализа.

Табличные поля поддерживают межстраничные таблицы по умолчанию:

Чтобы пометить таблицу, охватывающую несколько страниц, пометьте каждую строку таблицы на разных страницах в одной таблице.
Рекомендуется убедиться, что набор данных содержит несколько примеров ожидаемых вариантов. Например, включите образцы, в которых вся таблица находится на одной странице, и в которых таблицы занимают две или более страниц.

Табличные поля также полезны при извлечении повторяющихся данных в документе, который не распознается как таблица. Например, повторяющийся раздел об опыте работы в резюме можно пометить и извлечь как табличное поле.

Табличные поля предоставляют доверие к таблицам, строкам и ячейкам 2024-02-29-preview , начиная с API:

Исправленные или динамические таблицы добавляют поддержку достоверности для следующих элементов:
- Достоверность таблицы— мера точного распознавания всей таблицы.
- Достоверность строк— мера распознавания отдельной строки.
- Достоверность ячеек— мера распознавания отдельной ячейки.
Рекомендуемый подход — проверить точность в начале таблицы, а затем строку, а затем ячейку. Ознакомьтесь с оценками достоверности и точности, чтобы узнать больше о таблице, строке и достоверности ячеек.

Поддерживаемые языки и языковые стандарты

Ознакомьтесь со службой поддержки языка — пользовательскими моделями для полного списка поддерживаемых языков.

Поддерживаемые регионы

По состоянию на 18 октября 2022 г. обучение пользовательской нейронной модели аналитики документов будет доступно только в следующих регионах Azure до дальнейшего уведомления:

Восточная Австралия
Южная Бразилия
Центральная Канада
Центральная Индия
Центральная часть США
Восточная Азия
Восточная часть США
восточная часть США 2
Центральная Франция
Восточная Япония
Центрально-южная часть США
Юго-Восточная Азия
южная часть Соединенного Королевства
Западная Европа
западная часть США 2
US Gov (Аризона)
US Gov (Вирджиния)

Совет

Вы можете скопировать модель , обученную в одном из регионов выбора, перечисленных в любом другом регионе , и использовать ее соответствующим образом.

Используйте REST API или Document Intelligence Studio для копирования модели в другой регион.

Совет

Используйте REST API или Document Intelligence Studio для копирования модели в другой регион.

Совет

Используйте REST API или Document Intelligence Studio для копирования модели в другой регион.

Требования к входным данным

Для получения наилучших результатов предоставьте одну четкую фотографию или скан-копию документа высокого качества.

Поддерживаемые форматы файлов:

Модель	PDF	Изображение: jpeg/`jpg`, `png`, `bmp`, `tiffheif`	Microsoft Office: Word (docx), Excel (xlsx), PowerPoint (pptx) и HTML
Читать	✔	✔	✔
Макет	✔	✔	✔ (2024-02-29-preview, 2023-10-31-preview или более поздней версии)
Документ общего назначения	✔	✔
Готовое	✔	✔
Настраиваемая нейронная модель	✔	✔

✱ Файлы Microsoft Office сейчас не поддерживаются в других моделях или версиях.

Для PDF и TIFF можно обрабатывать до 2000 страниц (с подпиской на бесплатный уровень только первые две страницы обрабатываются).
Размер файла для анализа документов составляет 500 МБ для платного уровня (S0) и 4 МБ для бесплатного уровня (F0).
Изображения должны иметь размеры в пределах от 50 x 50 до 10 000 x 10 000 пикселей.
Если PDF-файлы заблокированы паролем, перед отправкой необходимо снять блокировку.
Минимальная высота извлекаемого текста составляет 12 пикселей для изображения размером 1024 x 768 пикселей. Это измерение соответствует тексту около 8точки в 150 точек на дюйм.
Для обучения пользовательской модели максимальный объем обучающих данных составляет 500 страниц для пользовательской модели шаблона и 50 000 страниц для пользовательской нейронной модели.
Для обучения пользовательской модели извлечения общий размер обучающих данных составляет 50 МБ для модели шаблона и 1G-МБ для нейронной модели.
Для обучения пользовательской модели классификации общий размер обучающих данных составляет 1GB не более 10 000 страниц.

Текущие ограничения

Пользовательская нейронная модель не распознает значения, разделенные по границам страницы.
Пользовательские неподдерживаемые типы полей игнорируются, если набор данных, помеченный для пользовательских моделей шаблонов, используется для обучения пользовательской нейронной модели.
Пользовательские нейронные модели ограничены 20 операциями сборки в месяц. Если нужно увеличить этот лимит, отправьте запрос в службу поддержки. Дополнительные сведения см. в разделе "Квоты и ограничения службы аналитики документов".

Обучение модели

Пользовательские нейронные модели доступны в моделях версии 3.0 и более поздних версий.

Тип документа	REST API	SDK	Создание меток и тестирование моделей
Пользовательский документ	Аналитика документов 3.1	Пакет SDK для аналитики документов	Document Intelligence Studio

Операция Build обучения модели поддерживает новое buildMode свойство, чтобы обучить пользовательскую нейронную модель, задать значение buildMode neural.

https://{endpoint}/documentintelligence/documentModels:build?api-version=2024-07-31-preview

{
  "modelId": "string",
  "description": "string",
  "buildMode": "neural",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

https://{endpoint}/formrecognizer/documentModels:build?api-version=v3.1:2023-07-31

{
  "modelId": "string",
  "description": "string",
  "buildMode": "neural",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

https://{endpoint}/formrecognizer/documentModels/{modelId}:copyTo?api-version=2022-08-31

{
  "modelId": "string",
  "description": "string",
  "buildMode": "neural",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

Выставление счетов

Начиная с версии 2024-07-31-preview, вы можете обучать настраиваемую нейронную модель дольше, чем стандартная 30 минут. Предыдущие версии ограничены 30 минутами на экземпляр обучения, в общей сложности 20 бесплатных экземпляров обучения в месяц. Теперь с 2024-07-31-previewпомощью , вы можете получить 10 часов бесплатного обучения модели и обучить модель до 10 часов.

Вы можете потратить все 10 бесплатных часов на одну сборку модели с большим набором данных или использовать ее в нескольких сборках, изменив максимальное значение длительности для build операции, указав maxTrainingHours:

POST https://{endpoint}/documentintelligence/documentModels:build?api-version=2024-07-31-preview

{
  "modelId": "string",
  "description": "string",
  "buildMode": "neural",
  ...,
  "maxTrainingHours": 10
}

Внимание

Если вы хотите обучить дополнительные нейронные модели или обучить модели в течение более длительного периода времени, превышающего 10 часов, взимается плата за выставление счетов. Дополнительные сведения о расходах на выставление счетов см. на странице цен.
Вы можете выбрать эту платную службу обучения, задав maxTrainingHours требуемое максимальное количество часов. Вызовы API без бюджета, но с набором maxTrainingHours в течение 10 часов завершаются сбоем.
Так как каждая сборка занимает разное время в зависимости от типа и размера обучающего набора данных, выставление счетов вычисляется за фактическое время, затраченное на обучение нейронной модели, не менее 30 минут на задание обучения.
Эта платная функция обучения позволяет обучать большие наборы данных на более длительные сроки с гибкостью в учебные часы.


GET /documentModels/{myCustomModel}
{
  "modelId": "myCustomModel",
  "trainingHours": 0.23,
  "docTypes": { ... },
  ...
}

Примечание.

Для версий аналитики v3.1 (2023-07-31) документов и v3.0 (2022-08-31)платного обучения пользовательской нейронной модели не включена. Для двух предыдущих версий вы получите не более 30 минут обучения для каждой модели. Если вы хотите обучить более 20 экземпляров модели, можно создать запрос поддержка Azure для увеличения лимита обучения.

Выставление счетов

Для версий Аналитики v3.1 (2023-07-31) and v3.0 (2022-08-31)документов вы получаете не более 30 минут обучения для каждой модели и не более 20 обучающих занятий бесплатно в месяц. Если вы хотите обучить более 20 экземпляров модели, можно создать запрос поддержка Azure для увеличения лимита обучения. Для поддержка Azure билета введите в summary поле: Increase Document Intelligence custom neural training (TPS) limit

Внимание

При увеличении лимита обучения обратите внимание, что 2 сеанса обучения нейронной модели будут рассматриваться как 1 час обучения. Дополнительные сведения о ценах на увеличение количества обучающих сеансов см. на странице цен.
поддержка Azure увеличение лимита обучения может применяться только на уровне ресурсов, а не на уровне подписки. Вы можете запросить увеличение объема обучения для одного ресурса аналитики документов, указав идентификатор ресурса и регион в запросе в службу поддержки.

Если вы хотите обучить модели в течение более длительного времени, чем 30 минут, мы поддерживаем платное обучение с нашей последней версией. v4.0 (2024-07-31-preview) Используя последнюю версию, модель можно обучить в течение длительного времени для обработки больших документов. Дополнительные сведения о платной подготовке см. в разделе Выставление счетов версии 4.0.

Выставление счетов

Внимание

При увеличении лимита обучения обратите внимание, что 2 сеанса обучения нейронной модели будут рассматриваться как 1 час обучения. Дополнительные сведения о ценах на увеличение количества обучающих сеансов см. на странице цен.
поддержка Azure увеличение лимита обучения может применяться только на уровне ресурсов, а не на уровне подписки. Вы можете запросить увеличение объема обучения для одного ресурса аналитики документов, указав идентификатор ресурса и регион в запросе в службу поддержки.

Если вы хотите обучить модели в течение более длительного времени, чем 30 минут, мы поддерживаем платное обучение с нашей последней версией. v4.0 (2024-07-31) Используя последнюю версию, модель можно обучить в течение длительного времени для обработки больших документов. Дополнительные сведения о платной подготовке см. в разделе Выставление счетов версии 4.0.

Следующие шаги

Создание и объединение настраиваемых моделей:

Создание пользовательской моделиCompose настраиваемых моделей

Поделиться через

Пользовательская нейронная модель аналитики документов

Возможности модели

Режим создания

Перекрывающиеся поля

Перекрывающиеся поля

Табличные поля

Поддерживаемые языки и языковые стандарты

Поддерживаемые регионы

Требования к входным данным

Рекомендации

Текущие ограничения

Обучение модели

Выставление счетов

Выставление счетов

Выставление счетов

Следующие шаги

Обратная связь

Дополнительные ресурсы