Поделиться через


Интерфейс Студии для аналитики документов

Это содержимое относится к: версии 4.0 (предварительная версия) | Предыдущие версии:синяя галочка флажок v3.1 (GA) версии 3.0 (GA) синяя галочка

Студия — это онлайн-средство для визуального изучения, изучения, обучения и интеграции функций из службы аналитики документов в приложения. Студия предоставляет платформу для экспериментов с различными моделями аналитики документов и примерами возвращаемых данных интерактивным образом без необходимости писать код. Вы можете использовать среду студии для:

  • Дополнительные сведения о различных возможностях в аналитике документов.
  • Используйте ресурс аналитики документов для тестирования моделей в примерах документов или отправки собственных документов.
  • Экспериментируйте с различными функциями надстройки и предварительной версии, чтобы адаптировать выходные данные к вашим потребностям.
  • Обучение пользовательских моделей классификации для классификации документов.
  • Обучение пользовательских моделей извлечения для извлечения полей из документов.
  • Получите пример кода для конкретного языка SDKs для интеграции с приложениями.

В настоящее время мы переживаем миграцию функций из Студии аналитики документов в новую студию ИИ. Существуют некоторые различия в предложениях для двух студий, которые определяют правильную студию для вашего варианта использования.

Выбор правильного интерфейса студии

В настоящее время существует две студии, Azure AI Studio и Document Intelligence Studio для создания и проверки моделей аналитики документов. По мере миграции опыта в новую студию ИИ некоторые возможности доступны в обеих студиях, а другие возможности и модели доступны только в одной из студий. Ниже приведены некоторые рекомендации по выбору интерфейса Студии для ваших потребностей. Все предварительно созданные модели и общие модели извлечения доступны в обеих студиях.

Когда следует использовать Document Intelligence Studio

Document Intelligence Studio — это устаревший интерфейс, содержащий все функции, выпущенные до июля 2024 года. Для любой из функций версии 2.1 версии 3.0 версии 3.1 продолжайте использовать Студию аналитики документов. Студии предоставляют визуальный интерфейс для маркировки, обучения и проверки пользовательских моделей. Для пользовательских моделей извлечения полей документов используйте Document Intelligence Studio для шаблонов и нейронных моделей. Пользовательские модели классификации можно обучить и использовать только в Document Intelligence Studio. Используйте Document Intelligence Studio, если вы хотите попробовать общедоступную версию моделей из версии 2.1, версии 3.0 и версии 3.1.

Когда следует использовать AI Studio

Начните с новой Студии ИИ Azure и попробуйте любую из предварительно созданных моделей документов из 2024-02-29-preview версии, включая общие модели извлечения, такие как чтение или макет. Если вы хотите создать и протестировать новую модель извлечения полей документов, попробуйте создать модель искусственного интеллекта, доступную только в новой студии ИИ.

Дополнительные сведения об Студии аналитики документов

Выберите интерфейс студии на следующих вкладках, чтобы узнать больше о каждой студии и о том, как начать работу.

Внимание

Студия поддерживает версии API Аналитики документов версии 3.0 и более поздних версий ДЛЯ анализа моделей и обучения пользовательских моделей. Ранее обученные модели версии 2.1 с помеченными данными поддерживаются, в отличие от обучения модели версии 2.1. Подробные сведения о переходе с версии 2.1 на версию 3.0 см. в руководстве по миграции API REST.

Используйте краткое руководство по Document Intelligence Studio для начала анализа документов с помощью анализа документов или предварительно созданных моделей. Создание пользовательских моделей и ссылка на модели в приложениях с помощью одного из определенных SDKsязыков. Чтобы использовать Document Intelligence Studio, необходимо получить следующие ресурсы из портал Azure:

  • Бесплатная подписка - Azure.

  • Служба ИИ Azure или ресурс аналитики документов. Получив подписку Azure, создайте на портале Azure ресурс для одной или нескольких служб, чтобы получить ключ и конечную точку. Используйте бесплатную ценовую категорию (F0), чтобы опробовать службу, а затем выполните обновление до платного уровня для рабочей среды.

Политики авторизации,

Ваша организация может отказаться от локальной проверки подлинности и применить проверку подлинности Microsoft Entra (прежнее название — Azure Active Directory) для ресурсов аналитики документов ИИ Azure и хранилища BLOB-объектов Azure.

Внимание

  • Убедитесь, что у вас есть роль пользователя Cognitive Services, а не роль участника Cognitive Services при настройке проверки подлинности Entra.
  • В контексте Azure роль участника может выполнять только действия для управления и управления самим ресурсом, включая перечисление ключей доступа.
  • Учетные записи пользователей с участником могут получить доступ только к службе аналитики документов, вызвав ключи доступа. Однако при настройке доступа с идентификатором Entra доступ к ключу будет отключен, а для использования ресурсов потребуется роль пользователя Cognitive Service.

Поддержка модели аналитики документов

Используйте мастер справки, интерфейс маркировки, шаг обучения и интерактивные визуализации, чтобы понять, как работает каждая функция.

  • Чтение: попробуйте использовать функцию "Чтение документов" в Студии документов с примерами документов или собственными документами и извлекать текстовые строки, слова, обнаруженные языки и стиль рукописного текста при обнаружении. Дополнительные сведения см. в разделе "Обзор чтения".

  • Макет: попробуйте использовать функцию макета Studio Аналитики документов с примерами документов или собственными документами и извлекать текст, таблицы, знаки выделения и сведения о структуре. Дополнительные сведения см. в разделе "Обзор макета".

  • Предварительно созданные модели: предварительно созданные модели аналитики документов позволяют добавлять интеллектуальную обработку документов в приложения и потоки без необходимости обучать и создавать собственные модели. В качестве примера начните с использования функции "Счет" в Студии. Дополнительные сведения см. в разделе "Общие сведения о моделях".

  • Пользовательские модели извлечения: функция пользовательских моделей Аналитики документов позволяет извлекать поля и значения из моделей, обученных данными, с учетом форм и документов. Чтобы извлечь данные из нескольких типов форм, создайте автономные пользовательские модели или объедините две или более пользовательских моделей и создайте созданную модель. Проверьте пользовательскую модель с помощью примеров документов и запустите итеративный процесс, чтобы ее улучшить. Дополнительные сведения см. в обзоре пользовательских моделей.

  • Пользовательские модели классификации: классификация документов — это новый сценарий, поддерживаемый аналитикой документов. API классификатора документов поддерживает сценарии классификации и разделения. Обучите модель классификации, чтобы определить различные типы документов, поддерживаемых приложением. Входной файл для модели классификации может содержать несколько документов и классифицирует каждый документ в соответствующем диапазоне страниц. Дополнительные сведения см. в разделе "Пользовательские модели классификации".

  • Возможности надстройки: Аналитика документов поддерживает более сложные возможности анализа. Эти необязательные возможности можно включить и отключить в студии с помощью Analyze Options кнопки на каждой странице модели. Доступны четыре возможности надстроек: highResolution, formula, fontи barcode extraction возможности. Дополнительные сведения см. в статье о возможностях надстройки.

Попробуйте модель аналитики документов

  • После настройки ресурса можно попробовать различные модели, предлагаемые Document Intelligence Studio. На первой странице выберите любую модель аналитики документов, чтобы попытаться использовать без кода.

  • Чтобы протестировать любую из предварительно созданных моделей или анализа документов, выберите модель и используйте один из примеров документов или отправьте собственный документ для анализа. Результат анализа отображается справа в окне содержимого-результирующий код.

  • Пользовательские модели должны быть обучены в документах. Общие сведения о пользовательских моделях см . в обзоре пользовательских моделей.

  • После проверки сценария в Студии аналитики документов используйте клиентские библиотеки Java, Java, JavaScript или Python или REST API, чтобы приступить к включению моделей аналитики документов в собственные приложения.

Дополнительные сведения о каждой модели см . на страницах концепции.

Просмотр сведений о ресурсе

Чтобы просмотреть сведения о ресурсе, например имя и ценовую категорию, щелкните значок "Параметры " в правом верхнем углу домашней страницы Document Intelligence Studio и перейдите на вкладку "Ресурс ". Если у вас есть доступ к другим ресурсам, можно также переключить ресурсы.

Снимок экрана: вкладка ресурсов на странице параметров Студии.

Благодаря аналитике документов вы можете быстро автоматизировать обработку данных в приложениях и рабочих процессах, легко улучшать стратегии на основе данных и эффективно дополнять возможности поиска документов.

Параметры анализа

  • Аналитика документов поддерживает сложные возможности анализа. Студия разрешает одну точку входа (кнопку "Анализ параметров") для настройки возможностей надстройки с легкостью.

  • В зависимости от сценария извлечения документов настройте диапазон анализа, диапазон страниц документов, необязательные функции обнаружения и обнаружения premium.

    Снимок экрана: диалоговое окно

    Примечание.

    Извлечение шрифтов не визуализировано в Studio Document Intelligence. Однако можно проверить раздел стилей выходных данных JSON для результатов обнаружения шрифтов.

Автоматические документы с предварительно созданными моделями или одной из собственных моделей
  • На странице меток модели извлечения можно автоматически пометить документы с помощью одной из предварительно созданных моделей или обученных моделей.

    Анимированный снимок экрана: автоматическая маркировка в Студии.

  • Для некоторых документов возможны повторяющиеся метки после запуска автоматической метки. Обязательно измените метки таким образом, чтобы на странице маркировки не было повторяющихся меток.

    Снимок экрана: предупреждение о дублировании меток после автоматического добавления меток.

Автоматические таблицы меток
  • На странице маркировки пользовательской модели извлечения теперь можно автоматически пометить таблицы в документе без необходимости пометить таблицы вручную.

    Анимированный снимок экрана: автоматическая метка таблицы в Студии.

Добавление тестовых файлов непосредственно в обучающий набор данных
  • Обучив пользовательскую модель извлечения, используйте тестовую страницу для улучшения качества модели, отправив тестовые документы в обучающий набор данных при необходимости.

  • Если для некоторых меток возвращается оценка достоверности с низким уровнем достоверности, убедитесь, что вы правильно помечаете содержимое. Если нет, добавьте их в набор данных обучения и перенастройте их для улучшения качества модели.

    Анимированный снимок экрана, показывающий, как добавить тестовые файлы в набор данных для обучения.

Использование параметров списка документов и фильтров в пользовательских проектах
  • Используйте страницу меток модели пользовательского извлечения, чтобы легко перемещаться по учебным документам, используя поиск, фильтрацию и сортировку по функциям.

  • Используйте представление сетки для предварительного просмотра документов или используйте представление списка для упрощения прокрутки документов.

    Снимок экрана: параметры представления списка документов и фильтры.

Общий доступ к проекту

Удобно использовать пользовательские проекты извлечения. Дополнительные сведения см. в разделе "Общий доступ к проекту" с пользовательскими моделями.

Устранение неполадок

Сценарий Причина Решение
При открытии пользовательского проекта вы получите сообщение
Form Recognizer Not Found об ошибке.
Ресурс аналитики документов, привязанный к пользовательскому проекту, был удален или перемещен в другую группу ресурсов. Существует два способа устранить эту проблему:
• повторно создайте ресурс аналитики документов в одной подписке и группе ресурсов с тем же именем.
• Повторно создайте пользовательский проект с перенесенным ресурсом аналитики документов и укажите ту же учетную запись хранения.
При использовании предварительно созданных приложений или открытии пользовательского проекта вы получите сообщение
PermissionDenied об ошибке.
Субъект не имеет доступа к API/Operation" при анализе предварительно созданных моделей или открытии пользовательского проекта. Скорее всего, локальная проверка подлинности (на основе ключей) отключена для ресурса Аналитики документов не имеет достаточно разрешений для доступа к ресурсу. Ссылка на назначения ролей Azure для настройки ролей доступа.
При открытии пользовательского проекта вы получите сообщение
AuthorizationPermissionMismatch об ошибке.
Запрос не авторизован для выполнения операции с помощью указанного разрешения. Скорее всего, для учетной записи хранения отключена локальная проверка подлинности (на основе ключа), и у вас нет разрешения на доступ к данным BLOB-объектов. Ссылка на назначения ролей Azure для настройки ролей доступа.
Вы не можете войти в Document Intelligence Studio и получить сообщение
об ошибке InteractionRequiredAuthError:login_required:AADSTS50058:A silent sign-request was sent but no user is signed in
Скорее всего, браузер блокирует сторонние файлы cookie, чтобы вы не могли успешно войти. Сведения об устранении см. в разделе "Управление сторонними параметрами " для браузера.
Управление параметрами сторонних производителей для доступа к Студии

Edge:

  • Перейдите в раздел "Параметры " для Microsoft Edge
  • Поиск "стороннего"
  • Перейти к управлению и удалению файлов cookie и данных сайта
  • Отключение параметра "Блокировать сторонние файлы cookie"

Chrome.

  • Перейдите в раздел "Параметры " для Chrome
  • Найдите "Сторонняя сторона"
  • В разделе "Поведение по умолчанию" выберите "Разрешить сторонние файлы cookie"

Firefox.

  • Перейдите в раздел "Параметры " для Firefox
  • Поиск файлов cookie
  • В разделе "Расширенная защита отслеживания" выберите " Управление исключениями"
  • Добавление исключения для https://documentintelligence.ai.azure.com или URL-адреса Studio Document Intelligence Studio в вашей среде

Safari.

  • Выбор параметров Safari>
  • Выбор конфиденциальности
  • Отмена выбора блокировки всех файлов cookie