Поделиться через


Создание пользовательских проектов Document Intelligence Studio

Это содержимое относится к: версии 4.0 (GA)checkmarkcheckmarkПредыдущие версии:флажокv3.1 (GA) версии 3.0 (GA)синяя галочка

Аналитика документов Azure в Foundry Tools Studio — это онлайн-средство, которое можно использовать для визуального изучения, понимания и интеграции функций из аналитики документов в приложения. В этом кратком руководстве показано, как настроить пользовательский проект в Document Intelligence Studio.

Предпосылки

Сведения о подписке, ресурсе и настройке проверки подлинности см. в статье "Начало работы с Document Intelligence Studio".

Предварительные требования для новых пользователей

Помимо учетной записи Azure и ресурса Document Intelligence или ресурса Microsoft Foundry, вам потребуется контейнер Azure Blob Storage и назначения ролей Azure.

Контейнер хранилища BLOB-объектов Azure

Требуется стандартная учетная запись хранения BLOB-объектов Azure. Контейнеры можно создавать для хранения и упорядочивания обучающих документов в учетной записи хранения. Если вы не знаете, как создать учетную запись хранения Azure с контейнером, выполните следующие краткие руководства.

Назначения ролей Azure

Для пользовательских проектов для различных сценариев требуются следующие назначения ролей:

  • Basic

    • Пользователь Cognitive Services: Эта роль необходима для ресурса Document Intelligence или Microsoft Foundry, чтобы обучать пользовательскую модель или проводить анализ с использованием обученных моделей.
    • Участник данных BLOB-объектов хранилища: для учетной записи хранения требуется эта роль для создания данных проекта и меток.
  • Advanced

    • Участник учетной записи хранения. Эта роль необходима для настройки параметров общего доступа к ресурсам (CORS) для учетной записи хранения. (Это однократное действие, если одна и та же учетная запись хранения используется повторно.)
    • Участник. Для создания группы ресурсов и ресурсов требуется эта роль.

    Note

    Если локальная проверка подлинности (на основе ключей) отключена для ресурса службы аналитики документов и учетной записи хранения, обязательно получите роли участника данных пользователей и blob-объектов Cognitive Services соответственно, чтобы у вас было достаточно разрешений на использование Document Intelligence Studio. Роли участника и участника учетной записи хранения позволяют перечислять ключи, но не дают разрешения на использование ресурсов при отключении доступа к ключам.

Настройка CORS

Общий доступ к ресурсам между источниками должен быть настроен в учетной записи хранения Azure, чтобы он был доступен в Document Intelligence Studio. Чтобы настроить CORS в портал Azure, необходимо получить доступ к вкладке CORS учетной записи хранения.

  1. Выберите вкладку CORS для учетной записи хранения.

    Снимок экрана: меню параметров CORS на портале Azure.

  2. Начните с создания записи CORS на вкладке службы BLOB-объектов .

  3. Задайте для разрешенныхhttps://documentintelligence.ai.azure.comисточников значение .

    Снимок экрана, на котором показана конфигурация CORS для учетной записи хранения.

    Вместо указанного домена можно использовать подстановочный знак * , чтобы разрешить всем доменам происхождения выполнять запросы через CORS.

  4. Выберите все доступные восемь вариантов для разрешенных методов.

  5. Утвердить все разрешенные заголовки и открытые заголовки , введя звездочку (*) в каждом поле.

  6. Задайте для параметра Max Age значение 120 секунд или любое допустимое значение.

  7. Чтобы сохранить изменения, нажмите кнопку "Сохранить " в верхней части страницы.

ТЕПЕРЬ CORS следует настроить для использования учетной записи хранения из Document Intelligence Studio.

Набор примеров документов

  1. Войдите на портал Azure. Перейдите в учетную запись хранения и выберитеконтейнеры> данных.

    Снимок экрана: меню хранилища данных на портале Azure.

  2. Выберите контейнер из списка.

  3. В меню в верхней части страницы нажмите кнопку "Отправить".

    Снимок экрана: кнопка

  4. На панели отправки BLOB-объектов выберите файлы для отправки.

    Снимок экрана: панель

Note

По умолчанию Document Intelligence Studio использует документы, расположенные в корне контейнера. Вы можете использовать данные, упорядоченные в папках, указав путь к папке в шагах по созданию проекта пользовательской формы. Дополнительные сведения см. в разделе "Упорядочение данных в вложенных папках".

Использование функций Document Intelligence Studio

Автоматические документы с предварительно созданными моделями или одной из собственных моделей

На странице маркировки для пользовательской модели извлечения теперь можно автоматически наметить документы с помощью одной из предварительно созданных моделей или обученных моделей.

Анимированный снимок экрана, на котором показана автоматическая маркировка.

Для некоторых документов возможны повторяющиеся метки после запуска автоматической метки. Обязательно измените метки, чтобы на странице маркировки не было повторяющихся меток.

Снимок экрана: предупреждение о дублировании меток после автоматической маркировки.

Таблицы автонастроки

На странице маркировки для пользовательской модели извлечения теперь можно автоматически добавлять таблицы в документ, не подписывая таблицы вручную.

Анимированный снимок экрана, на котором показана метка автозапуска.

Добавление тестовых файлов непосредственно в обучающий набор данных

После обучения пользовательской модели извлечения используйте тестовую страницу для улучшения качества модели, отправив тестовые документы в обучающий набор данных при необходимости.

Если для некоторых меток возвращается оценка достоверности с низким уровнем достоверности, убедитесь, что вы правильно помечаете содержимое. Если нет, добавьте их в набор данных обучения и перенастройте их для улучшения качества модели.

Анимированный снимок экрана, на котором показано, как добавить тестовые файлы в обучающий набор данных.

Использование параметров списка документов и фильтров в пользовательских проектах

Используйте страницу маркировки для пользовательской модели извлечения, чтобы пройти учебные документы с легкостью, используя функции поиска, фильтрации и сортировки.

Используйте представление сетки для предварительного просмотра документов или используйте представление списка для упрощения прокрутки документов.

Снимок экрана: параметры представления списка документов и фильтры.

Общий доступ к проекту

Удобно использовать пользовательские проекты извлечения. Дополнительные сведения см. в разделе "Общий доступ к проекту" с пользовательскими моделями.