Поделиться через


Что такое Document Intelligence Studio?

Это содержимое относится к: версии 4.0 (предварительная версия) | Предыдущие версии:синяя галочка флажок v3.1 (GA) версии 3.0 (GA) синяя галочка

Внимание

Document Intelligence Studio — это онлайн-средство для визуального изучения, изучения, обучения и интеграции функций из службы аналитики документов в приложения. Студия предоставляет платформу для экспериментов с различными моделями аналитики документов и примерами возвращаемых данных интерактивным образом без необходимости писать код. Используйте Студию аналитики документов для:

  • Дополнительные сведения о различных возможностях в аналитике документов.
  • Используйте ресурс аналитики документов для тестирования моделей в примерах документов или отправки собственных документов.
  • Экспериментируйте с различными функциями надстройки и предварительной версии, чтобы адаптировать выходные данные к вашим потребностям.
  • Обучение пользовательских моделей классификации для классификации документов.
  • Обучение пользовательских моделей извлечения для извлечения полей из документов.
  • Получите пример кода для конкретного языка SDKs для интеграции с приложениями.

Студия поддерживает версии API Аналитики документов версии 3.0 и более поздних версий ДЛЯ анализа моделей и обучения пользовательских моделей. Ранее обученные модели версии 2.1 с помеченными данными поддерживаются, в отличие от обучения модели версии 2.1. Подробные сведения о переходе с версии 2.1 на версию 3.0 см. в руководстве по миграции API REST.

Используйте краткое руководство по Document Intelligence Studio для начала анализа документов с помощью анализа документов или предварительно созданных моделей. Создание пользовательских моделей и ссылка на модели в приложениях с помощью одного из определенных SDKsязыков. Чтобы использовать Document Intelligence Studio, необходимо получить следующие ресурсы из портал Azure:

  • Бесплатная подписка - Azure.

  • Служба ИИ Azure или ресурс аналитики документов. Получив подписку Azure, создайте на портале Azure ресурс для одной или нескольких служб, чтобы получить ключ и конечную точку. Используйте бесплатную ценовую категорию (F0), чтобы опробовать службу, а затем выполните обновление до платного уровня для рабочей среды.

Политики авторизации,

Ваша организация может отказаться от локальной проверки подлинности и применить проверку подлинности Microsoft Entra (прежнее название — Azure Active Directory) для ресурсов аналитики документов ИИ Azure и хранилища BLOB-объектов Azure.

Внимание

  • Убедитесь, что у вас есть роль пользователя Cognitive Services, а не роль участника Cognitive Services при настройке проверки подлинности Entra.
  • В контексте Azure роль участника может выполнять только действия для управления и управления самим ресурсом, включая перечисление ключей доступа.
  • Учетные записи пользователей с участником могут получить доступ только к службе аналитики документов, вызвав ключи доступа. Однако при настройке доступа с идентификатором Entra доступ к ключу будет отключен, а для использования ресурсов потребуется роль пользователя Cognitive Service.

Поддержка модели аналитики документов

Используйте мастер справки, интерфейс маркировки, шаг обучения и интерактивные визуализации, чтобы понять, как работает каждая функция.

  • Чтение: попробуйте использовать функцию "Чтение документов" в Студии документов с примерами документов или собственными документами и извлекать текстовые строки, слова, обнаруженные языки и стиль рукописного текста при обнаружении. Дополнительные сведения см. в разделе "Обзор чтения".

  • Макет: попробуйте использовать функцию макета Studio Аналитики документов с примерами документов или собственными документами и извлекать текст, таблицы, знаки выделения и сведения о структуре. Дополнительные сведения см. в разделе "Обзор макета".

  • Предварительно созданные модели: предварительно созданные модели аналитики документов позволяют добавлять интеллектуальную обработку документов в приложения и потоки без необходимости обучать и создавать собственные модели. В качестве примера начните с использования функции "Счет" в Студии. Дополнительные сведения см. в разделе "Общие сведения о моделях".

  • Пользовательские модели извлечения: функция пользовательских моделей Аналитики документов позволяет извлекать поля и значения из моделей, обученных данными, с учетом форм и документов. Чтобы извлечь данные из нескольких типов форм, создайте автономные пользовательские модели или объедините две или более пользовательских моделей и создайте созданную модель. Проверьте пользовательскую модель с помощью примеров документов и запустите итеративный процесс, чтобы ее улучшить. Дополнительные сведения см. в обзоре пользовательских моделей.

  • Пользовательские модели классификации: классификация документов — это новый сценарий, поддерживаемый аналитикой документов. API классификатора документов поддерживает сценарии классификации и разделения. Обучите модель классификации, чтобы определить различные типы документов, поддерживаемых приложением. Входной файл для модели классификации может содержать несколько документов и классифицирует каждый документ в соответствующем диапазоне страниц. Дополнительные сведения см. в разделе "Пользовательские модели классификации".

  • Возможности надстройки: Аналитика документов поддерживает более сложные возможности анализа. Эти необязательные возможности можно включить и отключить в студии с помощью Analyze Options кнопки на каждой странице модели. Доступны четыре возможности надстроек: highResolution, formula, fontи barcode extraction возможности. Дополнительные сведения см. в статье о возможностях надстройки.

Попробуйте модель аналитики документов

  • После настройки ресурса можно попробовать различные модели, предлагаемые Document Intelligence Studio. На первой странице выберите любую модель аналитики документов, чтобы попытаться использовать без кода.

  • Чтобы протестировать любую из предварительно созданных моделей или анализа документов, выберите модель и используйте один из примеров документов или отправьте собственный документ для анализа. Результат анализа отображается справа в окне содержимого-результирующий код.

  • Пользовательские модели должны быть обучены в документах. Общие сведения о пользовательских моделях см . в обзоре пользовательских моделей.

  • После проверки сценария в Студии аналитики документов используйте клиентские библиотеки Java, Java, JavaScript или Python или REST API, чтобы приступить к включению моделей аналитики документов в собственные приложения.

Дополнительные сведения о каждой модели см . на страницах концепции.

Просмотр сведений о ресурсе

Чтобы просмотреть сведения о ресурсе, например имя и ценовую категорию, щелкните значок "Параметры " в правом верхнем углу домашней страницы Document Intelligence Studio и перейдите на вкладку "Ресурс ". Если у вас есть доступ к другим ресурсам, можно также переключить ресурсы.

Снимок экрана: вкладка ресурсов на странице параметров Студии.

Благодаря аналитике документов вы можете быстро автоматизировать обработку данных в приложениях и рабочих процессах, легко улучшать стратегии на основе данных и эффективно дополнять возможности поиска документов.

Параметры анализа

  • Аналитика документов поддерживает сложные возможности анализа. Студия разрешает одну точку входа (кнопку "Анализ параметров") для настройки возможностей надстройки с легкостью.

  • В зависимости от сценария извлечения документов настройте диапазон анализа, диапазон страниц документов, необязательные функции обнаружения и обнаружения premium.

    Снимок экрана: диалоговое окно

    Примечание.

    Извлечение шрифтов не визуализировано в Studio Document Intelligence. Однако можно проверить раздел стилей выходных данных JSON для результатов обнаружения шрифтов.

Автоматические документы с предварительно созданными моделями или одной из собственных моделей

  • На странице меток модели извлечения можно автоматически пометить документы с помощью одной из предварительно созданных моделей или обученных моделей.

    Анимированный снимок экрана: автоматическая маркировка в Студии.

  • Для некоторых документов возможны повторяющиеся метки после запуска автоматической метки. Обязательно измените метки таким образом, чтобы на странице маркировки не было повторяющихся меток.

    Снимок экрана: предупреждение о дублировании меток после автоматического добавления меток.

Автоматические таблицы меток

  • На странице маркировки пользовательской модели извлечения теперь можно автоматически пометить таблицы в документе без необходимости пометить таблицы вручную.

    Анимированный снимок экрана: автоматическая метка таблицы в Студии.

Добавление тестовых файлов непосредственно в обучающий набор данных

  • Обучив пользовательскую модель извлечения, используйте тестовую страницу для улучшения качества модели, отправив тестовые документы в обучающий набор данных при необходимости.

  • Если для некоторых меток возвращается оценка достоверности с низким уровнем достоверности, убедитесь, что вы правильно помечаете содержимое. Если нет, добавьте их в набор данных обучения и перенастройте их для улучшения качества модели.

    Анимированный снимок экрана, показывающий, как добавить тестовые файлы в набор данных для обучения.

Использование параметров списка документов и фильтров в пользовательских проектах

  • Используйте страницу меток модели пользовательского извлечения, чтобы легко перемещаться по учебным документам, используя поиск, фильтрацию и сортировку по функциям.

  • Используйте представление сетки для предварительного просмотра документов или используйте представление списка для упрощения прокрутки документов.

    Снимок экрана: параметры представления списка документов и фильтры.

Общий доступ к проекту

Удобно использовать пользовательские проекты извлечения. Дополнительные сведения см. в разделе "Общий доступ к проекту" с пользовательскими моделями.

Устранение неполадок

Сценарий Причина Решение
При открытии пользовательского проекта вы получите сообщение
Form Recognizer Not Found об ошибке.
Ресурс аналитики документов, привязанный к пользовательскому проекту, был удален или перемещен в другую группу ресурсов. Существует два способа устранить эту проблему:
• повторно создайте ресурс аналитики документов в одной подписке и группе ресурсов с тем же именем.
• Повторно создайте пользовательский проект с перенесенным ресурсом аналитики документов и укажите ту же учетную запись хранения.
При использовании предварительно созданных приложений или открытии пользовательского проекта вы получите сообщение
PermissionDenied об ошибке.
Субъект не имеет доступа к API/Operation" при анализе предварительно созданных моделей или открытии пользовательского проекта. Скорее всего, локальная проверка подлинности (на основе ключей) отключена для ресурса Аналитики документов не имеет достаточно разрешений для доступа к ресурсу. Ссылка на назначения ролей Azure для настройки ролей доступа.
При открытии пользовательского проекта вы получите сообщение
AuthorizationPermissionMismatch об ошибке.
Запрос не авторизован для выполнения операции с помощью указанного разрешения. Скорее всего, для учетной записи хранения отключена локальная проверка подлинности (на основе ключа), и у вас нет разрешения на доступ к данным BLOB-объектов. Ссылка на назначения ролей Azure для настройки ролей доступа.
Вы не можете войти в Document Intelligence Studio и получить сообщение
об ошибке InteractionRequiredAuthError:login_required:AADSTS50058:A silent sign-request was sent but no user is signed in
Скорее всего, браузер блокирует сторонние файлы cookie, чтобы вы не могли успешно войти. Сведения об устранении см. в разделе "Управление сторонними параметрами " для браузера.

Управление параметрами сторонних производителей для доступа к Студии

Edge:

  • Перейдите в раздел "Параметры " для Edge
  • Поиск "стороннего"
  • Перейти к управлению и удалению файлов cookie и данных сайта
  • Отключение параметра "Блокировать сторонние файлы cookie"

Chrome.

  • Перейдите в раздел "Параметры " для Chrome
  • Найдите "Сторонняя сторона"
  • В разделе "Поведение по умолчанию" выберите "Разрешить сторонние файлы cookie"

Firefox.

  • Перейдите в раздел "Параметры " для Firefox
  • Поиск файлов cookie
  • В разделе "Расширенная защита отслеживания" выберите " Управление исключениями"
  • Добавление исключения для https://documentintelligence.ai.azure.com или URL-адреса Studio Document Intelligence Studio в вашей среде

Safari.

  • Выбор параметров Safari>
  • Выбор конфиденциальности
  • Отмена выбора блокировки всех файлов cookie

Следующие шаги