Использование Студии аналитики документов

Завершено

Tip

Дополнительные сведения см. на вкладке "Текст и изображения ".

Azure Document Intelligence Studio — это онлайн-средство для визуального изучения, понимания и интеграции функций из службы аналитики документов. Студию можно использовать для анализа макетов форм, извлечения данных из предварительно созданных моделей и обучения пользовательских моделей во всех визуальных интерфейсах.

Вы можете получить доступ к Студии по documentintelligence.ai.azure.com.

Снимок экрана: домашняя страница Document Intelligence Studio.

Возможности Студии

Студия Document Intelligence Studio поддерживает следующие типы проектов:

  • Модели анализа документов: проверьте модели чтения и моделей макета на своих документах, чтобы увидеть извлечённый текст, таблицы и структуру.

  • Предварительно созданные модели: анализ документов с помощью любой доступной предварительно созданной модели, таких как счета, квитанции, документы идентификатора и налоговые формы.

  • Пользовательские модели: сборка, метка, обучение и тестирование пользовательских моделей извлечения и пользовательских классификаторов.

Анализировать документы с использованием встроенных моделей

Чтобы извлечь данные из документов с помощью предварительно созданных моделей в Студии, выполните следующие действия.

  1. Создайте ресурс Azure Document Intelligence или Foundry Tools на портале Azure.
  2. Откройте Студию аналитики документов и выберите предварительно созданную модель (например, счет, квитанцию или документ идентификатора).
  3. Укажите конечную точку и ключ ресурса.
  4. Отправьте или укажите URL-адрес документа, который требуется проанализировать.
  5. Просмотрите извлеченные поля и их оценки достоверности.

Создавайте пользовательские модели проектов

Студию можно использовать для обработки всего процесса маркировки, обучения и тестирования пользовательских моделей без ручного создания JSON-файлов. Студия автоматически создает необходимые файлы ocr.json, файлы labels.json, и файлы fields.json.

Высокоуровневый рабочий процесс:

  1. Создайте ресурс аналитики документов Azure или Foundry.
  2. Отправьте по крайней мере 5-6 примеров форм в контейнер хранилища BLOB-объектов Azure.
  3. Настройте общий доступ к ресурсам между источниками (CORS), чтобы Студия могла получить доступ к вашему контейнеру хранилища.
  4. Создайте проект пользовательской модели в Студии, связав контейнер хранилища и ресурс Аналитики документов.
  5. Пометьте поля в образцах документов, используя визуальный интерфейс Студии.
  6. Обучите свою модель и проверьте метрики точности.
  7. Проверьте модель на основе нового документа, который не использовался во время обучения.

Дополнительные сведения о пользовательских типах моделей и альтернативном рабочем процессе обучения REST API/SDK см. в уроке обучения и использовании пользовательских моделей .

Возможности надстройки

Аналитика документов поддерживает дополнительные функции, которые можно включить в зависимости от сценария извлечения:

Функциональность Описание
Извлечение высокого разрешения Извлеките текст из документов с высоким разрешением с большей точностью.
Извлечение формул Обнаружение и извлечение математических формул из документов.
Извлечение свойств шрифта Извлеките сведения о шрифте, такие как стиль, вес и цвет.
Извлечение штрихкодов Обнаружение и чтение штрихкодов в документах.
Pdf-файл, доступный для поиска Преобразуйте сканированные документы в pdf-файлы, доступные для поиска.
Поля запроса Используйте запросы естественного языка для извлечения определенных полей из документов.
Пары "Ключ-значение" Извлечение связей пар "ключ-значение" из документов с помощью модели структуры.

Замечание

Некоторые возможности надстроек — это функции уровня "Премиум", которые требуют дополнительных затрат. Дополнительные сведения см. на странице цен .

Узнать больше