Использование Студии аналитики документов
Tip
Дополнительные сведения см. на вкладке "Текст и изображения ".
Azure Document Intelligence Studio — это онлайн-средство для визуального изучения, понимания и интеграции функций из службы аналитики документов. Студию можно использовать для анализа макетов форм, извлечения данных из предварительно созданных моделей и обучения пользовательских моделей во всех визуальных интерфейсах.
Вы можете получить доступ к Студии по documentintelligence.ai.azure.com.
Возможности Студии
Студия Document Intelligence Studio поддерживает следующие типы проектов:
Модели анализа документов: проверьте модели чтения и моделей макета на своих документах, чтобы увидеть извлечённый текст, таблицы и структуру.
Предварительно созданные модели: анализ документов с помощью любой доступной предварительно созданной модели, таких как счета, квитанции, документы идентификатора и налоговые формы.
Пользовательские модели: сборка, метка, обучение и тестирование пользовательских моделей извлечения и пользовательских классификаторов.
Анализировать документы с использованием встроенных моделей
Чтобы извлечь данные из документов с помощью предварительно созданных моделей в Студии, выполните следующие действия.
- Создайте ресурс Azure Document Intelligence или Foundry Tools на портале Azure.
- Откройте Студию аналитики документов и выберите предварительно созданную модель (например, счет, квитанцию или документ идентификатора).
- Укажите конечную точку и ключ ресурса.
- Отправьте или укажите URL-адрес документа, который требуется проанализировать.
- Просмотрите извлеченные поля и их оценки достоверности.
Создавайте пользовательские модели проектов
Студию можно использовать для обработки всего процесса маркировки, обучения и тестирования пользовательских моделей без ручного создания JSON-файлов. Студия автоматически создает необходимые файлы ocr.json, файлы labels.json, и файлы fields.json.
Высокоуровневый рабочий процесс:
- Создайте ресурс аналитики документов Azure или Foundry.
- Отправьте по крайней мере 5-6 примеров форм в контейнер хранилища BLOB-объектов Azure.
- Настройте общий доступ к ресурсам между источниками (CORS), чтобы Студия могла получить доступ к вашему контейнеру хранилища.
- Создайте проект пользовательской модели в Студии, связав контейнер хранилища и ресурс Аналитики документов.
- Пометьте поля в образцах документов, используя визуальный интерфейс Студии.
- Обучите свою модель и проверьте метрики точности.
- Проверьте модель на основе нового документа, который не использовался во время обучения.
Дополнительные сведения о пользовательских типах моделей и альтернативном рабочем процессе обучения REST API/SDK см. в уроке обучения и использовании пользовательских моделей .
Возможности надстройки
Аналитика документов поддерживает дополнительные функции, которые можно включить в зависимости от сценария извлечения:
| Функциональность | Описание |
|---|---|
| Извлечение высокого разрешения | Извлеките текст из документов с высоким разрешением с большей точностью. |
| Извлечение формул | Обнаружение и извлечение математических формул из документов. |
| Извлечение свойств шрифта | Извлеките сведения о шрифте, такие как стиль, вес и цвет. |
| Извлечение штрихкодов | Обнаружение и чтение штрихкодов в документах. |
| Pdf-файл, доступный для поиска | Преобразуйте сканированные документы в pdf-файлы, доступные для поиска. |
| Поля запроса | Используйте запросы естественного языка для извлечения определенных полей из документов. |
| Пары "Ключ-значение" | Извлечение связей пар "ключ-значение" из документов с помощью модели структуры. |
Замечание
Некоторые возможности надстроек — это функции уровня "Премиум", которые требуют дополнительных затрат. Дополнительные сведения см. на странице цен .