Використовуйте Document Intelligence Studio
Azure Document Intelligence Studio — це онлайн-інструмент для візуального дослідження, розуміння та інтеграції функцій сервісу Document Intelligence. Ви можете використовувати Studio для аналізу макетів форм, вилучення даних із готових моделей і навчання кастомних моделей — усе це через візуальний інтерфейс.
Ви можете потрапити до студії за адресою documentintelligence.ai.azure.com.
Можливості студії
Studio Document Intelligence підтримує такі типи проєктів:
Моделі аналізу документів: Перевірте моделі читання та верстки на власних документах, щоб побачити витягнутий текст, таблиці та структуру.
Готові моделі: Аналізуйте документи, використовуючи будь-яку доступну готову модель, таку як рахунки, чеки, документи та податкові форми.
Кастомні моделі: Створюйте, маркуйте, навчайте та тестуйте індивідуальні моделі екстракції та класифікатори.
Аналізуйте документи з готовими моделями
Щоб витягти дані з документів за допомогою готових моделей у Студії:
- Створіть ресурс Azure Document Intelligence або Foundry Tools у порталі Azure.
- Відкрийте Document Intelligence Studio і виберіть готову модель (наприклад, рахунок, чек або документ ідентифікації).
- Вкажіть свій ресурс і ключ.
- Завантажте або надайте URL документу, який хочете проаналізувати.
- Перегляньте вилучені поля та їхні рейтинги впевненості.
Створення проектів спеціальних моделей
Ви можете використовувати Studio для виконання всього процесу маркування, навчання та тестування власних моделей — без ручного створення JSON-файлів. Студія автоматично генерує необхідні ocr.json, labels.json, та fields.json файли.
Основний робочий процес такий:
- Створіть ресурс Azure Document Intelligence або Foundry.
- Завантажте щонайменше 5-6 зразків форм у контейнер Azure Blob Storage.
- Налаштуйте крос-оригінал спільного використання ресурсів (CORS), щоб Studio могла отримати доступ до вашого контейнера для зберігання.
- Створіть власний проєкт моделі в Студії, пов'язуючи контейнер для зберігання та ресурс Document Intelligence.
- Позначайте поля у зразках документів за допомогою візуального інтерфейсу Studio.
- Навчайте свою модель і переглядайте метрики точності.
- Протестуйте модель на новому документі, який не використовувався під час навчання.
Ви дізнаєтеся більше про типи кастомних моделей та альтернативний робочий процес навчання REST API/SDK у Train і використовуєте власні моделі .
Додаткові можливості
Document Intelligence підтримує додаткові функції, які можна увімкнути залежно від вашого сценарію вилучення:
| Спроможність | Опис |
|---|---|
| Вилучення високої роздільної здатності | Вилучайте текст із документів високої роздільної здатності з більшою точністю. |
| Екстракція за формулою | Виявляти та витягувати математичні формули з документів. |
| Вилучення властивостей шрифту | Витягніть інформацію про шрифт, таку як стиль, товщина та колір. |
| Вилучення штрихкодів | Виявляти та читати штрихкоди в документах. |
| Пошуковий PDF | Конвертуйте відскановані документи у пошукові PDF-файли. |
| Поля запитів | Використовуйте запити природною мовою, щоб витягти певні поля з документів. |
| Пари ключ-значення | Витягніть відношення ключ-значення пари з документів за допомогою моделі макету. |
Нотатка
Деякі додаткові можливості — це преміум-функції, які несуть додаткові витрати. Перевірте сторінку з цінами для деталей.