Використовуйте Document Intelligence Studio

Завершено

Azure Document Intelligence Studio — це онлайн-інструмент для візуального дослідження, розуміння та інтеграції функцій сервісу Document Intelligence. Ви можете використовувати Studio для аналізу макетів форм, вилучення даних із готових моделей і навчання кастомних моделей — усе це через візуальний інтерфейс.

Ви можете потрапити до студії за адресою documentintelligence.ai.azure.com.

Скріншот, що показує головну сторінку Document Intelligence Studio.

Можливості студії

Studio Document Intelligence підтримує такі типи проєктів:

  • Моделі аналізу документів: Перевірте моделі читання та верстки на власних документах, щоб побачити витягнутий текст, таблиці та структуру.

  • Готові моделі: Аналізуйте документи, використовуючи будь-яку доступну готову модель, таку як рахунки, чеки, документи та податкові форми.

  • Кастомні моделі: Створюйте, маркуйте, навчайте та тестуйте індивідуальні моделі екстракції та класифікатори.

Аналізуйте документи з готовими моделями

Щоб витягти дані з документів за допомогою готових моделей у Студії:

  1. Створіть ресурс Azure Document Intelligence або Foundry Tools у порталі Azure.
  2. Відкрийте Document Intelligence Studio і виберіть готову модель (наприклад, рахунок, чек або документ ідентифікації).
  3. Вкажіть свій ресурс і ключ.
  4. Завантажте або надайте URL документу, який хочете проаналізувати.
  5. Перегляньте вилучені поля та їхні рейтинги впевненості.

Створення проектів спеціальних моделей

Ви можете використовувати Studio для виконання всього процесу маркування, навчання та тестування власних моделей — без ручного створення JSON-файлів. Студія автоматично генерує необхідні ocr.json, labels.json, та fields.json файли.

Основний робочий процес такий:

  1. Створіть ресурс Azure Document Intelligence або Foundry.
  2. Завантажте щонайменше 5-6 зразків форм у контейнер Azure Blob Storage.
  3. Налаштуйте крос-оригінал спільного використання ресурсів (CORS), щоб Studio могла отримати доступ до вашого контейнера для зберігання.
  4. Створіть власний проєкт моделі в Студії, пов'язуючи контейнер для зберігання та ресурс Document Intelligence.
  5. Позначайте поля у зразках документів за допомогою візуального інтерфейсу Studio.
  6. Навчайте свою модель і переглядайте метрики точності.
  7. Протестуйте модель на новому документі, який не використовувався під час навчання.

Ви дізнаєтеся більше про типи кастомних моделей та альтернативний робочий процес навчання REST API/SDK у Train і використовуєте власні моделі .

Додаткові можливості

Document Intelligence підтримує додаткові функції, які можна увімкнути залежно від вашого сценарію вилучення:

Спроможність Опис
Вилучення високої роздільної здатності Вилучайте текст із документів високої роздільної здатності з більшою точністю.
Екстракція за формулою Виявляти та витягувати математичні формули з документів.
Вилучення властивостей шрифту Витягніть інформацію про шрифт, таку як стиль, товщина та колір.
Вилучення штрихкодів Виявляти та читати штрихкоди в документах.
Пошуковий PDF Конвертуйте відскановані документи у пошукові PDF-файли.
Поля запитів Використовуйте запити природною мовою, щоб витягти певні поля з документів.
Пари ключ-значення Витягніть відношення ключ-значення пари з документів за допомогою моделі макету.

Нотатка

Деякі додаткові можливості — це преміум-функції, які несуть додаткові витрати. Перевірте сторінку з цінами для деталей.

Докладніше