Що таке Azure Document Intelligence?
Azure Document Intelligence — це хмарний AI-сервіс у Microsoft Foundry, який використовує OCR та моделі глибокого навчання для вилучення тексту, пар ключ-значення, позначок вибору та таблиць із документів.
OCR записує структуру документа, створюючи межі навколо виявлених об'єктів на зображенні. Розташування зв'язаних полів записуються як координати відносно решти сторінки. Azure Document Intelligence повертає дані з обмежувальних коробок та іншу інформацію у структурованому форматі JSON, який зберігає зв'язки з оригінального документа.
Щоб створити високоточну модель вилучення документів з нуля, потрібні знання глибокого навчання, великі обчислювальні ресурси та тривалий час навчання. Azure Document Intelligence надає базові моделі, вже навчені на тисячах прикладів форм, тож ви можете досягти високоточного вилучення даних з мінімальними зусиллями.
Компоненти служби документальної розвідки
Azure Document Intelligence складається з трьох категорій моделей:
Моделі аналізу документів: Витягніть текст, структуру, таблиці та позначки вибору з документів. Модель читання витягує текст і виявляє мови, тоді як модель верстки додає вилучення таблиць і структур. Ви детально розглянете ці моделі у розділі «Використання готових моделей ».
Готові моделі: Витягніть інформацію з поширених типів документів — таких як рахунки, чеки, податкові форми, документи посвідчення особи та інше — без необхідності навчання. Повний список готових моделей ви побачите у розділі «Використання готових моделей ».
Власні моделі: Витягніть дані з форм, специфічних для вашого бізнесу, використовуючи власні марковані набори даних. Опції включають індивідуальні шаблонні моделі (швидкі та економічні для фіксованих макетів), кастомні нейронні моделі (вища точність для різних макетів), композиційні моделі та кастомні класифікатори. Ви дізнаєтеся про навчання та використання кастомних моделей у блокі Train і використання кастомних моделей .
Сервіси Access Document Intelligence
Доступ до Azure Document Intelligence можна кількома способами:
- REST API: Викликайте сервіс безпосередньо за допомогою HTTP-запитів.
- SDK клієнтської бібліотеки: Використовуйте SDK для Python, C#, Java та JavaScript.
- Document Intelligence Studio: Онлайн-інструмент для візуального дослідження, тестування та створення рішень Document Intelligence.
- Портал Microsoft Foundry: Інтеграція Document Intelligence з іншими інструментами Foundry.
Порада
Завдання цього модуля зосереджене на Python SDK. Базові служби REST можна використовувати будь-якою мовою.
Створіть ресурс Document Intelligence
Щоб користуватися Azure Document Intelligence, потрібен ресурс Azure. Ви можете скористатися наведеними нижче параметрами.
- Ресурс Foundry: мультисервісна підписка, яка надає доступ до кількох AI-сервісів під одним кінцевим пристроєм і ключем.
- Ресурс Azure Document Intelligence: ресурс для одного сервісу, який використовується лише з Document Intelligence.
Нотатка
Створіть ресурс Foundry, якщо плануєте отримувати доступ до кількох інструментів Foundry під одним кінцевим ключем і ключем. Для доступу лише до Document Intelligence створіть спеціальний ресурс Document Intelligence.
Вимоги до вводу
Azure Document Intelligence працює над вхідними документами, які відповідають таким вимогам:
- Формат має бути JPEG, PNG, BMP, PDF (текстовий або відсканований) або TIFF. Модель читання також підтримує формати файлів Microsoft Office.
- Розмір файлу має бути менше 500 МБ для стандартного рівня і 4 МБ для вільного рівня.
- Розміри зображення мають бути в діапазоні від 50 x 50 пікселів до 10 000 x 10 000 пікселів.
- PDF-документи повинні мати розміри менше 17 x 17 дюймів (розмір паперу A3).
- PDF-документи не повинні бути захищені паролем.