Изучение возможностей аналитики документов

Завершено

Аналитика документов зависит от моделей машинного обучения, которые обучены распознавать данные в тексте. Возможность извлечения пар "текст", "макет" и "ключ-значение" называется анализом документов. Анализ документов предоставляет расположения текста на странице, определяемой ограничивающими координатами поля.

A screenshot of a scanned receipt for the purchase of a Surface Pro and a Surface Pen.

Например, сведения в квитанции 123 Main Street сохраняются в виде key, address а также value123 Main Street. Анализ документов может записывать расположение значения поля как ограничивающие координаты поля [4.1, 2.2], [4.3, 2.2], [4.3, 2.4], [4.1, 2.4]. Модели машинного обучения могут интерпретировать данные в документе или форме, так как они обучены распознавать шаблоны в расположениях координат ограничивающего поля и тексте.

Задача автоматизации процесса анализа документов заключается в том, что формы и документы приходят во всех разных форматах. Например, в то время как налоговые формы и документы водительских лицензий включают имя отдельного лица, координаты ограничивающего поля для имени отличаются. Отдельные модели машинного обучения должны быть обучены для предоставления высококачественных результатов для различных форм и документов. Таким образом, иногда можно использовать предварительно созданные модели машинного обучения, которые были обучены на часто используемых форматах документов. В других случаях может потребоваться настроить модель машинного обучения для распознавания уникального формата документа.

Автоматизация процесса чтения текста и записи данных может ускорить операции, создать лучший интерфейс клиента, улучшить принятие решений и многое другое. Далее вы узнаете, как использовать службы ИИ Azure для реализации аналитики документов.