OCR — оптическое распознавание символов
Распознавание текста или оптическое распознавание символов также называется распознаванием текста или извлечением текста. Методы распознавания текста на основе машинного обучения позволяют извлекать печатный или рукописный текст из изображений, таких как плакаты, уличные знаки и наклейки продуктов, а также из таких документов, как статьи, отчеты, формы и счета. Текст обычно извлекается как слова, текстовые строки и абзацы или текстовые блоки, что обеспечивает доступ к цифровой версии отсканированного текста. Это устраняет или значительно сокращает необходимость ввода данных вручную.
Как OCR связан с интеллектуальной обработкой документов (IDP)?
Интеллектуальная обработка документов (IDP) использует OCR в качестве базовой технологии для дополнительного извлечения структуры, связей, значений "ключ-значение", сущностей и других аналитических сведений, ориентированных на документ, с помощью расширенной службы искусственного интеллекта на основе машинного обучения, такой как аналитика документов. Аналитика документов включает оптимизированную для документов версию read в качестве подсистемы распознавания текста, делегируя другим моделям для получения аналитических сведений более высокого уровня. Если вы извлекаете текст из отсканированных и цифровых документов, используйте OCR для анализа документов.
Обработчик OCR
Модуль распознавания текста для чтения майкрософт состоит из нескольких расширенных моделей на основе машинного обучения, поддерживающих глобальные языки. Он может извлекать печатный и рукописный текст, включая смешанные языки и стили письма. Чтение доступно в виде облачной службы и локального контейнера для гибкости развертывания. В последней предварительной версии он также доступен в качестве синхронного API для отдельных сценариев, не относящихся только к документам, с повышением производительности, что упрощает реализацию пользовательского интерфейса с помощью OCR.
Предупреждение
Устаревший API распознавания текста в Azure AI Vision в версии 3.2 и API RecognizeText в операциях версии 2.1 не рекомендуется использовать.
Выпуски OCR (чтение)
Важно!
Выберите выпуск Read, который лучше всего соответствует вашим требованиям.
Входные данные | Примеры | Чтение выпуска | Преимущество |
---|---|---|---|
Изображения: общие, in-the-wild images | наклейки, уличные знаки и плакаты | OCR для изображений (предварительная версия 4.0) | Оптимизировано для общих изображений, не относящихся к документам, с синхронным API с улучшенной производительностью, что упрощает внедрение OCR в сценарии взаимодействия с пользователем. |
Документы: цифровые и отсканированные, включая изображения | книги, статьи и отчеты | Модель чтения аналитики документов | Оптимизировано для отсканированных и цифровых документов с большим объемом текста с помощью асинхронного API, помогающего автоматизировать интеллектуальную обработку документов в большом масштабе. |
Сведения о службе "Визуальное распознавание ИИ Azure" версии 3.2( общедоступная версия)
Ищете последнюю общедоступную версию Azure AI Vision версии 3.2. Прочитать? Все будущие усовершенствования распознавания текста для чтения являются частью двух служб, перечисленных ранее. В azure AI Vision версии 3.2 больше нет обновлений. Дополнительные сведения см. в разделах Вызов ОБЩЕДОСТУПНОго API azure AI Vision 3.2 Для чтения и Краткое руководство. Общедоступная версия Azure AI Vision 3.2.
Использование OCR
Попробуйте OCR с помощью Vision Studio. Затем перейдите по одной из ссылок на выпуск Read, который лучше всего соответствует вашим требованиям.
Поддерживаемые языки распознавания текста
Обе версии для чтения , доступные в Azure AI Vision, поддерживают несколько языков для печатного и рукописного текста. Распознавание текста для печатного текста включает поддержку английского, французского, немецкого, итальянского, португальского, испанского, китайского, японского, корейского, русского, арабского, хинди и других международных языков, использующих латинский, кириллица, арабский и деванагари. Распознавание текста для рукописного текста поддерживает английский, китайский (упрощенное письмо), французский, немецкий, итальянский, японский, корейский, португальский и испанский языки.
См. полный список языков, поддерживаемых OCR.
Общие функции распознавания текста
Модель распознавания текста считывания доступна в Службе визуального распознавания и анализа документов Azure с общими базовыми возможностями при оптимизации для соответствующих сценариев. В следующем списке перечислены общие возможности:
- Извлечение печатного и рукописного текста на поддерживаемых языках
- Страницы, текстовые строки и слова с оценкой расположения и достоверности
- Поддержка смешанных языков, смешанный режим (печать и рукописный ввод)
- Функция доступна как контейнер Distroless Docker для локального развертывания
Использование облачных API OCR или развертывание локальной среды
Облачные API являются предпочтительным вариантом для большинства клиентов из-за простоты интеграции и быстрой производительности. Azure и служба "Визуальное распознавание ИИ Azure" обрабатывают требования к масштабированию, производительности, безопасности данных и соответствию требованиям, а вы фокусируетесь на удовлетворении потребностей клиентов.
Для локального развертывания контейнер Docker для чтения позволяет развернуть общедоступные возможности OCR Azure AI Vision версии 3.2 в собственной локальной среде. Контейнеры соответствуют конкретным требованиям к безопасности и управлению данными.
Конфиденциальность и безопасность данных OCR
Как и все службы ИИ Azure, разработчики, использующие службу "Визуальное распознавание ИИ Azure", должны знать о политиках Корпорации Майкрософт в отношении данных клиентов. Дополнительные сведения см. на странице служб ИИ Azure в Центре управления безопасностью Майкрософт.
Дальнейшие действия
- Распознавание текста для общих (недокументных) изображений: краткое руководство по REST API анализа изображений Azure AI Vision 4.0 (предварительная версия).
- OCR для документов PDF, Office и HTML, а также изображений документов: начните с чтения аналитики документов.
- Ищете предыдущую общедоступную версию? Ознакомьтесь с краткими руководствами по пакету SDK azure AI Vision 3.2 или REST API.