Начало работы с Visual Studio в Azure
Чтобы использовать службу визуального распознавания ИИ Azure, необходимо сначала создать ресурс для него в подписке Azure. Можно использовать один из следующих типов ресурсов.
- Azure AI Vision: конкретный ресурс для служб визуального распознавания. Используйте этот тип ресурса, если вы не планируете использовать другие службы ИИ или если вы хотите отслеживать использование и затраты для ресурса ai Vision отдельно.
- Службы ИИ Azure: общий ресурс, который включает в себя Azure AI Vision, а также множество других служб ИИ Azure, таких как язык ИИ Azure, речь ИИ Azure и другие. Используйте этот тип ресурса, если вы планируете использовать несколько служб ИИ Azure и хотите упростить администрирование и разработку.
После создания ресурса существует несколько способов использования API чтения Визуального распознавания Azure.
- Vision Studio
- REST API
- Комплекты средств разработки программного обеспечения (SDK): Python, C#, JavaScript
Ниже мы сосредоточимся на Студии Визуального зрения.
Azure AI Vision Studio
Azure AI Vision Studio предоставляет доступ к API распознавания искусственного интеллекта Azure через графический пользовательский интерфейс, который не требует написания кода для начала работы.
При открытии Vision Studio необходимо выбрать ресурс по умолчанию. Ресурс по умолчанию в Vision Studio должен быть ресурсом служб ИИ Azure, а не ресурсом Azure AI Vision.
На домашней странице Visual Studio можно выбрать оптическое распознавание символов и извлечь текст из плитки изображений , чтобы попробовать модуль OCR чтения. Ресурс начинает нести расходы на использование, когда он используется для возврата результатов. Используя один из собственных файлов или пример файла, можно увидеть, как модуль OCR чтения возвращает обнаруженные атрибуты. Эти атрибуты соответствуют тому, что компьютер обнаруживает в ограничивающих прямоугольниках.
За кулисами изображение анализируется для функций, включая людей, текст и объекты, и помечается ограничивающими полями. Обнаруженные сведения обрабатываются, а результаты возвращаются пользователю. Необработанные результаты возвращаются в формате JSON и содержат сведения о расположениях ограничивающего поля на странице и обнаруженном тексте. Помните, что Vision Studio может возвращать примеры OCR, но для создания собственного приложения OCR необходимо работать с пакетом SDK или REST API.