Начало работы с Visual Studio в Azure

Завершено

Чтобы использовать службу визуального распознавания ИИ Azure, необходимо сначала создать ресурс для него в подписке Azure. Можно использовать один из следующих типов ресурсов.

  • Azure AI Vision: конкретный ресурс для служб визуального распознавания. Используйте этот тип ресурса, если вы не планируете использовать другие службы ИИ или если вы хотите отслеживать использование и затраты для ресурса ai Vision отдельно.
  • Службы ИИ Azure: общий ресурс, который включает в себя Azure AI Vision, а также множество других служб ИИ Azure, таких как язык ИИ Azure, речь ИИ Azure и другие. Используйте этот тип ресурса, если вы планируете использовать несколько служб ИИ Azure и хотите упростить администрирование и разработку.

После создания ресурса существует несколько способов использования API чтения Визуального распознавания Azure.

  • Vision Studio
  • REST API
  • Комплекты средств разработки программного обеспечения (SDK): Python, C#, JavaScript

Ниже мы сосредоточимся на Студии Визуального зрения.

Azure AI Vision Studio

Azure AI Vision Studio предоставляет доступ к API распознавания искусственного интеллекта Azure через графический пользовательский интерфейс, который не требует написания кода для начала работы.

A screenshot showing the Vision Studio interface.

При открытии Vision Studio необходимо выбрать ресурс по умолчанию. Ресурс по умолчанию в Vision Studio должен быть ресурсом служб ИИ Azure, а не ресурсом Azure AI Vision.

На домашней странице Visual Studio можно выбрать оптическое распознавание символов и извлечь текст из плитки изображений , чтобы попробовать модуль OCR чтения. Ресурс начинает нести расходы на использование, когда он используется для возврата результатов. Используя один из собственных файлов или пример файла, можно увидеть, как модуль OCR чтения возвращает обнаруженные атрибуты. Эти атрибуты соответствуют тому, что компьютер обнаруживает в ограничивающих прямоугольниках.

A screenshot showing the detected attributes.

За кулисами изображение анализируется для функций, включая людей, текст и объекты, и помечается ограничивающими полями. Обнаруженные сведения обрабатываются, а результаты возвращаются пользователю. Необработанные результаты возвращаются в формате JSON и содержат сведения о расположениях ограничивающего поля на странице и обнаруженном тексте. Помните, что Vision Studio может возвращать примеры OCR, но для создания собственного приложения OCR необходимо работать с пакетом SDK или REST API.

A screenshot showing bounding boxes and the related json returned.