Что такое "Визуальное распознавание ИИ Azure"?

Примечание

По состоянию на июль 2023 г. службы ИИ Azure охватывают все службы, которые ранее назывались Cognitive Services и Azure Applied AI Services. Цены не изменяются. Имена Cognitive Services и Прикладной ИИ Azure по-прежнему используются в API выставления счетов, анализа затрат, прейскурантах и ценах Azure. В программных интерфейсах приложений (API) или пакетах SDK нет критических изменений.

Служба Azure AI Vision предоставляет доступ к расширенным алгоритмам, которые обрабатывают изображения и возвращают сведения на основе интересующих вас визуальных функций.

Служба Описание
Оптическое распознавание текста (OCR) Служба оптического распознавания символов (OCR) извлекает текст из изображений. Вы также можете использовать API чтения для извлечения печатного и рукописного текста из фото и документов. Он использует модели на основе глубокого обучения и работает с текстом на различных поверхностях и фонах. таких как бизнес-документация, счета, квитанции, плакаты, визитные карточки, письма и доски. API OCR поддерживают извлечение печатного текста на нескольких языках. Чтобы приступить к работе, ознакомьтесь с этим руководством.
Анализ изображений Служба анализа изображений извлекает множество визуальных элементов из изображений, такие как объекты, лица, содержимое для взрослых и автоматически создаваемые текстовые описания. Чтобы приступить к работе, следуйте краткому руководству по Анализу изображений.
Распознавание лиц Служба "Распознавание лиц" предоставляет алгоритмы искусственного интеллекта, которые обнаруживают, распознают и анализируют лица людей в изображениях. Программное обеспечение для распознавания лиц имеет важное значение во многих различных сценариях, таких как проверка личности, управление доступом без сенсорного ввода и размытие лиц для конфиденциальности. Чтобы приступить к работе, ознакомьтесь с кратким руководством по службе "Распознавание лиц".
Пространственный анализ Служба пространственного анализа анализирует присутствие и передвижение людей в видеокадре и создает события, на которые могут реагировать другие системы. Установите контейнер пространственного анализа , чтобы приступить к работе.

Визуальное распознавание ИИ Azure для управления цифровыми активами

Визуальное распознавание ИИ Azure может использовать множество сценариев управления цифровыми активами (DAM). DAM — это бизнес-процесс организации, хранения и извлечения мультимедийных ресурсов, а также управления цифровыми правами и разрешениями. Например, компании может потребоваться группировать и обозначать изображения на основе видимых логотипов, лиц, объектов, цветов и т. д. Или, если вы хотите автоматически создавать подписи для изображений и прикреплять ключевые слова для возможности поиска. Сведения о едином решении DAM с использованием служб ИИ Azure, Когнитивный поиск Azure и интеллектуальных отчетов см. в руководстве по акселератору решений интеллектуального анализа знаний на сайте GitHub. Другие примеры DAM см. в репозитории Шаблонов решений визуального распознавания Azure .

Начало работы

Используйте Vision Studio , чтобы быстро опробовать функции ИИ в веб-браузере.

Чтобы приступить к созданию службы "Визуальное распознавание ИИ Azure" в приложении, выполните инструкции из краткого руководства.

Требования к образам

Визуальное распознавание ИИ Azure может анализировать изображения, соответствующие следующим требованиям:

  • Изображение должно быть представлено в формате JPEG, PNG, GIF или BMP.
  • Размер файла изображения должен быть меньше 4 МБ.
  • Размеры изображения должны быть больше 50 x 50 пикселей.
    • Для API чтения размеры изображения должны быть от 50 x 50 до 10 000 x 10 000 пикселей.

Конфиденциальность и безопасность данных

Как и все службы ИИ Azure, разработчики, использующие службу "Визуальное распознавание ИИ Azure", должны знать о политиках Корпорации Майкрософт в отношении данных клиентов. Дополнительные сведения см. на странице служб ИИ Azure в Центре управления безопасностью Майкрософт.

Дальнейшие действия

Следуйте инструкциям краткого руководства по внедрению и запуску службы на предпочитаемом языке разработки.