Классификация изображения

Статья
01/23/2024

Помимо тегов и описания, анализ изображений 3.2 может возвращать категории на основе таксономии, обнаруженные на изображении. В отличие от тегов, категории организованы в родительской или дочерней иерархии, и их меньше (86, в отличие от тысяч тегов). Все категории имен указаны на английском языке. Классификация может быть выполнена сама по себе или вместе с более новой моделью тегов.

Таксономия 86 категорий

Azure AI Vision может классифицировать изображение широко или конкретно, используя список из 86 категорий на следующей схеме. Полную таксономию в формате текста см. в статье 86-Categories Taxonomy (Таксономия 86 категорий).

Сгруппированный список всех категорий в классификации категорий

Примеры классификации изображений

Следующий ответ JSON иллюстрирует, что Azure AI Vision возвращает при классификации примера изображения на основе его визуальных функций.

Женщина на крыше жилого дома

{
    "categories": [
        {
            "name": "people_",
            "score": 0.81640625
        }
    ],
    "requestId": "bae7f76a-1cc7-4479-8d29-48a694974705",
    "metadata": {
        "height": 200,
        "width": 300,
        "format": "Jpeg"
    }
}

В следующей таблице показан типичный набор изображений и категория, возвращаемая Azure AI Vision для каждого изображения.

Изображения	Категория
	people_group
	animal_dog
	outdoor_mountain
	food_bread

Использование API

Функция классификации является частью API анализа образа 3.2 . Вы можете вызывать этот API с помощью собственного пакета SDK или с помощью вызовов REST. Включите Categories в параметр запроса visualFeatures. Затем, получив полный ответ JSON, просто выполните анализ строки для поиска содержимого раздела "categories".

Краткое руководство. REST API визуального распознавания или клиентские библиотеки

Следующие шаги

Изучите понятия, связанные с маркировкой и описанием изображений.

Поделиться через