Поделиться через


Классификация изображения

Помимо тегов и описания, анализ изображений 3.2 может возвращать категории на основе таксономии, обнаруженные на изображении. В отличие от тегов, категории организованы в родительской или дочерней иерархии, и их меньше (86, в отличие от тысяч тегов). Все категории имен указаны на английском языке. Классификация может быть выполнена сама по себе или вместе с более новой моделью тегов.

Таксономия 86 категорий

Azure AI Vision может классифицировать изображение широко или конкретно, используя список из 86 категорий на следующей схеме. Полную таксономию в формате текста см. в статье 86-Categories Taxonomy (Таксономия 86 категорий).

Сгруппированный список всех категорий в классификации категорий

Примеры классификации изображений

Следующий ответ JSON иллюстрирует, что Azure AI Vision возвращает при классификации примера изображения на основе его визуальных функций.

Женщина на крыше жилого дома

{
    "categories": [
        {
            "name": "people_",
            "score": 0.81640625
        }
    ],
    "requestId": "bae7f76a-1cc7-4479-8d29-48a694974705",
    "metadata": {
        "height": 200,
        "width": 300,
        "format": "Jpeg"
    }
}

В следующей таблице показан типичный набор изображений и категория, возвращаемая Azure AI Vision для каждого изображения.

Изображения Категория
Четыре человека позируют как семья people_group
Щенок, сидящий на лужайке animal_dog
Человек, стоящий на скале на закате outdoor_mountain
Гора булочек на столе food_bread

Использование API

Функция классификации является частью API анализа образа 3.2 . Вы можете вызывать этот API с помощью собственного пакета SDK или с помощью вызовов REST. Включите Categories в параметр запроса visualFeatures. Затем, получив полный ответ JSON, просто выполните анализ строки для поиска содержимого раздела "categories".

Следующие шаги

Изучите понятия, связанные с маркировкой и описанием изображений.