Классификация изображения

Помимо тегов и описания, анализ изображений 3.2 может возвращать категории на основе таксономии, обнаруженные на изображении. В отличие от тегов, категории организованы в родительской или дочерней иерархии, и их меньше (86, в отличие от тысяч тегов). Все категории имен указаны на английском языке. Классификация может быть выполнена сама по себе или вместе с более новой моделью тегов.

Таксономия 86 категорий

Azure AI Vision может классифицировать изображение широко или конкретно, используя список из 86 категорий на следующей схеме. Полную таксономию в формате текста см. в статье 86-Categories Taxonomy (Таксономия 86 категорий).

Grouped lists of all the categories in the category taxonomy

Примеры классификации изображений

Следующий ответ JSON иллюстрирует, что Azure AI Vision возвращает при классификации примера изображения на основе его визуальных функций.

A woman on the roof of an apartment building

{
    "categories": [
        {
            "name": "people_",
            "score": 0.81640625
        }
    ],
    "requestId": "bae7f76a-1cc7-4479-8d29-48a694974705",
    "metadata": {
        "height": 200,
        "width": 300,
        "format": "Jpeg"
    }
}

В следующей таблице показан типичный набор изображений и категория, возвращаемая Azure AI Vision для каждого изображения.

Изображения Категория
Four people posed together as a family people_group
A puppy sitting in a grassy field animal_dog
A person standing on a mountain rock at sunset outdoor_mountain
A pile of bread roles on a table food_bread

Использование API

Функция классификации является частью API анализа образа 3.2 . Вы можете вызывать этот API с помощью собственного пакета SDK или с помощью вызовов REST. Включите Categories в параметр запроса visualFeatures. Затем, получив полный ответ JSON, просто выполните анализ строки для поиска содержимого раздела "categories".

Следующие шаги

Изучите понятия, связанные с маркировкой и описанием изображений.