Описания изображений

Визуальное распознавание ИИ Azure может анализировать изображение и создавать удобочитаемую фразу, описывающую его содержимое. Алгоритм возвращает несколько описаний, основанных на различных визуальных характеристиках. Каждому описанию присваивается оценка достоверности. Готовые выходные данные представлены в виде списка описаний, упорядоченных по оценке достоверности (от самой высокой до самой низкой).

На данный момент английский является единственным поддерживаемым языком в описаниях изображений.

Быстро и легко опробуйте возможности добавления подписей к изображениям в браузере с помощью Vision Studio.

Пример описания изображения

В приведенном ниже ответе JSON показано, что именно возвращает API анализа при описании примера изображения на основе его визуальных характеристик.

Черно-белая фотография здания на Манхэттене

{
   "description":{
      "tags":[
         "outdoor",
         "city",
         "white"
      ],
      "captions":[
         {
            "text":"a city with tall buildings",
            "confidence":0.48468858003616333
         }
      ]
   },
   "requestId":"7e5e5cac-ef16-43ca-a0c4-02bd49d379e9",
   "metadata":{
      "height":300,
      "width":239,
      "format":"Png"
   },
   "modelVersion":"2021-05-01"
}

Использование API

Функция описания изображений является частью API Анализа изображений. Вы можете вызывать этот API с помощью собственного пакета SDK или с помощью вызовов REST. Включите Description в параметр запроса visualFeatures. Затем, когда вы получите полный ответ JSON, выполните синтаксический анализ строки для содержимого "description" раздела.

Дальнейшие действия

Изучите понятия, связанные с маркировкой и категоризацией изображений.