Opisy obrazów

Usługa Azure AI Vision może analizować obraz i generować czytelne dla człowieka frazę opisujące jej zawartość. Algorytm zwraca kilka opisów na podstawie różnych cech wizualnych, a każdy opis otrzymuje wskaźnik ufności. Końcowe dane wyjściowe to lista opisów uporządkowanych od najwyższego do najniższego zaufania.

Obecnie język angielski jest jedynym obsługiwanym językiem opisu obrazu.

Wypróbuj funkcje podpisów obrazów szybko i łatwo w przeglądarce przy użyciu programu Vision Studio.

Przykład opisu obrazu

Poniższa odpowiedź JSON ilustruje, co zwraca interfejs API analizy podczas opisywania przykładowego obrazu na podstawie jego funkcji wizualnych.

Czarny i biały obraz budynków na Manhattanie

{
   "description":{
      "tags":[
         "outdoor",
         "city",
         "white"
      ],
      "captions":[
         {
            "text":"a city with tall buildings",
            "confidence":0.48468858003616333
         }
      ]
   },
   "requestId":"7e5e5cac-ef16-43ca-a0c4-02bd49d379e9",
   "metadata":{
      "height":300,
      "width":239,
      "format":"Png"
   },
   "modelVersion":"2021-05-01"
}

Używanie interfejsu API

Funkcja opisu obrazu jest częścią interfejsu API analizowania obrazu . Ten interfejs API można wywołać za pomocą natywnego zestawu SDK lub wywołań REST. Dołącz Description do parametru zapytania visualFeatures . Następnie po otrzymaniu pełnej odpowiedzi JSON przeanalizuj ciąg zawartości "description" sekcji.

Następne kroki

Poznaj powiązane pojęcia dotyczące tagowania obrazów i kategoryzowania obrazów.