Popisy obrázků

Azure AI Vision dokáže analyzovat obrázek a vygenerovat pro člověka čitelnou frázi, která popisuje jeho obsah. Algoritmus vrátí několik popisů na základě různých vizuálních funkcí a každému popisu se přidělí skóre spolehlivosti. Konečným výstupem je seznam popisů seřazených od nejvyšší po nejnižší spolehlivost.

V současnosti je jediným podporovaným jazykem pro popis obrázku angličtina.

Vyzkoušejte funkce titulkování obrázků rychle a snadno ve svém prohlížeči pomocí nástroje Vision Studio.

Příklad popisu obrázku

Následující odpověď JSON ukazuje, co vrátí rozhraní API pro analýzu při popisu ukázkového obrázku na základě jeho vizuálních funkcí.

Černobílý obrázek budov na Manhattanu

{
   "description":{
      "tags":[
         "outdoor",
         "city",
         "white"
      ],
      "captions":[
         {
            "text":"a city with tall buildings",
            "confidence":0.48468858003616333
         }
      ]
   },
   "requestId":"7e5e5cac-ef16-43ca-a0c4-02bd49d379e9",
   "metadata":{
      "height":300,
      "width":239,
      "format":"Png"
   },
   "modelVersion":"2021-05-01"
}

Použití rozhraní API

Funkce popisu obrázku je součástí rozhraní API pro analýzu obrázků . Toto rozhraní API můžete volat prostřednictvím nativní sady SDK nebo prostřednictvím volání REST. Zahrňte Description do parametru dotazu visualFeatures . Když pak získáte úplnou odpověď JSON, parsujte řetězec pro obsah oddílu "description" .

Další kroky

Seznamte se se souvisejícími koncepty označování akategorizace obrázků.