Popisy obrázků

Článek
04/30/2024

Azure AI Vision dokáže analyzovat obrázek a vygenerovat pro člověka čitelnou frázi, která popisuje jeho obsah. Algoritmus vrátí několik popisů na základě různých vizuálních funkcí a každému popisu se přidělí skóre spolehlivosti. Konečným výstupem je seznam popisů seřazených od nejvyšší po nejnižší spolehlivost.

V současnosti je jediným podporovaným jazykem pro popis obrázku angličtina.

Vyzkoušejte funkce titulkování obrázků rychle a snadno ve svém prohlížeči pomocí nástroje Vision Studio.

Vyzkoušejte Vision Studio

Příklad popisu obrázku

Následující odpověď JSON ukazuje, co vrátí rozhraní API pro analýzu při popisu ukázkového obrázku na základě jeho vizuálních funkcí.

Černobílý obrázek budov na Manhattanu

{
   "description":{
      "tags":[
         "outdoor",
         "city",
         "white"
      ],
      "captions":[
         {
            "text":"a city with tall buildings",
            "confidence":0.48468858003616333
         }
      ]
   },
   "requestId":"7e5e5cac-ef16-43ca-a0c4-02bd49d379e9",
   "metadata":{
      "height":300,
      "width":239,
      "format":"Png"
   },
   "modelVersion":"2021-05-01"
}

Použití rozhraní API

Funkce popisu obrázku je součástí rozhraní API pro analýzu obrázků . Toto rozhraní API můžete volat prostřednictvím nativní sady SDK nebo prostřednictvím volání REST. Zahrňte Description do parametru dotazu visualFeatures . Když pak získáte úplnou odpověď JSON, parsujte řetězec pro obsah oddílu "description" .

Rychlý start: Rozhraní REST API pro analýzu obrázků nebo klientské knihovny

Další kroky

Seznamte se se souvisejícími koncepty označování a kategorizace obrázků.

Popisy obrázků

Příklad popisu obrázku

Použití rozhraní API

Další kroky

Další materiály