Bildbeskrivningar
Azure AI Vision kan analysera en bild och generera en mänsklig läsbar fras som beskriver dess innehåll. Algoritmen returnerar flera beskrivningar baserat på olika visuella funktioner och varje beskrivning får en konfidenspoäng. De slutliga utdata är en lista med beskrivningar ordnade från högsta till lägsta konfidens.
För närvarande är engelska det enda språk som stöds för bildbeskrivning.
Prova funktionerna för bildtexter snabbt och enkelt i webbläsaren med hjälp av Vision Studio.
Exempel på bildbeskrivning
Följande JSON-svar illustrerar vad ANALYS-API:et returnerar när du beskriver exempelbilden baserat på dess visuella funktioner.
{
"description":{
"tags":[
"outdoor",
"city",
"white"
],
"captions":[
{
"text":"a city with tall buildings",
"confidence":0.48468858003616333
}
]
},
"requestId":"7e5e5cac-ef16-43ca-a0c4-02bd49d379e9",
"metadata":{
"height":300,
"width":239,
"format":"Png"
},
"modelVersion":"2021-05-01"
}
Använda API:et
Bildbeskrivningsfunktionen är en del av API:et Analysera bild . Du kan anropa det här API:et via en intern SDK eller via REST-anrop. Inkludera Description
i frågeparametern visualFeatures . När du sedan får det fullständiga JSON-svaret parsar du strängen för innehållet i "description"
avsnittet.
Nästa steg
Lär dig om relaterade begrepp för att tagga bilder och kategorisera bilder.