Dela via


Bildtexter (version 4.0)

Bildtexter i bildanalys 4.0 är tillgängliga via funktionerna Bildtext och Tät bildtext .

Bildtexten genererar en beskrivning med en mening för allt bildinnehåll. Kompakta bildtexter ger mer information genom att generera en meningsbeskrivningar av upp till 10 regioner av bilden förutom att beskriva hela bilden. Kompakta bildtexter returnerar också koordinater för avgränsningsrutor för de beskrivna bildregionerna. Båda dessa funktioner använder de senaste banbrytande Florence-baserade AI-modellerna.

För närvarande är bildtexter endast tillgängliga på engelska.

Viktigt!

Bildtexter i Bildanalys 4.0 är endast tillgängliga i vissa Azure-datacenterregioner: se Regiontillgänglighet. Du måste använda en visionsresurs som finns i någon av dessa regioner för att få resultat från funktionerna Bildtext och Tät bildtext.

Om du måste använda en visionsresurs utanför dessa regioner för att generera bildtexter använder du Bildanalys 3.2 som är tillgänglig i alla Azure AI Vision-regioner.

Prova funktionerna för bildtexter snabbt och enkelt i webbläsaren med hjälp av Vision Studio.

Könsneutrala bildtexter

Bildtexter innehåller könstermer ("man", "kvinna", "pojke" och "flicka") som standard. Du har möjlighet att ersätta dessa termer med "person" i dina resultat och få könsneutrala bildtexter. Du kan göra det genom att ange den valfria API-begärandeparametern, gender-neutral-caption till true i begärande-URL:en.

Exempel på bildtexter och kompakta bildtexter

Följande JSON-svar visar vad Analysis 4.0 API returnerar när du beskriver exempelbilden baserat på dess visuella funktioner.

Foto av en man som pekar på en skärm

"captions": [
    {
        "text": "a man pointing at a screen",
        "confidence": 0.4891590476036072
    }
]

Använda API:et

Bildtextfunktionen är en del av API:et Analysera bild . Inkludera Caption i frågeparametern funktioner . När du sedan får det fullständiga JSON-svaret parsar du strängen för innehållet i "captionResult" avsnittet.

Nästa steg