Bild bildtext (version 4.0)

Bild bildtext i bildanalys 4.0 är tillgängliga via funktionerna Bildtext och Kompakta bildtexter.

Bildtexten genererar en beskrivning med en mening för allt bildinnehåll. Kompakta bildtexter ger mer information genom att generera en meningsbeskrivningar av upp till 10 regioner av bilden förutom att beskriva hela bilden. Kompakta bildtexter returnerar också koordinater för avgränsningsrutor för de beskrivna bildregionerna. Båda dessa funktioner använder de senaste banbrytande Florence-baserade AI-modellerna.

För närvarande är bild bildtext endast tillgänglig på engelska.

Viktigt!

Bild bildtext i Bildanalys 4.0 är endast tillgängligt i följande Azure-datacenterregioner: USA, östra, Frankrike, centrala, Korea, centrala, Europa, norra, Sydostasien, Europa, västra, USA, västra, Asien, östra. Du måste använda en visionsresurs som finns i någon av dessa regioner för att få resultat från funktionerna Bildtext och Tät bildtext.

Om du måste använda en visionsresurs utanför dessa regioner för att generera bildtext använder du Bildanalys 3.2 som är tillgänglig i alla Azure AI Vision-regioner.

Prova bilden bildtext funktionerna snabbt och enkelt i webbläsaren med hjälp av Vision Studio.

Könsneutrala bildtext

Bildtexter innehåller könstermer ("man", "kvinna", "pojke" och "flicka") som standard. Du har möjlighet att ersätta dessa termer med "person" i dina resultat och få könsneutrala bildtext. Du kan göra det genom att ange den valfria API-begärandeparametern, könsneutral-bildtext till true i begärande-URL:en.

Exempel på bildtexter och kompakta bildtexter

Följande JSON-svar visar vad Analysis 4.0 API returnerar när du beskriver exempelbilden baserat på dess visuella funktioner.

Photo of a man pointing at a screen

"captions": [
    {
        "text": "a man pointing at a screen",
        "confidence": 0.4891590476036072
    }
]

Använda API:et

Bildfunktionen bildtext ingår i API:et Analysera bild. Inkludera Caption i frågeparametern funktioner . När du sedan får det fullständiga JSON-svaret parsar du strängen för innehållet i "captionResult" avsnittet.

Nästa steg