Kép képaláírás (4.0-s verzió)

A Képelemzés 4.0 kép képaláírás a Felirat és a Sűrű feliratok funkcióval érhetők el.

A felirat egy mondatos leírást hoz létre az összes képtartalomhoz. A sűrű feliratok a teljes kép leírásán kívül a kép legfeljebb 10 régiójának egy mondatos leírásával nyújtanak részletesebb tájékoztatást. A sűrű feliratok a leírt képterületek határolókeret-koordinátáit is visszaadják. Mindkét funkció a legújabb, firenzei AI-alapú modelleket használja.

A kép képaláírás jelenleg csak angol nyelven érhető el.

Fontos

Az Image Analysis 4.0 rendszerkép-képaláírás csak az alábbi Azure-adatközpontokban érhető el: USA keleti régiója, Közép-Franciaország, Közép-Korea, Észak-Európa, Délkelet-Ázsia, Nyugat-Európa, USA nyugati régiója, Kelet-Ázsia. Az alábbi régiókban található Vision-erőforrást kell használnia az eredmények lekéréséhez a Felirat és a Sűrű feliratok funkcióból.

Ha ezeken a régiókon kívüli Vision-erőforrást kell használnia a rendszerkép-képaláírás létrehozásához, használja az Összes Azure AI Vision-régióban elérhető Image Analysis 3.2-t.

A Vision Studióval gyorsan és egyszerűen kipróbálhatja a kép képaláírás funkciókat a böngészőben.

Nem-semleges képaláírás

A feliratok alapértelmezés szerint nemi kifejezéseket ("férfi", "nő", "fiú" és "lány") tartalmaznak. Lehetősége van arra, hogy ezeket a kifejezéseket "személy" kifejezésre cserélje le az eredményekben, és megkapja a nemek közötti semleges képaláírás. Ezt úgy teheti meg, hogy a kérelem URL-címében beállítja a nemek közötti semleges képaláírástrue opcionális API-kérelemparamétert.

Feliratok és sűrű feliratok – példák

Az alábbi JSON-válasz bemutatja, hogy az Analysis 4.0 API mit ad vissza a példakép vizuális funkciói alapján történő leírásához.

Photo of a man pointing at a screen

"captions": [
    {
        "text": "a man pointing at a screen",
        "confidence": 0.4891590476036072
    }
]

Az API használata

A kép képaláírás funkció az Analyze Image API része. Szerepeljen Caption a funkciók lekérdezési paraméterében. Ezután, amikor megkapja a teljes JSON-választ, elemezheti a szakasz tartalmához tartozó sztringet "captionResult" .

Következő lépések