Képfeliratok (4.0-s verzió)
A Képelemzés 4.0 képfeliratai a Felirat és a Sűrű feliratok funkcióval érhetők el.
A Felirat funkció egy mondatos leírást készít az összes kép tartalmáról. A sűrű feliratok a teljes kép leírásán kívül a kép 10 különböző régiójának egy mondatos leírását is tartalmazzák. A sűrű feliratok a leírt képterületek határolókeret-koordinátáit is visszaadják. Mindkét funkció a legújabb Firenze-alapú AI-modelleket használja.
A képfeliratok csak angol nyelven érhetők el.
Fontos
Az Image Analysis 4.0 rendszerképfeliratozása csak bizonyos Azure-adatközpont-régiókban érhető el: lásd a régió rendelkezésre állását. Az alábbi régiókban található Azure AI Vision-erőforrást kell használnia a feliratok és a sűrű feliratok funkcióinak eredményeinek lekéréséhez.
Ha ezeken a régiókon kívüli Vision-erőforrást kell használnia képaláírások létrehozásához, használja az Összes Azure AI Vision-régióban elérhető Image Analysis 3.2-t .
A Vision Studióval gyorsan és egyszerűen kipróbálhatja a képfeliratozási funkciókat a böngészőben.
Nem-semleges feliratok
Alapértelmezés szerint a feliratok nemi kifejezéseket tartalmaznak ("férfi", "nő", "fiú" és "lány"). Lehetősége van arra, hogy ezeket a kifejezéseket "személy" kifejezésre cserélje le az eredményekben, és nejesemleges feliratokat kapjon. Ezt úgy teheti meg, hogy true
az opcionális API-kérés paramétert gender-neutral-caption
a kérelem URL-címében állítja be.
Feliratok és sűrű feliratok – példák
Az alábbi JSON-válasz bemutatja, hogy mit ad vissza az Image Analysis 4.0 API a példakép vizuális funkciói alapján történő leírásakor.
"captions": [
{
"text": "a man pointing at a screen",
"confidence": 0.4891590476036072
}
]
Az API használata
A képfeliratozási funkció az Analyze Image API része. Szerepeljen Caption
a funkciók lekérdezési paraméterében. Ezután, amikor megkapja a teljes JSON-választ, elemezheti a szakasz tartalmához tartozó sztringet "captionResult"
.
Következő lépések
- Ismerje meg az objektumészlelés kapcsolódó fogalmát.
- Rövid útmutató: Képelemzési REST API vagy ügyfélkódtárak
- Az Analyze Image API meghívása