Objektumészlelés (4.0-s verzió)

2025-05-31

Az objektumészlelés hasonló a címkézéshez, de az API a képen található minden objektumhoz visszaadja a határolókeret koordinátáit (képpontban). Ha például egy kép egy kutyát, macskát és személyt tartalmaz, az objektumészlelési művelet felsorolja azokat az objektumokat, amelyek koordinátái szerepelnek a képen. Ezzel a funkcióval feldolgozhatja a képek objektumai közötti kapcsolatokat. Azt is meghatározhatja, hogy ugyanazon objektumnak több példánya van-e egy képen.

Az objektumészlelési függvény címkéket alkalmaz a képen azonosított objektumok vagy élőlények alapján. Nincs formális kapcsolat a címkézési osztályozás és az objektumészlelési osztályozás között. Fogalmi szinten az objektumészlelési függvény csak objektumokat és élőlényeket keres, míg a címkefüggvény olyan környezetfüggő kifejezéseket is tartalmazhat, mint a beltéri, amelyek nem honosíthatók határolókeretekkel.

Az Azure AI Vision Studióval gyorsan és egyszerűen kipróbálhatja az objektumészlelés képességeit a böngészőben.

A Vision Studio kipróbálása

Objektumészlelési példa

Az alábbi JSON-válasz bemutatja, mit ad vissza a Képelemzés 4.0 API a példakép objektumainak észlelésekor.

Fénykép egy nőről, aki Egy Microsoft Surface-eszközt használ a konyhában.

{
    "metadata":
    {
        "width": 1260,
        "height": 473
    },
    "objectsResult":
    {
        "values":
        [
            {
                "name": "kitchen appliance",
                "confidence": 0.501,
                "boundingBox": {"x":730,"y":66,"w":135,"h":85}
            },
            {
                "name": "computer keyboard",
                "confidence": 0.51,
                "boundingBox": {"x":523,"y":377,"w":185,"h":46}
            },
            {
                "name": "Laptop",
                "confidence": 0.85,
                "boundingBox": {"x":471,"y":218,"w":289,"h":226}
            },
            {
                "name": "person",
                "confidence": 0.855,
                "boundingBox": {"x":654,"y":0,"w":584,"h":473}
            }
        ]
    }
}

Korlátozások

Figyelje meg az objektumészlelés korlátait, hogy elkerülhesse vagy enyhíthesse a hamis negatív hatások (kihagyott objektumok) és a korlátozott részletek hatását.

Az objektumok általában nem észlelhetők, ha kicsik (a kép kevesebb mint 5%-a).
Az objektumok általában nem észlelhetők, ha szorosan egymáshoz vannak rendezve (például egy lemezköteg).
Az objektumokat nem különböztetik meg márka- vagy terméknevek (például különböző típusú szódák egy áruház polcán). A Márkaészlelés funkcióval azonban lekérheti a márkainformációkat a képekről.

Az API használata

Az objektumészlelési funkció az Analyze Image API része. Ezt az API-t REST használatával hívhatja meg. Szerepeljen Objects a lekérdezési features paraméterben. Ezután, amikor megkapja a teljes JSON-választ, elemezze a sztringet a "objects" szakasz tartalmának kinyeréséhez.

Következő lépés

Az Analyze Image API meghívása

Megosztás a következőn keresztül:

Objektumészlelés (4.0-s verzió)

Objektumészlelési példa

Korlátozások

Az API használata

Következő lépés

Visszajelzés

További források