Megosztás a következőn keresztül:


Objektumészlelés (4.0-s verzió)

Az objektumészlelés hasonló a címkézéshez, de az API a képen található minden objektumhoz visszaadja a határolókeret koordinátáit (képpontban). Ha például egy kép egy kutyát, macskát és személyt tartalmaz, az objektumészlelési művelet felsorolja ezeket az objektumokat a képen lévő koordinátákkal. Ezzel a funkcióval feldolgozhatja a képek objektumai közötti kapcsolatokat. Azt is meghatározhatja, hogy ugyanazon objektumnak több példánya van-e egy képen.

Az objektumészlelési függvény címkéket alkalmaz a képen azonosított objektumok vagy élőlények alapján. Nincs formális kapcsolat a címkézési osztályozás és az objektumészlelési osztályozás között. Fogalmi szinten az objektumészlelési függvény csak objektumokat és élőlényeket keres, míg a címkefüggvény olyan környezetfüggő kifejezéseket is tartalmazhat, mint a "beltéri", amely nem honosítható határolókeretekkel.

A Vision Studióval gyorsan és egyszerűen kipróbálhatja az objektumészlelés képességeit a böngészőben.

Tipp.

Az Objektumészlelési funkciót az Azure OpenAI szolgáltatáson keresztül használhatja . A GPT-4 Turbo with Vision modell lehetővé teszi, hogy csevegjen egy AI-asszisztenssel, amely elemezni tudja a megosztott képeket, és a Vision Enhancement lehetőség a Képelemzés használatával nyújt segítséget az AI-nek a kép további részleteivel (olvasható szöveggel és objektumhelyekkel). További információkért tekintse meg a GPT-4 Turbo with Vision rövid útmutatót.

Objektumészlelési példa

Az alábbi JSON-válasz bemutatja, mit ad vissza az Analysis 4.0 API a példakép objektumainak észlelésekor.

A woman using a Microsoft Surface device in a kitchen

{
    "metadata":
    {
        "width": 1260,
        "height": 473
    },
    "objectsResult":
    {
        "values":
        [
            {
                "name": "kitchen appliance",
                "confidence": 0.501,
                "boundingBox": {"x":730,"y":66,"w":135,"h":85}
            },
            {
                "name": "computer keyboard",
                "confidence": 0.51,
                "boundingBox": {"x":523,"y":377,"w":185,"h":46}
            },
            {
                "name": "Laptop",
                "confidence": 0.85,
                "boundingBox": {"x":471,"y":218,"w":289,"h":226}
            },
            {
                "name": "person",
                "confidence": 0.855,
                "boundingBox": {"x":654,"y":0,"w":584,"h":473}
            }
        ]
    }
}

Korlátozások

Fontos megjegyezni az objektumészlelés korlátait, hogy elkerülhesse vagy enyhíthesse a hamis negatív hatások (kihagyott objektumok) és a korlátozott részletek hatását.

  • Az objektumok általában nem észlelhetők, ha kicsik (a kép kevesebb mint 5%-a).
  • Az objektumok általában nem észlelhetők, ha szorosan egymáshoz vannak rendezve (például egy lemezköteg).
  • Az objektumok nincsenek megkülönböztetve egymástól márka vagy terméknév szerint (például a bolti polcon lévő különböző üdítőital-típusok). A márkainformációkat azonban lekérheti egy képről a Márkaészlelés funkcióval.

Az API használata

Az objektumészlelési funkció az Analyze Image API része. Ezt az API-t REST használatával hívhatja meg. Szerepeljen Objects a funkciók lekérdezési paraméterében. Ezután, amikor megkapja a teljes JSON-választ, elemezheti a szakasz tartalmához tartozó sztringet "objects" .

Következő lépések