Rozpoznávání objektů (verze 4.0)

Článek
01/23/2024

Detekce objektů je podobná označování, ale rozhraní API vrací souřadnice ohraničujícího rámečku (v pixelech) pro každý objekt nalezený na obrázku. Pokud například obrázek obsahuje psa, kočku a osobu, zobrazí operace rozpoznávání objektů seznam těchto objektů s jejich souřadnicemi na obrázku. Pomocí této funkce můžete zpracovat vztahy mezi objekty na obrázku. Umožňuje také určit, jestli je na obrázku více instancí stejného objektu.

Funkce rozpoznávání objektů používá značky založené na objektech nebo živých věcech identifikovaných na obrázku. Mezi taxonomií označování a taxonomií detekce objektů neexistuje žádný formální vztah. Na koncepční úrovni funkce rozpoznávání objektů najde pouze objekty a živé věci, zatímco funkce značky může obsahovat kontextové termíny jako "vnitřní", které nelze lokalizovat s ohraničujícími rámečky.

Vyzkoušejte možnosti rychlého a snadného rozpoznávání objektů v prohlížeči pomocí nástroje Vision Studio.

Vyzkoušet Vision Studio

Tip

Funkci rozpoznávání objektů můžete použít prostřednictvím služby Azure OpenAI . Model GPT-4 Turbo s obrazem umožňuje chatovat s asistentem AI, který dokáže analyzovat obrázky, které sdílíte, a možnost Vylepšení obrazu pomocí funkce Analýza obrazu poskytuje pomoc s umělou inteligencí s dalšími podrobnostmi (čitelnými texty a umístěními objektů) o obrázku. Další informace najdete v rychlém startu GPT-4 Turbo s vision.

Příklad detekce objektů

Následující odpověď JSON ukazuje, co rozhraní API analysis 4.0 vrátí při zjišťování objektů na ukázkovém obrázku.

A woman using a Microsoft Surface device in a kitchen

{
    "metadata":
    {
        "width": 1260,
        "height": 473
    },
    "objectsResult":
    {
        "values":
        [
            {
                "name": "kitchen appliance",
                "confidence": 0.501,
                "boundingBox": {"x":730,"y":66,"w":135,"h":85}
            },
            {
                "name": "computer keyboard",
                "confidence": 0.51,
                "boundingBox": {"x":523,"y":377,"w":185,"h":46}
            },
            {
                "name": "Laptop",
                "confidence": 0.85,
                "boundingBox": {"x":471,"y":218,"w":289,"h":226}
            },
            {
                "name": "person",
                "confidence": 0.855,
                "boundingBox": {"x":654,"y":0,"w":584,"h":473}
            }
        ]
    }
}

Omezení

Je důležité si uvědomit omezení detekce objektů, abyste se vyhnuli nebo zmírnit účinky falešně negativních (zmeškaných objektů) a omezených podrobností.

Objekty se obvykle nezjistí, pokud jsou malé (méně než 5 % obrázku).
Objekty se obvykle nerozpoznají, pokud jsou uspořádané úzce dohromady (například zásobník plátů).
Objekty se nerozlišují podle názvů značek nebo produktů (například různé typy slazených nápojů v regálu obchodu). Informace o značce ale můžete získat z obrázku pomocí funkce rozpoznávání značky.

Použití rozhraní API

Funkce detekce objektů je součástí rozhraní API pro analýzu obrázků . Toto rozhraní API můžete volat pomocí REST. Zahrňte Objects do parametru dotazu funkce . Když pak získáte úplnou odpověď JSON, parsujte řetězec pro obsah oddílu "objects" .

Další kroky

Volání rozhraní API pro analýzu obrázků

Rozpoznávání objektů (verze 4.0)

Příklad detekce objektů

Omezení

Použití rozhraní API

Další kroky

Další materiály