Sdílet prostřednictvím


Detekce objektů

Detekce objektů je podobná označování, ale rozhraní API vrací souřadnice ohraničujícího rámečku (v pixelech) pro každý objekt nalezený na obrázku. Pokud například obrázek obsahuje psa, kočku a osobu, operace detekce objektů vypíše tyto objekty s jejich souřadnicemi na obrázku. Pomocí této funkce můžete zpracovat vztahy mezi objekty na obrázku. Umožňuje také určit, jestli je na obrázku více instancí stejného objektu.

Funkce rozpoznávání objektů používá značky založené na objektech nebo živých věcech identifikovaných na obrázku. Mezi taxonomií označování a taxonomií detekce objektů neexistuje žádný formální vztah. Na koncepční úrovni funkce rozpoznávání objektů najde pouze objekty a živé věci, zatímco funkce značky může obsahovat kontextové termíny, jako je "vnitřní", které nelze lokalizovat s ohraničujícími rámečky.

Vyzkoušejte možnosti rychlého a snadného rozpoznávání objektů v prohlížeči pomocí nástroje Vision Studio.

Příklad detekce objektů

Následující odpověď JSON ukazuje, co rozhraní API pro analýzu obrázků vrací při detekci objektů v ukázkovém obrázku.

Žena používající zařízení Microsoft Surface v kuchyni

{
   "objects":[
      {
         "rectangle":{
            "x":730,
            "y":66,
            "w":135,
            "h":85
         },
         "object":"kitchen appliance",
         "confidence":0.501
      },
      {
         "rectangle":{
            "x":523,
            "y":377,
            "w":185,
            "h":46
         },
         "object":"computer keyboard",
         "confidence":0.51
      },
      {
         "rectangle":{
            "x":471,
            "y":218,
            "w":289,
            "h":226
         },
         "object":"Laptop",
         "confidence":0.85,
         "parent":{
            "object":"computer",
            "confidence":0.851
         }
      },
      {
         "rectangle":{
            "x":654,
            "y":0,
            "w":584,
            "h":473
         },
         "object":"person",
         "confidence":0.855
      }
   ],
   "requestId":"25018882-a494-4e64-8196-f627a35c1135",
   "metadata":{
      "height":473,
      "width":1260,
      "format":"Jpeg"
   },
   "modelVersion":"2021-05-01"
}

Omezení

Je důležité si uvědomit omezení detekce objektů, abyste se vyhnuli nebo zmírnit účinky falešně negativních (zmeškaných objektů) a omezených podrobností.

  • Objekty se obvykle nezjistí, pokud jsou malé (méně než 5 % obrázku).
  • Objekty se obvykle nerozpoznají, pokud jsou uspořádané úzce dohromady (například zásobník plátů).
  • Objekty se nerozlišují podle názvů značek nebo produktů (různé typy sodovek na skladové polici, například). Informace o značce však můžete z obrázku získat pomocí funkce rozpoznávání značek.

Použití rozhraní API

Funkce detekce objektů je součástí rozhraní API pro analýzu obrázků . Toto rozhraní API můžete volat prostřednictvím nativní sady SDK nebo prostřednictvím volání REST. Zahrňte Objects do parametru dotazu visualFeatures . Když pak získáte úplnou odpověď JSON, parsujte řetězec pro obsah oddílu "objects" .