Sdílet prostřednictvím


Detekce objektů

Tento článek vysvětluje funkci detekce objektů. Detekce objektů je podobná označování, ale rozhraní API vrací souřadnice ohraničujícího rámečku (v pixelech) pro každý objekt nalezený na obrázku. Pokud například obrázek obsahuje psa, kočku a osobu, operace detekce objektů vypíše tyto objekty s jejich souřadnicemi na obrázku.

Pomocí této funkce můžete zpracovat vztahy mezi objekty na obrázku. Umožňuje také určit, jestli je na obrázku více instancí stejného objektu.

Mezi taxonomií označování a taxonomií detekce objektů neexistuje žádný formální vztah. Na koncepční úrovni funkce detekce objektů najde pouze objekty a živé věci, zatímco funkce značek může také obsahovat kontextové termíny, jako je uvnitř, které nelze lokalizovat s ohraničujícími rámečky.

Vyzkoušejte možnosti rychlého a snadného rozpoznávání objektů v prohlížeči pomocí nástroje Azure Vision Studio.

Příklad detekce objektů

Následující odpověď JSON ukazuje, co vrátí rozhraní API pro analýzu obrázků, když rozpozná objekty v ukázkovém obrázku.

Fotografie zobrazující ženu používající zařízení Microsoft Surface v kuchyni

{
   "objects":[
      {
         "rectangle":{
            "x":730,
            "y":66,
            "w":135,
            "h":85
         },
         "object":"kitchen appliance",
         "confidence":0.501
      },
      {
         "rectangle":{
            "x":523,
            "y":377,
            "w":185,
            "h":46
         },
         "object":"computer keyboard",
         "confidence":0.51
      },
      {
         "rectangle":{
            "x":471,
            "y":218,
            "w":289,
            "h":226
         },
         "object":"Laptop",
         "confidence":0.85,
         "parent":{
            "object":"computer",
            "confidence":0.851
         }
      },
      {
         "rectangle":{
            "x":654,
            "y":0,
            "w":584,
            "h":473
         },
         "object":"person",
         "confidence":0.855
      }
   ],
   "requestId":"25018882-a494-4e64-8196-f627a35c1135",
   "metadata":{
      "height":473,
      "width":1260,
      "format":"Jpeg"
   },
   "modelVersion":"2021-05-01"
}

Omezení

Je důležité si uvědomit omezení detekce objektů, abyste se vyhnuli nebo zmírnit účinky falešně negativních (zmeškaných objektů) a omezených podrobností.

  • Objekty se obvykle nezjistí, pokud jsou malé (méně než 5 % obrázku).
  • Objekty se obvykle nerozpoznají, pokud jsou uspořádané úzce dohromady (například zásobník plátů).
  • Objekty se nerozlišují podle názvů značek nebo produktů (různé typy sodovek na skladové polici, například). Informace o značce však můžete z obrázku získat pomocí funkce rozpoznávání značek.

Použití rozhraní API

Funkce detekce objektů je součástí rozhraní API pro analýzu obrázků . Toto rozhraní API můžete volat prostřednictvím nativní sady SDK nebo prostřednictvím volání REST. Zahrňte Objects do parametru visualFeatures dotazu. Poté, co získáte úplnou odpověď JSON, zpracujte řetězec, abyste získali obsah sekce objektů.