Aracılığıyla paylaş


Nesne algılama

Nesne algılama etiketlemeye benzer, ancak API görüntüde bulunan her nesne için sınırlayıcı kutu koordinatlarını (piksel cinsinden) döndürür. Örneğin, bir görüntüde köpek, kedi ve kişi varsa, nesne algılama işlemi bu nesneleri görüntüdeki koordinatlarıyla listeler. Bir görüntüdeki nesneler arasındaki ilişkileri işlemek için bu işlevi kullanabilirsiniz. Ayrıca, bir görüntüde aynı nesnenin birden çok örneği olup olmadığını belirlemenizi sağlar.

Nesne algılama işlevi, görüntüde tanımlanan nesnelere veya canlılara göre etiketler uygular. Etiketleme taksonomisi ile nesne algılama taksonomisi arasında resmi bir ilişki yoktur. Kavramsal düzeyde, nesne algılama işlevi yalnızca nesneleri ve canlıları bulurken, etiket işlevi sınırlayıcı kutularla yerelleştirilmeyecek "iç mekan" gibi bağlamsal terimler de içerebilir.

Vision Studio'yu kullanarak tarayıcınızda nesne algılama özelliklerini hızlı ve kolay bir şekilde deneyin.

Nesne algılama örneği

Aşağıdaki JSON yanıtı, örnek görüntüdeki nesneleri algılarken Görüntü Analizi API'sinin ne döndürdüğü gösterilir.

Mutfakta Microsoft Surface cihazı kullanan bir kadın

{
   "objects":[
      {
         "rectangle":{
            "x":730,
            "y":66,
            "w":135,
            "h":85
         },
         "object":"kitchen appliance",
         "confidence":0.501
      },
      {
         "rectangle":{
            "x":523,
            "y":377,
            "w":185,
            "h":46
         },
         "object":"computer keyboard",
         "confidence":0.51
      },
      {
         "rectangle":{
            "x":471,
            "y":218,
            "w":289,
            "h":226
         },
         "object":"Laptop",
         "confidence":0.85,
         "parent":{
            "object":"computer",
            "confidence":0.851
         }
      },
      {
         "rectangle":{
            "x":654,
            "y":0,
            "w":584,
            "h":473
         },
         "object":"person",
         "confidence":0.855
      }
   ],
   "requestId":"25018882-a494-4e64-8196-f627a35c1135",
   "metadata":{
      "height":473,
      "width":1260,
      "format":"Jpeg"
   },
   "modelVersion":"2021-05-01"
}

Sınırlamalar

Hatalı negatiflerin (eksik nesneler) ve sınırlı ayrıntının etkilerini önlemek veya azaltmak için nesne algılamanın sınırlamalarını not almak önemlidir.

  • Nesneler genellikle küçükse (görüntünün %5'inden az) algılanmaz.
  • Nesneler genellikle birbirine yakın yerleştirilmişse algılanmaz (örneğin, bir levha yığını).
  • Nesneler marka veya ürün adlarına göre ayırt edilir (örneğin, bir mağaza rafı üzerindeki farklı soda türleri). Ancak Marka algılama özelliğini kullanarak görüntüden marka bilgisi alabilirsiniz.

API’yi kullanma

Nesne algılama özelliği, Görüntü Analizi API'sinin bir parçasıdır. Bu API'ye yerel BIR SDK aracılığıyla veya REST çağrıları aracılığıyla çağrı yapabilirsiniz. visualFeatures sorgu parametresine ekleyinObjects. Ardından, tam JSON yanıtını aldığınızda, bölümün içeriği için dizeyi ayrıştırın "objects" .