Aracılığıyla paylaş


Nesne algılama

Bu makalede nesne algılama özelliği açıklanmaktadır. Nesne algılama etiketlemeye benzer, ancak API görüntüde bulunan her nesne için sınırlayıcı kutu koordinatlarını (piksel cinsinden) döndürür. Örneğin, bir görüntüde köpek, kedi ve kişi varsa, nesne algılama işlemi bu nesneleri görüntüdeki koordinatlarıyla listeler.

Bir görüntüdeki nesneler arasındaki ilişkileri işlemek için bu işlevi kullanabilirsiniz. Ayrıca, bir görüntüde aynı nesnenin birden çok örneği olup olmadığını belirlemenizi sağlar.

Etiketleme taksonomisi ile nesne algılama taksonomisi arasında resmi bir ilişki yoktur. Kavramsal düzeyde nesne algılama işlevi yalnızca nesneleri ve canlıları bulurken, etiket işlevi sınırlayıcı kutularla yerelleştirilmeyecek iç mekan gibi bağlamsal terimler de içerebilir.

Azure AI Vision Studio'yu kullanarak tarayıcınızda nesne algılama özelliklerini hızlı ve kolay bir şekilde deneyin.

Nesne algılama örneği

Aşağıdaki JSON yanıtı, Görüntü Analizi API'sinin örnek görüntüdeki nesneleri algıladığında ne döndürdüğü gösterilir.

Mutfakta Microsoft Surface cihazı kullanan bir kadını gösteren fotoğraf.

{
   "objects":[
      {
         "rectangle":{
            "x":730,
            "y":66,
            "w":135,
            "h":85
         },
         "object":"kitchen appliance",
         "confidence":0.501
      },
      {
         "rectangle":{
            "x":523,
            "y":377,
            "w":185,
            "h":46
         },
         "object":"computer keyboard",
         "confidence":0.51
      },
      {
         "rectangle":{
            "x":471,
            "y":218,
            "w":289,
            "h":226
         },
         "object":"Laptop",
         "confidence":0.85,
         "parent":{
            "object":"computer",
            "confidence":0.851
         }
      },
      {
         "rectangle":{
            "x":654,
            "y":0,
            "w":584,
            "h":473
         },
         "object":"person",
         "confidence":0.855
      }
   ],
   "requestId":"25018882-a494-4e64-8196-f627a35c1135",
   "metadata":{
      "height":473,
      "width":1260,
      "format":"Jpeg"
   },
   "modelVersion":"2021-05-01"
}

Sınırlamalar

Hatalı negatiflerin (eksik nesneler) ve sınırlı ayrıntının etkilerini önlemek veya azaltmak için nesne algılamanın sınırlamalarını not almak önemlidir.

  • Nesneler genellikle küçükse (görüntünün %5'inden az) algılanmaz.
  • Nesneler genellikle birbirine yakın yerleştirilmişse algılanmaz (örneğin, bir levha yığını).
  • Nesneler marka veya ürün adlarına göre ayırt edilmez (örneğin, bir mağaza rafı üzerindeki farklı soda türleri). Ancak Marka algılama özelliğini kullanarak görüntüden marka bilgisi alabilirsiniz.

API’yi kullanma

Nesne algılama özelliği, Görüntü Analizi API'sinin bir parçasıdır. Bu API'ye yerel BIR SDK aracılığıyla veya REST çağrıları aracılığıyla çağrı yapabilirsiniz. Sorgu parametresine Objects ekleyinvisualFeatures. Ardından, tam JSON yanıtını aldığınızda, nesneler bölümünün içeriği için dizeyi ayrıştırın.