Aracılığıyla paylaş


Nesne algılama (sürüm 4.0)

Nesne algılama etiketlemeye benzer, ancak API görüntüde bulunan her nesne için sınırlayıcı kutu koordinatlarını (piksel cinsinden) döndürür. Örneğin, bir görüntüde köpek, kedi ve kişi varsa, nesne algılama işlemi bu nesneleri görüntüde koordinatlarıyla birlikte listeler. Bir görüntüdeki nesneler arasındaki ilişkileri işlemek için bu işlevi kullanabilirsiniz. Ayrıca, bir görüntüde aynı nesnenin birden çok örneği olup olmadığını belirlemenizi sağlar.

Nesne algılama işlevi, görüntüde tanımlanan nesnelere veya canlılara göre etiketler uygular. Etiketleme taksonomisi ile nesne algılama taksonomisi arasında resmi bir ilişki yoktur. Kavramsal düzeyde, nesne algılama işlevi yalnızca nesneleri ve canlıları bulurken, etiket işlevi sınırlayıcı kutularla yerelleştirilmeyecek "iç mekan" gibi bağlamsal terimler de içerebilir.

Vision Studio'yu kullanarak tarayıcınızda nesne algılama özelliklerini hızlı ve kolay bir şekilde deneyin.

İpucu

Nesne algılama özelliğini Azure OpenAI hizmeti aracılığıyla kullanabilirsiniz. GpT-4 Görüntü İşlemeli Turbo modeli, paylaştığınız görüntüleri analiz eden bir yapay zeka yardımcısı ile sohbet etmenizi sağlar ve Görüntü geliştirme seçeneği görüntü hakkında daha fazla ayrıntı (okunabilir metin ve nesne konumları) ile yapay zeka yardımı sağlamak için Görüntü Analizi'ni kullanır. Daha fazla bilgi için bkz . GPT-4 Turbo with Vision hızlı başlangıcı.

Nesne algılama örneği

Aşağıdaki JSON yanıtı, örnek görüntüdeki nesneleri algılarken Analysis 4.0 API'sinin ne döndürdüğü gösterilir.

A woman using a Microsoft Surface device in a kitchen

{
    "metadata":
    {
        "width": 1260,
        "height": 473
    },
    "objectsResult":
    {
        "values":
        [
            {
                "name": "kitchen appliance",
                "confidence": 0.501,
                "boundingBox": {"x":730,"y":66,"w":135,"h":85}
            },
            {
                "name": "computer keyboard",
                "confidence": 0.51,
                "boundingBox": {"x":523,"y":377,"w":185,"h":46}
            },
            {
                "name": "Laptop",
                "confidence": 0.85,
                "boundingBox": {"x":471,"y":218,"w":289,"h":226}
            },
            {
                "name": "person",
                "confidence": 0.855,
                "boundingBox": {"x":654,"y":0,"w":584,"h":473}
            }
        ]
    }
}

Sınırlamalar

Hatalı negatiflerin (eksik nesneler) ve sınırlı ayrıntının etkilerini önlemek veya azaltmak için nesne algılamanın sınırlamalarını not almak önemlidir.

  • Nesneler küçükse (görüntünün %5'inden az) genellikle algılanmaz.
  • Nesneler genellikle birbirine yakın yerleştirilmişse algılanmaz (örneğin, bir levha yığını).
  • Nesneler markalarına veya ürün adlarına göre ayrılmaz (market rafındaki farklı gazlı içecek türleri gibi). Ancak Marka algılama özelliğini kullanarak bir görüntüden marka bilgilerini alabilirsiniz.

API’yi kullanma

Nesne algılama özelliği, Görüntü Analizi API'sinin bir parçasıdır. REST kullanarak bu API'ye çağrı yapabilirsiniz. Özellikler sorgu parametresine ekleyinObjects. Ardından, tam JSON yanıtını aldığınızda, bölümün içeriği için dizeyi ayrıştırın "objects" .

Sonraki adımlar