Nesne algılama (sürüm 4.0)
Nesne algılama etiketlemeye benzer, ancak API görüntüde bulunan her nesne için sınırlayıcı kutu koordinatlarını (piksel cinsinden) döndürür. Örneğin, bir görüntüde köpek, kedi ve kişi varsa, nesne algılama işlemi bu nesneleri görüntüde koordinatlarıyla birlikte listeler. Bir görüntüdeki nesneler arasındaki ilişkileri işlemek için bu işlevi kullanabilirsiniz. Ayrıca, bir görüntüde aynı nesnenin birden çok örneği olup olmadığını belirlemenizi sağlar.
Nesne algılama işlevi, görüntüde tanımlanan nesnelere veya canlılara göre etiketler uygular. Etiketleme taksonomisi ile nesne algılama taksonomisi arasında resmi bir ilişki yoktur. Kavramsal düzeyde, nesne algılama işlevi yalnızca nesneleri ve canlıları bulurken, etiket işlevi sınırlayıcı kutularla yerelleştirilmeyecek "iç mekan" gibi bağlamsal terimler de içerebilir.
Vision Studio'yu kullanarak tarayıcınızda nesne algılama özelliklerini hızlı ve kolay bir şekilde deneyin.
İpucu
Nesne algılama özelliğini Azure OpenAI hizmeti aracılığıyla kullanabilirsiniz. GpT-4 Görüntü İşlemeli Turbo modeli, paylaştığınız görüntüleri analiz eden bir yapay zeka yardımcısı ile sohbet etmenizi sağlar ve Görüntü geliştirme seçeneği görüntü hakkında daha fazla ayrıntı (okunabilir metin ve nesne konumları) ile yapay zeka yardımı sağlamak için Görüntü Analizi'ni kullanır. Daha fazla bilgi için bkz . GPT-4 Turbo with Vision hızlı başlangıcı.
Nesne algılama örneği
Aşağıdaki JSON yanıtı, örnek görüntüdeki nesneleri algılarken Analysis 4.0 API'sinin ne döndürdüğü gösterilir.
{
"metadata":
{
"width": 1260,
"height": 473
},
"objectsResult":
{
"values":
[
{
"name": "kitchen appliance",
"confidence": 0.501,
"boundingBox": {"x":730,"y":66,"w":135,"h":85}
},
{
"name": "computer keyboard",
"confidence": 0.51,
"boundingBox": {"x":523,"y":377,"w":185,"h":46}
},
{
"name": "Laptop",
"confidence": 0.85,
"boundingBox": {"x":471,"y":218,"w":289,"h":226}
},
{
"name": "person",
"confidence": 0.855,
"boundingBox": {"x":654,"y":0,"w":584,"h":473}
}
]
}
}
Sınırlamalar
Hatalı negatiflerin (eksik nesneler) ve sınırlı ayrıntının etkilerini önlemek veya azaltmak için nesne algılamanın sınırlamalarını not almak önemlidir.
- Nesneler küçükse (görüntünün %5'inden az) genellikle algılanmaz.
- Nesneler genellikle birbirine yakın yerleştirilmişse algılanmaz (örneğin, bir levha yığını).
- Nesneler markalarına veya ürün adlarına göre ayrılmaz (market rafındaki farklı gazlı içecek türleri gibi). Ancak Marka algılama özelliğini kullanarak bir görüntüden marka bilgilerini alabilirsiniz.
API’yi kullanma
Nesne algılama özelliği, Görüntü Analizi API'sinin bir parçasıdır. REST kullanarak bu API'ye çağrı yapabilirsiniz. Özellikler sorgu parametresine ekleyinObjects
. Ardından, tam JSON yanıtını aldığınızda, bölümün içeriği için dizeyi ayrıştırın "objects"
.
Sonraki adımlar
Geri Bildirim
https://aka.ms/ContentUserFeedback.
Çok yakında: 2024 boyunca, içerik için geri bildirim mekanizması olarak GitHub Sorunları’nı kullanımdan kaldıracak ve yeni bir geri bildirim sistemiyle değiştireceğiz. Daha fazla bilgi için bkz.Gönderin ve geri bildirimi görüntüleyin