Yüz algılama, öznitelikler ve giriş verileri

Dikkat

Yüz tanıma hizmeti erişimi, Sorumlu yapay zeka ilkelerimizi desteklemek için uygunluk ve kullanım ölçütlerine göre sınırlıdır. Yüz tanıma hizmeti yalnızca Microsoft tarafından yönetilen müşteriler ve iş ortakları tarafından kullanılabilir. Erişim için başvurmak için Yüz Tanıma giriş formunu kullanın. Daha fazla bilgi için Yüz sınırlı erişim sayfasına bakın.

Önemli

Yüz tanıma öznitelikleri, istatistiksel algoritmaların kullanımıyla tahmin edilir. Her zaman doğru olmayabilirler. Öznitelik verilerine dayalı kararlar alırken dikkatli olun. Kimlik sahtekarlığına karşı bu öznitelikleri kullanmaktan lütfen kaçının. Bunun yerine Yüz Canlılığı algılamayı kullanmanızı öneririz. Daha fazla bilgi için lütfen Öğretici: Yüzlerdeki canlılığı algılama bölümüne bakın.

Bu makalede yüz algılama ve yüz özniteliği verileri kavramları açıklanmaktadır. Yüz algılama, bir görüntüde insan yüzlerini bulma ve isteğe bağlı olarak yüzle ilgili farklı türde veriler döndürme işlemidir.

Bir görüntüdeki yüzleri algılamak için Yüz - Algılama API'sini kullanırsınız. REST API veya istemci SDK'sını kullanmaya başlamak için hızlı başlangıcı izleyin. Daha ayrıntılı bir kılavuz için bkz . Algılama API'sini çağırma.

Yüz dikdörtgeni

Algılanan her yüz yanıttaki bir faceRectangle alana karşılık gelir. Bu, algılanan yüzün sol, üst, genişlik ve yüksekliği için piksel koordinatları kümesidir. Bu koordinatları kullanarak yüzün konumunu ve boyutunu alabilirsiniz. API yanıtında yüzler en büyükten en küçüğe boyut sırasına göre listelenir.

Vision Studio'yu kullanarak yüz algılama özelliklerini hızlı ve kolay bir şekilde deneyin.

Yüz kimliği

Yüz kimliği, bir görüntüde algılanan her yüz için benzersiz bir tanımlayıcı dizesidir. Face ID, alım formunu doldurarak başvurabileceğiniz sınırlı erişim onayı gerektirir. Daha fazla bilgi için Yüz sınırlı erişim sayfasına bakın. Yüz Tanıma - Algılama API'si çağrınızda yüz kimliği isteyebilirsiniz.

Yüz tanıma yer işaretleri

Yüz yer işaretleri, göz bebekleri veya burnun ucu gibi bir yüz üzerinde bulunması kolay noktalar kümesidir. Varsayılan olarak önceden tanımlanmış 27 yer işareti noktası vardır. Aşağıdaki şekilde 27 noktanın tümü gösterilmektedir:

A face diagram with all 27 landmarks labeled

Noktaların koordinatları piksel cinsinden döndürülür.

Detection_03 modeli şu anda en doğru yer işareti algılamaya sahiptir. Döndürdüğü göz ve göz bebeği yer işaretleri, yüzün gözle izlenmesini sağlayacak kadar hassastır.

Özellikler

Dikkat

Microsoft' un kullanımdan kaldırılan yüz tanıma özellikleri, yanlış kullanıldığında insanları stereotipleme, ayrımcılık veya haksız hizmet reddine maruz kalabilecek duygusal durumları ve kimlik özniteliklerini çıkarsamak için kullanılabilir. Bunlar duygu, cinsiyet, yaş, gülümseme, yüz kılları, saç ve makyajı tahmin eden özellikleri içerir. Bu karar hakkında daha fazla bilgiyi burada bulabilirsiniz.

Öznitelikler, isteğe bağlı olarak Yüz Algılama API'si tarafından algılanabilir bir özellik kümesidir. Aşağıdaki öznitelikler algılanabilir:

  • Aksesuarlar. Verilen yüzün aksesuarlara sahip olup olmadığını gösterir. Bu öznitelik, her aksesuar için sıfır ile bir arasında güvenilirlik puanıyla şapka, gözlük ve maske gibi olası aksesuarları döndürür.

  • Bulanıklaştır. Görüntüdeki yüzün bulanıklığı. Bu öznitelik sıfır ile bir arasında bir değer ve düşük, orta veya yüksek resmi olmayan bir derecelendirme döndürür.

  • Açığa çıkarma. Görüntüdeki yüzün açığa vurması. Bu öznitelik sıfır ile bir arasında bir değer ve underExposure, goodExposure veya overExposure'un resmi olmayan derecelendirmesini döndürür.

  • Gözlük. Verilen yüzün gözlükleri olup olmadığı. Olası değerler NoGlasses, ReadingGlasses, Sunglasses ve Yüzme Gözlükleri'dir.

  • Baş pozu. Yüzün yönü 3B alandadır. Bu öznitelik, sağ taraftaki kurala göre tanımlanan derece cinsinden yuvarlanma, esnema ve eğim açıları tarafından açıklanmıştır. Üç açının sırası yaw-pitch şeklindedir ve her açının değer aralığı -180 derece ile 180 derece arasındadır. Yüzün 3B yönü sırasıyla yuvarlanma, esneme ve eğim açılarıyla tahmin edilir. Açı eşlemeleri için aşağıdaki diyagrama bakın:

    A head with the pitch, roll, and yaw axes labeled

    Bu değerlerin nasıl kullanılacağı hakkında daha fazla bilgi için Baş pozu nasıl yapılır kılavuzuna bakın.

  • Maskele'ye bakın. Yüzün maske takıp takmadığını gösterir. Bu öznitelik olası bir maske türü ve burnun ve ağzın kaplanıp kapatılmadığını belirten bir Boole değeri döndürür.

  • Gürültü. Yüz görüntüsünde algılanan görsel kirlilik. Bu öznitelik sıfır ile bir arasında bir değer ve düşük, orta veya yüksek resmi olmayan bir derecelendirme döndürür.

  • Tıkanıklık. Yüzün parçalarını engelleyen nesneler olup olmadığını gösterir. Bu öznitelik eyeOccluded, foreheadOccluded ve mouthOccluded için boole değeri döndürür.

  • QualityForRecognition Algılamada kullanılan görüntünün yüz tanımayı deneyecek kadar kaliteli olup olmadığına ilişkin genel görüntü kalitesi. Değer, düşük, orta veya yüksek için resmi olmayan bir derecelendirmedir. Kişi kaydı için yalnızca "yüksek" kaliteli görüntüler önerilir ve tanımlama senaryoları için "orta" veya üzeri kalite önerilir.

    Not

    Her özniteliğin kullanılabilirliği, belirtilen algılama modeline bağlıdır. QualityForRecognition özniteliği, şu anda yalnızca algılama modeli detection_01 veya detection_03 ve tanıma modeli recognition_03 veya recognition_04 birleşimi kullanıldığında kullanılabildiğinden tanıma modeline de bağlıdır.

Giriş gereksinimleri

Giriş görüntülerinizin en doğru algılama sonuçlarını vermesini sağlamak için aşağıdaki ipuçlarını kullanın:

  • Desteklenen giriş görüntüsü biçimleri JPEG, PNG, GIF (ilk kare), BMP'dir.
  • Görüntü dosyası boyutu 6 MB'tan büyük olmamalıdır.
  • Algılanabilir en düşük yüz boyutu, 1920 x 1080 pikselden büyük olmayan bir görüntüde 36 x 36 pikseldir. 1920 x 1080 pikselden büyük görüntüler orantılı olarak daha büyük minimum yüz boyutuna sahiptir. Yüz boyutunu küçültmek, bazı yüzlerin algılanabilir minimum yüz boyutundan büyük olsalar bile algılanmamasına neden olabilir.
  • Algılanabilir yüz boyutu üst sınırı 4096 x 4096 pikseldir.
  • 36 x 36 ile 4096 x 4096 piksel boyut aralığının dışındaki yüzler algılanmaz.

Yönlendirme bilgileriyle veri girişi:

JPEG biçimindeki bazı giriş görüntüleri, Değiştirilebilir görüntü dosyası biçimi (EXIF) meta verilerinde yönlendirme bilgileri içerebilir. EXIF yönlendirmesi varsa, yüz algılama için göndermeden önce görüntüler otomatik olarak doğru yönlendirmeye döndürülür. Algılanan her yüz için yüz dikdörtgeni, yer işaretleri ve baş pozu, döndürülen görüntüye göre tahmin edilir.

Yüz dikdörtgenini ve yer işaretlerini düzgün bir şekilde görüntülemek için görüntünün doğru döndürülmüş olduğundan emin olmanız gerekir. Görüntü görselleştirme araçlarının çoğu, görüntüyü varsayılan olarak EXIF yönüne göre otomatik olarak döndürür. Diğer araçlar için kendi kodunuzu kullanarak döndürmeyi uygulamanız gerekebilir. Aşağıdaki örneklerde, döndürülmüş görüntüde (solda) yüz dikdörtgeni ve döndürülmüş olmayan bir görüntü (sağ) gösterilmektedir.

Two face images with and without rotation

Video girişi

Bir video akışındaki yüzleri algılıyorsanız, video kameranızda belirli ayarları yaparak performansı geliştirebilirsiniz:

  • Düzeltme: Birçok video kamerası bir düzeltme efekti uygular. Çerçeveler arasında bir bulanıklık oluşturduğundan ve netliği azalttığı için bunu kapatmalısınız.

  • Deklanşör Hızı: Daha hızlı bir deklanşör hızı, kareler arasındaki hareket miktarını azaltır ve her kareyi daha net hale getirir. 1/60 saniye veya daha hızlı deklanşör hızları öneririz.

  • Deklanşör Açısı: Bazı kameralar deklanşör hızı yerine deklanşör açısını belirtir. Mümkünse daha düşük bir deklanşör açısı kullanmalısınız. Bu, daha net video karelerine neden olur.

    Not

    Daha düşük deklanşör açısına sahip bir kamera her karede daha az ışık alır, böylece görüntü daha koyu olur. Kullanılacak doğru düzeyi belirlemeniz gerekir.

Sonraki adımlar

Yüz algılama kavramları hakkında bilgi edindiğinize göre artık belirli bir görüntüdeki yüzleri algılayan bir betik yazmayı öğrenin.