الكشف عن الوجه والسمات وبيانات الإدخال

تنبيه

access خدمة الوجه محدود بناء على معايير الأهلية والاستخدام لدعم مبادئ الذكاء الاصطناعي المسؤول لدينا. تتوفر خدمة Face فقط للعملاء والشركاء المدارين من Microsoft. استخدم نموذج كمية التعرف على الوجه لتقديم طلب للوصول. لمزيد من المعلومات، راجع صفحة access المحدودة Face.

مهم

يتم التنبؤ بسمات الوجه بواسطة الخوارزميات الإحصائية. قد لا تكون دائما دقيقة. توخي الحذر عند اتخاذ قرارات استنادا إلى بيانات السمة. الامتناع عن استخدام هذه السمات لمكافحة الانتحال. بدلا من ذلك، نوصي باستخدام الكشف عن Face Liveness. لمزيد من المعلومات، راجع الدرس: اكتشاف الحيوية في الوجوه.

تشرح هذه المقالة مفاهيم الكشف عن الوجه وبيانات سمة الوجه. الكشف عن الوجه هو عملية تحديد موقع الوجوه البشرية في صورة وإرجاع أنواع مختلفة من البيانات المتعلقة بالوجه اختياريا.

يمكنك استخدام واجهة برمجة التطبيقات Detect للكشف عن الوجوه في صورة. للبدء في استخدام واجهة برمجة تطبيقات REST أو SDK للعميل، اتبع التشغيل السريع لخدمة Face. أو، للحصول على دليل أكثر تعمقا، راجع استدعاء واجهة برمجة تطبيقات الكشف.

مستطيل الوجه

يتوافق كل وجه تم اكتشافه مع حقل faceRectangle في الاستجابة. هذه مجموعة من إحداثيات البكسل للوجه المكتشف اليسرى والأعلى والعرض والارتفاع. باستخدام هذه الإحداثيات، يمكنك الحصول على موقع الوجه وحجمه. في استجابة واجهة برمجة التطبيقات، يتم سرد الوجوه بترتيب الحجم من الأكبر إلى الأصغر.

جرب قدرات اكتشاف الوجوه بسرعة وسهولة باستخدام Azure Vision Studio.

جرب Vision Studio

معرف الوجه

معرف الوجه هو سلسلة معرف فريدة لكل وجه تم اكتشافه في صورة. يتطلب Face ID موافقة وصول محدودة، والتي يمكنك التقدم بطلب للحصول عليها عن طريق ملء نموذج الاستيعاب. لمزيد من المعلومات، راجع صفحة Face API Limited Access. يمكنك طلب معرف الوجه في استدعاء Detect API.

معالم الوجه

معالم الوجه هي مجموعة من نقاط سهلة العثور على الوجه، مثل البؤبؤ أو طرف الأنف. بشكل افتراضي، هناك 27 نقطة معلم محددة مسبقا. يوضح الشكل التالي جميع النقاط ال 27:

رسم تخطيطي لوجه مع جميع المعالم ال 27 المسماة.

يتم إرجاع إحداثيات النقاط بوحدات بكسل.

يحتوي نموذج Detection_03 حاليا على الكشف عن المعالم الأكثر دقة. تعتبر معالم العين والبؤبؤ التي ترجعها دقيقة بما يكفي لتمكين تتبع النظرات للوجه.

سمات

تنبيه

لدى مايكروسوفت قدرات التعرف على الوجه من القاعدة أو المحدودة التي يمكن استخدامها لمحاولة استنتاج الحالات العاطفية وسمات الهوية، والتي إذا أساء استخدامها قد تعرض الناس للتنميط أو التمييز أو الحرمان غير العادل من الخدمات. القدرات المتوقفة هي العاطفة والجنس. القدرات المحدودة هي العمر والابتسامة وشعر الوجه والشعر والمكياج. راسل وجه Azure team إذا كان لديك حالة استخدام مسؤولة ستستفيد من استخدام أي من القدرات المحدودة. اقرأ المزيد عن هذا القرار هنا.

السمات هي مجموعة من الميزات التي يمكن اكتشافها اختياريا بواسطة Detect API. يمكن الكشف عن السمات التالية:

الملحقات: يشير إلى ما إذا كان الوجه المعطى يحتوي على ملحقات. ترجع هذه السمة الملحقات المحتملة بما في ذلك ملابس الرأس والنظارات والقناع، مع درجة ثقة بين صفر وواحد لكل ملحق.
التمويه: يشير إلى ضبابية الوجه في الصورة. ترجع هذه السمة قيمة بين صفر وواحد وتصنيف غير رسمي منخفض أو متوسط أو مرتفع.
التعرض: يشير إلى تعرض الوجه في الصورة. ترجع هذه السمة قيمة بين صفر وواحد وتصنيف غير رسمي ل underExposure أو goodExposure أو overExposure.
النظارات: يشير إلى ما إذا كان الوجه المعطى يحتوي على النظارات. القيم المحتملة هي NoGlasses و ReadingGlassesوSunglassesوS swimming Goggles.
شكل الرأس: يشير إلى اتجاه الوجه في مساحة ثلاثية الأبعاد. يتم وصف هذه السمة من خلال زوايا roll وyw وdy pitch بالدرجات، والتي يتم تعريفها وفقا لقاعدة اليد اليمنى. ترتيب ثلاث زوايا هو roll-yaw-pitch، ونطاق قيمة كل زاوية من -180 درجة إلى +180 درجة. يتم تقدير الاتجاه ثلاثي الأبعاد للوجه بواسطة زوايا اللفة والياو والنبرة بالترتيب. راجع الرسم التخطيطي التالي لتعيينات الزوايا:

لمزيد من المعلومات حول كيفية استخدام هذه القيم، راجع استخدام السمة HeadPose.
قناع: يشير إلى ما إذا كان الوجه يرتدي قناعا. ترجع هذه السمة نوع قناع محتمل وقيمة منطقية للإشارة إلى ما إذا كان الأنف والفم مشمولين أم لا.
الضوضاء: يشير إلى الضوضاء المرئية التي تم اكتشافها في صورة الوجه. ترجع هذه السمة قيمة بين صفر وواحد وتصنيف غير رسمي منخفض أو متوسط أو مرتفع.
الانسداد: يشير إلى ما إذا كانت هناك كائنات تمنع أجزاء من الوجه. ترجع هذه السمة قيمة منطقية ل eyeOccludedوsboeheadOccludedوsyoccluded.
QualityForRecognition: يشير إلى جودة الصورة الإجمالية لتحديد ما إذا كانت الصورة المستخدمة في الكشف ذات جودة كافية لمحاولة التعرف على الوجه. القيمة هي تصنيف غير رسمي منخفض أو متوسط أو مرتفع. يوصى فقط بصور عالية الجودة لتسجيل الشخص، ويوصى بجودة متوسطة أو أفضل منها لسيناريوهات تحديد الهوية.

ملحوظة

يعتمد توفر كل سمة على نموذج الكشف المحدد. تعتمد سمة QualityForRecognition أيضا على نموذج التعرف، لأنها متوفرة حاليا فقط عند استخدام مجموعة من detection_01 أو detection_03 نموذج الكشف، ونموذج التعرف recognition_03 أو recognition_04.

متطلبات الإدخال

استخدم التلميحات التالية للتأكد من أن صور الإدخال تعطي نتائج الكشف الأكثر دقة:

تنسيقات صورة الإدخال المدعومة هي JPEG وPNG وGIF (الإطار الأول) وBMP.
يجب ألا يزيد حجم ملف الصورة عن 6 ميغابايت.

الحد الأدنى لحجم الوجه القابل للكشف هو 36 × 36 بكسل في صورة لا يزيد حجمها عن 1920 × 1,080 بكسل. الصور التي يزيد حجمها عن 1920 × 1,080 بكسل لها حجم وجه أدنى أكبر نسبيا. قد يؤدي تقليل حجم الوجه إلى عدم الكشف عن بعض الوجوه، حتى لو كانت أكبر من الحد الأدنى لحجم الوجه القابل للكشف.
الحد الأقصى لحجم الوجه القابل للكشف هو 4096 × 4,096 بكسل.
لن يتم اكتشاف الوجوه خارج نطاق الحجم من 36 × 36 إلى 4096 × 4,096 بكسل.

إدخال البيانات مع معلومات الاتجاه

قد تحتوي بعض صور الإدخال بتنسيق JPEG على معلومات الاتجاه في بيانات تعريف تنسيق ملف الصور القابلة للاستبدال (EXIF). إذا كان اتجاه EXIF متوفرا، يتم تدوير الصور تلقائيا إلى الاتجاه الصحيح قبل إرسالها للكشف عن الوجه. يتم تقدير مستطيل الوجه والمعالم ووضع الرأس لكل وجه تم اكتشافه استنادا إلى الصورة التي تم تدويرها.

لعرض مستطيل الوجه والمعالم بشكل صحيح، تحتاج إلى التأكد من تدوير الصورة بشكل صحيح. تقوم معظم أدوات تصور الصورة تلقائيا بتدوير الصورة وفقا لاتجاه EXIF الخاص بها بشكل افتراضي. بالنسبة للأدوات الأخرى، قد تحتاج إلى تطبيق التدوير باستخدام التعليمات البرمجية الخاصة بك. تظهر الأمثلة التالية مستطيل وجه على صورة استدارة (يسار) وصورة غير استدارة (لليمين).

لقطة شاشة لصورتي وجه مع استدارة وبدونها.

إدخال الفيديو

إذا كنت تكتشف وجوها من موجز فيديو، فقد تتمكن من تحسين الأداء عن طريق ضبط إعدادات معينة على كاميرا الفيديو:

التجانس: تطبق العديد من كاميرات الفيديو تأثيرا متجانسا. يجب إيقاف تشغيل هذا إذا أمكن ذلك لأنه يخلق تمويه بين الإطارات ويقلل من الوضوح.
سرعة الغالق: تقلل سرعة الغالق الأسرع من مقدار الحركة بين الإطارات وتجعل كل إطار أكثر وضوحا. نوصي بسرعات مصراع 1/60 ثانية أو أسرع.
زاوية الغالق: تحدد بعض الكاميرات زاوية الغالق بدلا من سرعة الغالق. يجب استخدام زاوية غالق أقل، إن أمكن، ما يؤدي إلى إطارات فيديو أكثر وضوحا.

ملحوظة

تتلقى أداة استشعار الكاميرا ذات زاوية الغالق السفلية ضوءا أقل في كل إطار، لذلك تكون الصورة أغمق. تحتاج إلى تحديد المستوى الصحيح لاستخدامه.

الخطوة التالية

الآن بعد أن أصبحت على دراية بمفاهيم الكشف عن الوجوه، تعرف على كيفية كتابة برنامج نصي يكتشف الوجوه في صورة معينة.

استدعاء واجهة برمجة التطبيقات للكشف

الملاحظات

هل كانت هذه الصفحة مفيدة؟

Last updated on 2026-03-19