تدريب كاشف الكائنات

مكتمل

الكشف عن الكائنات هو شكل من أشكال رؤية الكمبيوتر التي يتم تدريب نموذج للكشف عن وجود وموقع واحد أو أكثر من فئات الكائنات في صورة.

صورة فوتوغرافية مع موقع ونوع الفواكه المكتشفة.

هناك مكونان للتنبؤ بالكشف عن الكائنات:

  • تسمية الفئة لكل كائن تم اكتشافه في الصورة. على سبيل المثال، قد تتأكد من أن الصورة تحتوي على تفاحة وبرتقال وموز.
  • موقع كل كائن داخل الصورة، يشار إليه كإحداثيات لمربع محيط يحيط بالكائن.

لتدريب نموذج الكشف عن الكائنات، يمكنك استخدام مدخل Azure الذكاء الاصطناعي Custom Vision لتحميل الصور وتسميته قبل تدريب النموذج وتقييمه واختباره ونشره؛ أو يمكنك استخدام واجهة برمجة تطبيقات REST أو SDK الخاصة باللغة لكتابة التعليمات البرمجية التي تنفذ مهام التدريب.

تسمية الصورة

يمكنك استخدام Azure الذكاء الاصطناعي Custom Vision لإنشاء مشاريع لتصنيف الصور أو الكشف عن الكائنات. الفرق الأكثر أهمية بين تدريب نموذج تصنيف الصور وتدريب نموذج الكشف عن الكائنات هو تسمية الصور بالعلامات. بينما يتطلب تصنيف الصور علامة واحدة أو أكثر تنطبق على الصورة بأكملها، يتطلب الكشف عن العنصر أن تتكون كل تسمية من علامة ومنطقة تحدد المربع المحيط لكل كائن في صورة.

تسمية الصور في مدخل Azure الذكاء الاصطناعي Custom Vision

يوفر مدخل Azure الذكاء الاصطناعي Custom Vision واجهة رسومية يمكنك استخدامها لتسمية صور التدريب الخاصة بك.

لقطة شاشة للصور ذات العلامات في مدخل Azure الذكاء الاصطناعي Custom Vision.

الخيار الأسهل لوضع العلامات على الصور للكشف عن الكائنات هو استخدام الواجهة التفاعلية في مدخل Azure الذكاء الاصطناعي Custom Vision. تقترح هذه الواجهة تلقائيا المناطق التي تحتوي على كائنات، والتي يمكنك تعيين علامات إليها أو ضبطها عن طريق سحب المربع المحيط لإحاطة الكائن الذي تريد تسميته.

بالإضافة إلى ذلك، بعد وضع علامات على دفعة أولية من الصور، يمكنك تدريب النموذج. يمكن أن تستفيد التسمية اللاحقة للصور الجديدة من أداة التسمية الذكية في المدخل، والتي يمكن أن تقترح ليس فقط المناطق، ولكن فئات العنصر التي تحتوي عليها.

نهج التسمية البديلة

بدلا من ذلك، يمكنك استخدام أداة تسمية مخصصة أو تابعة لجهة خارجية، أو اختيار تسمية الصور يدويا، للاستفادة من الميزات الأخرى، مثل تعيين مهام تسمية الصور لعدة أعضاء في الفريق.

إذا اخترت استخدام أداة تسمية أخرى غير مدخل Azure الذكاء الاصطناعي Custom Vision، فقد تحتاج إلى ضبط الإخراج لمطابقة وحدات القياس المتوقعة من Azure الذكاء الاصطناعي Custom Vision API. يتم تعريف المربعات المحيطة بأربع قيم تمثل إحداثيات اليسار (X) والأعلى (Y) للزاوية العلوية اليمنى من مربع الإحاطة، وعرض المربع المحيط وارتفاعه. يتم التعبير عن هذه القيم كقيم متناسبة بالنسبة لحجم الصورة المصدر. على سبيل المثال، ضع في اعتبارك مربع الإحاطة هذا:

  • اليسار: 0.1
  • أعلى: 0.5
  • العرض: 0.5
  • الارتفاع: 0.25

يحدد هذا المربع الذي يقع فيه اليسار 0.1 (عشر) من الحافة اليسرى للصورة، والأعلى هو 0.5 (نصف ارتفاع الصورة) من الأعلى. المربع هو نصف العرض وربع ارتفاع الصورة الإجمالية.

تعرض الصورة التالية معلومات التسمية بتنسيق JSON للكائنات الموجودة في صورة.

صورة فوتوغرافية مع تسميات JSON للعناصر التي تحتوي عليها.