المعلمات الفائقة لمهام رؤية الكمبيوتر باستخدام التعلم الآلي التلقائي

مقالة
06/13/2024

ينطبق على:ملحق ML Azure CLI v2 (الحالي)Python SDK azure-ai-ml v2 (الحالي)

تعرّف على المعلمات الفائقة المتوفرة خصيصًا لمهام رؤية الكمبيوتر في تجارب التعلم الآلي التلقائي.

مع دعم مهام رؤية الكمبيوتر، يمكنك التحكم في بنية النموذج ومسح المعلمات الفائقة. يتم تمرير بنيات النموذج هذه والمقاييس الفائقة كمساحة معلمة للمسح. في حين أن العديد من المعلمات الفائقة المكشوفة غير محددة للنموذج، ثمة مثيلات تكون فيها المعلمات الفائقة خاصة بالمهمة أو خاصة بالنموذج.

المعلمات الفائقة الخاصة بالنموذج

يلخص هذا الجدول المعلمات الفائقة الخاصة بالبنية yolov5 .

اسم المعلمة	‏‏الوصف	الإعداد الافتراضي
`validation_metric_type`	أسلوب حساب القياس لاستخدامه مع قياسات التحقق من الصحة. ينبغي أن يكون `none` أو `coco` أو `voc` أو `coco_voc`.	`voc`
`validation_iou_threshold`	حد IOU لمطابقة المربع عند قياسات التحقق من صحة الحوسبة. يجب أن يكون عددًا عشريًا في النطاق [0.1، 1].	0.5
`image_size`	حجم الصورةِ للتدريب والتحقق من الصحة. يجب أن تكون عددًا صحيحًا موجبًا. ملاحظة: قد يدخل تشغيل التدريب في CUDA OOM إذا كان الحجم كبيرًا للغاية.	640
`model_size`	حجم النموذج. ينبغي أن يكون `small` أو `medium` أو `large` أو `extra_large`. ملاحظة: قد يدخل تشغيل التدريب في CUDA OOM إذا كان حجم النموذج كبيرًا للغاية.	`medium`
`multi_scale`	تمكين صورة متعددة المقاييس من خلال تغيير حجم الصورة بنسبة +/- 50٪ لابد أن يكون 0 أو 1. ملاحظة: قد يدخل تشغيل التدريب في CUDA OOM في حال لم تكن ذاكرة GPU كافية.	0
`box_score_threshold`	خلال الاستدلال، تُرجع المقترحات فقط مع درجة أكبر من `box_score_threshold`. والنتيجة هي ضرب درجة العنصر واحتمال التصنيف. لابد أن يكون عددًا عشريًا في النطاق [0، 1].	0.1
`nms_iou_threshold`	حد IOU المستخدم خلال الاستدلال في معالجة ما بعد المنع غير الأقصى. لابد أن يكون عددًا عشريًا في النطاق [0، 1].	0.5
`tile_grid_size`	حجم الشبكة المراد استخدامه لتجانب كل صورة. ملاحظة: يجب ألا يكون tile_grid_size خاليًا لتمكين منطق الكشف عن العناصر الصغيرة يجب تمريرها كسلسلة بتنسيق '3x2'. مثال: --tile_grid_size '3x2'	لا افتراضي
`tile_overlap_ratio`	نسبة التداخل بين التجانبات المتجاورة في كل بعد. لابد أن يكون عددًا عشريًا في النطاق [0، 1)	0.25
`tile_predictions_nms_threshold`	حد IOU لاستخدامه لأداء المنع غير الأقصى في أثناء دمج التنبؤات من التجانبات والصورة. يستخدم في التحقق من الصحة/ الاستدلال. يجب أن يكون عددًا عشريًا في النطاق [0، 1]	0.25

يُلخص هذا الجدول المعلمات الفائقة الخاصة بـ maskrcnn_* لتجزئة المثيل خلال الاستدلال.

اسم المعلمة	‏‏الوصف	الإعداد الافتراضي
`mask_pixel_score_threshold`	قطع النقاط لاعتبار بكسل جزءًا من قناع عنصر.	0.5
`max_number_of_polygon_points`	الحد الأقصى لعدد أزواج الإحداثيات (س، ص) في المضلع بعد التحويل من قناع.	100
`export_as_image`	تصدير الأقنعة كصور.	خطأ
`image_type`	نوع الصورة لتصدير قناع كـ (الخيارات هي jpg، png، bmp).	JPG

المعلمات الفائقة غير المحددة للنموذج

يصف الجدول التالي المعلمات الفائقة غير المحددة للنموذج.

اسم المعلمة	‏‏الوصف	الإعداد الافتراضي
`number_of_epochs`	عدد فترات التدريب. يجب أن تكون عددًا صحيحًا موجبًا.	15 (باستثناء `yolov5`: 30)
`training_batch_size`	حجم دفعة التدريب. يجب أن تكون عددًا صحيحًا موجبًا.	متعدد الفئات/متعدد التسميات: 78 (باستثناء متغيرات vit: `vits16r224`: 128 `vitb16r224`: 48 `vitl16r224`:10) الكشف عن الكائنات: 2 (باستثناء `yolov5`: 16) تجزئة المثيل: 2 ملاحظة: الإعدادات الافتراضية هي أكبر حجم دُفعة يمكن استخدامه على ذاكرة GPU‏ 12 غيغابايت.
`validation_batch_size`	حجم دُفعة التحقق من الصحة. يجب أن تكون عددًا صحيحًا موجبًا.	متعدد الفئات/متعدد التسميات: 78 (باستثناء متغيرات vit: `vits16r224`: 128 `vitb16r224`: 48 `vitl16r224`:10) الكشف عن الكائنات: 1 (باستثناء `yolov5`: 16) تجزئة المثيل: 1 ملاحظة: الإعدادات الافتراضية هي أكبر حجم دُفعة يمكن استخدامه على ذاكرة GPU‏ 12 غيغابايت.
`gradient_accumulation_step`	يعني تراكم التدرج تشغيل عدد مكون من `gradient_accumulation_step` دون تحديث أوزان النموذج في أثناء تجميع تدرجات هذه الخطوات، ثم استخدام التدرجات المجمعة لحساب تحديثات الوزن. يجب أن تكون عددًا صحيحًا موجبًا.	1
`early_stopping`	قم بتمكين منطق الإيقاف المبكر في أثناء التدريب. لابد أن يكون 0 أو 1.	1
`early_stopping_patience`	الحد الأدنى لعدد الفترات أو تقييمات التحقق من الصحة مع عدم وجود تحسين قياسي أساسي قبل إيقاف التشغيل. يجب أن تكون عددًا صحيحًا موجبًا.	5
`early_stopping_delay`	الحد الأدنى لعدد الفترات أو تقييمات التحقق من الصحة التي يجب انتظارها قبل تتبع تحسين القياس الأساسي للإيقاف المبكر. يجب أن تكون عددًا صحيحًا موجبًا.	5
`learning_rate`	معدل التعلم الأولي. لابد أن يكون عددًا عشريًا في النطاق [0، 1].	متعدد الفئات: 0.01 (باستثناء متغيرات vit: `vits16r224`: 0.0125 `vitb16r224`: 0.0125 `vitl16r224`: 0.001) تسمية متعددة: 0.035 (باستثناء متغيرات vit: `vits16r224`: 0.025 `vitb16r224`: 0.025 `vitl16r224`: 0.002) الكشف عن الكائنات: 0.005 (باستثناء `yolov5`: 0.01) تجزئة المثيل: 0.005
`learning_rate_scheduler`	نوع مُجدول معدل التعلم. لابد أن يكون `warmup_cosine` أو `step`.	`warmup_cosine`
`step_lr_gamma`	قيمة غاما عندما يكون مُجدول معدل التعلم هو `step`. لابد أن يكون عددًا عشريًا في النطاق [0، 1].	0.5
`step_lr_step_size`	قيمة حجم الخطوة عندما يكون مُجدول معدل التعلم هو `step`. يجب أن تكون عددًا صحيحًا موجبًا.	5
`warmup_cosine_lr_cycles`	قيمة دورة جيب التمام عندما يكون مُجدول معدل التعلم هو `warmup_cosine`. لابد أن يكون عددًا عشريًا في النطاق [0، 1].	0.45
`warmup_cosine_lr_warmup_epochs`	قيمة فترات التجهيز عندما يكون مُجدول معدل التعلم هو `warmup_cosine`. يجب أن تكون عددًا صحيحًا موجبًا.	2
`optimizer`	نوع المُحسِن. لابد أن يكون إما `sgd`، أو `adam`، أو `adamw`.	`sgd`
`momentum`	قيمة الزخم عندما يكون المُحسِن هو `sgd`. لابد أن يكون عددًا عشريًا في النطاق [0، 1].	0.9
`weight_decay`	قيمة تدهور الوزن عندما يكون المُحسِن هو `sgd` أو `adam` أو `adamw`. لابد أن يكون عددًا عشريًا في النطاق [0، 1].	1e-4
`nesterov`	مكّن `nesterov` عندما يكون المُحسِن هو `sgd`. لابد أن يكون 0 أو 1.	1
`beta1`	قيمة `beta1` عندما يكون المُحسِن هو `adam` أو `adamw`. لابد أن يكون عددًا عشريًا في النطاق [0، 1].	0.9
`beta2`	قيمة `beta2` عندما يكون المُحسِن هو `adam` أو `adamw`. لابد أن يكون عددًا عشريًا في النطاق [0، 1].	0.999
`ams_gradient`	مكّن `ams_gradient` عندما يكون المُحسِن هو `adam` أو `adamw`. لابد أن يكون 0 أو 1.	0
`evaluation_frequency`	قم بالتكرار لتقييم مجموعة بيانات التحقق من الصحة للحصول على درجات القياس. يجب أن تكون عددًا صحيحًا موجبًا.	1
`checkpoint_frequency`	قم بالتكرار لتخزين نقاط فحص النموذج. يجب أن تكون عددًا صحيحًا موجبًا.	نقطة فحص في فترة باستخدام أفضل قياس أساسي للتحقق من الصحة.
`checkpoint_run_id`	معرّف التشغيل للتجربة التي تحتوي على نقطة تحقق مُدربة مسبقاً للتدريب التزايدي.	لا افتراضي
`layers_to_freeze`	كم عدد الطبقات التي يجب تجميدها للنموذج الخاص بك. على سبيل المثال، تمرير 2 كقيمة لـ `seresnext` يعني تجميد الطبقة 0 والطبقة 1 بالإشارة إلى معلومات طبقة النموذج المدعومة أدناه. يجب أن تكون عددًا صحيحًا موجبًا. - `'resnet'`: `[('conv1.', 'bn1.'), 'layer1.', 'layer2.', 'layer3.', 'layer4.']` - `'mobilenetv2'`: `['features.0.', 'features.1.', 'features.2.', 'features.3.', 'features.4.', 'features.5.', 'features.6.', 'features.7.', 'features.8.', 'features.9.', 'features.10.', 'features.11.', 'features.12.', 'features.13.', 'features.14.', 'features.15.', 'features.16.', 'features.17.', 'features.18.']` - `'seresnext'`: `['layer0.', 'layer1.', 'layer2.', 'layer3.', 'layer4.']` * `'vit'`: `['patch_embed', 'blocks.0.', 'blocks.1.', 'blocks.2.', 'blocks.3.', 'blocks.4.', 'blocks.5.', 'blocks.6.','blocks.7.', 'blocks.8.', 'blocks.9.', 'blocks.10.', 'blocks.11.']` * `'yolov5_backbone'`: `['model.0.', 'model.1.', 'model.2.', 'model.3.', 'model.4.','model.5.', 'model.6.', 'model.7.', 'model.8.', 'model.9.']` - `'resnet_backbone'`: `['backbone.body.conv1.', 'backbone.body.layer1.', 'backbone.body.layer2.','backbone.body.layer3.', 'backbone.body.layer4.']`	لا افتراضي

معلمات فائقة خاصة بتصنيف الصور (متعددة الفئات ومتعددة التسميات)

يُلخص الجدول التالي المعلمات الفائقة لمهام تصنيف الصور (متعددة الفئات ومتعددة التسميات).

اسم المعلمة	‏‏الوصف	الإعداد الافتراضي
`model_name`	اسم النموذج الذي سيتم استخدامه لمهمة تصنيف الصور في متناول اليد. يجب أن يكون واحدا من `mobilenetv2`، `resnet18`، `resnet34`، `resnet50`، `resnet101`، `resnet152`، `resnest50`، `resnest101`، `seresnext`، ، `vits16r224`، `vitb16r224`. `vitl16r224`	`seresnext`
`weighted_loss`	- 0 بدون خسارة مرجحة. - 1 للخسارة المرجحة مع sqrt. (class_weights) - 2 للخسارة المرجحة مع class_weights. - يجب أن يكون 0 أو 1 أو 2.	0
`validation_resize_size`	- حجم الصورة المراد تغيير حجمها قبل الاقتصاص لمجموعة بيانات التحقق من الصحة. - يجب أن يكون عددا صحيحا موجبا. تلاحظ: - `seresnext` لا يأخذ حجمًا عشوائيًا. - تشغيل التدريب قد تحصل على OOM CUDA إذا كان الحجم كبيرا جدا.	256
`validation_crop_size`	- حجم اقتصاص الصورة الذي يتم إدخاله إلى شبكتك العصبية لمجموعة بيانات التحقق من الصحة. - يجب أن يكون عددا صحيحا موجبا. تلاحظ: - `seresnext` لا يأخذ حجمًا عشوائيًا. يجب أن يكون لـ - متغيرات ViT نفس `validation_crop_size` و`training_crop_size`. - تشغيل التدريب قد تحصل على OOM CUDA إذا كان الحجم كبيرا جدا.	224
`training_crop_size`	- حجم اقتصاص الصورة الذي يتم إدخاله إلى شبكتك العصبية لتدريب مجموعة البيانات. - يجب أن يكون عددا صحيحا موجبا. تلاحظ: - `seresnext` لا يأخذ حجمًا عشوائيًا. يجب أن يكون لـ - متغيرات ViT نفس `validation_crop_size` و`training_crop_size`. - تشغيل التدريب قد تحصل على OOM CUDA إذا كان الحجم كبيرا جدا.	224

المعلمات الفائقة الخاصة بمهمة الكشف عن العناصر وتجزئة المثيل

المعلمات الفائقة التالية مخصصة لمهام الكشف عن العناصر وتجزئة المثيل.

تحذير

هذه المعلمات غير مدعومة yolov5 مع البنية. راجع قسم المعلمات الفائقة المحددة للنموذج للمعلمات الفائقة المدعومة yolov5.

اسم المعلمة	‏‏الوصف	الإعداد الافتراضي
`model_name`	اسم النموذج الذي سيتم استخدامه لمهمة تصنيف الصور في متناول اليد. - بالنسبة لمهمة الكشف عن الكائنات، يجب أن تكون واحدة من `yolov5`، `fasterrcnn_resnet18_fpn`، `fasterrcnn_resnet34_fpn`، `fasterrcnn_resnet50_fpn`، `fasterrcnn_resnet101_fpn`، ، `fasterrcnn_resnet152_fpn`. `retinanet_resnet50_fpn` - على سبيل المثال مهمة التجزئة، يجب أن تكون واحدة من `maskrcnn_resnet18_fpn`، ، `maskrcnn_resnet34_fpn`، `maskrcnn_resnet50_fpn`، `maskrcnn_resnet101_fpnmaskrcnn_resnet152_fpn`	- لمهمة الكشف عن الكائنات، `fasterrcnn_resnet50_fpn` - على سبيل المثال مهمة التجزئة، `maskrcnn_resnet50_fpn`
`validation_metric_type`	أسلوب حساب القياس لاستخدامه مع قياسات التحقق من الصحة. ينبغي أن يكون `none` أو `coco` أو `voc` أو `coco_voc`.	`voc`
`validation_iou_threshold`	حد IOU لمطابقة المربع عند قياسات التحقق من صحة الحوسبة. يجب أن يكون عددًا عشريًا في النطاق [0.1، 1].	0.5
`min_size`	الحد الأدنى لحجم الصورة التي سيتم تغيير حجمها قبل إضافتها إلى العمود الفقري. يجب أن تكون عددًا صحيحًا موجبًا. ملاحظة: قد يدخل تشغيل التدريب في CUDA OOM إذا كان الحجم كبيرًا للغاية.	600
`max_size`	الحد الأقصى لحجم الصورة التي سيتم تغيير حجمها قبل إضافتها إلى العمود الفقري. يجب أن تكون عددًا صحيحًا موجبًا. ملاحظة: قد يدخل تشغيل التدريب في CUDA OOM إذا كان الحجم كبيرًا للغاية.	1333
`box_score_threshold`	خلال الاستدلال، تُرجع المقترحات فقط مع درجة تصنيف أكبر من `box_score_threshold`. لابد أن يكون عددًا عشريًا في النطاق [0، 1].	0.3
`nms_iou_threshold`	حد IOU (التقاطع فوق الاتحاد) المستخدم في المنع غير الأقصى (NMS) لرأس التنبؤ. يستخدم خلال الاستدلال. لابد أن يكون عددًا عشريًا في النطاق [0، 1].	0.5
`box_detections_per_image`	الحد الأقصى لعدد عمليات الكشف لكل صورة، لجميع الفئات. يجب أن تكون عددًا صحيحًا موجبًا.	100
`tile_grid_size`	حجم الشبكة المراد استخدامه لتجانب كل صورة. - `tile_grid_size` يجب ألا يكون None لتمكين منطق الكشف عن الكائنات الصغيرة. - `tile_grid_size` غير معتمد لمهام تجزئة المثيل. يجب تمريرها كسلسلة بتنسيق '3x2'. مثال: --tile_grid_size '3x2'	لا افتراضي
`tile_overlap_ratio`	نسبة التداخل بين التجانبات المتجاورة في كل بعد. لابد أن يكون عددًا عشريًا في النطاق [0، 1)	0.25
`tile_predictions_nms_threshold`	حد IOU لاستخدامه لأداء المنع غير الأقصى في أثناء دمج التنبؤات من التجانبات والصورة. يستخدم في التحقق من الصحة/ الاستدلال. يجب أن يكون عددًا عشريًا في النطاق [0، 1]	0.25

مشاركة عبر

المعلمات الفائقة لمهام رؤية الكمبيوتر باستخدام التعلم الآلي التلقائي

المعلمات الفائقة الخاصة بالنموذج

المعلمات الفائقة غير المحددة للنموذج

معلمات فائقة خاصة بتصنيف الصور (متعددة الفئات ومتعددة التسميات)

المعلمات الفائقة الخاصة بمهمة الكشف عن العناصر وتجزئة المثيل

الخطوات التالية

الملاحظات

الملاحظات

الموارد الإضافية