قم بإعداد البيانات لمهام رؤية الكمبيوتر باستخدام التعلم الآلي المنفذة تلقائياً الإصدار 1

ينطبق على: Python SDK azureml v1

هام

تتطلب أوامر Azure CLI الواردة في هذه المقالة ملحق azure-cli-ml، أو الإصدار 1، التعلم الآلي من Microsoft Azure. سينتهي دعم ملحق الإصدار 1 في 30 سبتمبر 2025. ستتمكن من تثبيت ملحق v1 واستخدامه حتى ذلك التاريخ.

نوصي بالانتقال إلى ملحق ml أو الإصدار 2 قبل 30 سبتمبر 2025. لمزيد من المعلومات حول ملحق v2، راجع ملحق Azure ML CLI وPython SDK v2.

هام

يعد دعم تدريب نماذج الرؤية الحاسوبية باستخدام التعلم الآلي من Microsoft Azure في التعلم الآلي من Microsoft Azure ميزة تجريبية للمعاينة العامة. بعض الميزات ربما لا تكون مدعمة أو بها بعض القدرات المقيدة. لمزيد من المعلومات، راجع ⁧⁩شروط الاستخدام التكميلية لمعاينات Microsoft Azure⁧⁩.

في هذه المقالة، ستتعرف على كيفية تحضير بيانات الصور لتدريب نماذج الرؤية الحاسوبية باستخدام التعلم الآلي في التعلم الآلي من Microsoft Azure.

لإنشاء نماذج لمهام رؤية الكمبيوتر باستخدام AutoML، تحتاج إلى إحضار بيانات الصورة المسماة كإدخال لتدريب النموذج في شكل Azure التعلم الآلي TabularDataset.

للتأكد من احتواء TabularDataset على المخطط المقبول للاستهلاك في التعلم الآلي من Microsoft Azure، يمكنك استخدام أداة تسمية بيانات التعلم الآلي من Microsoft Azure أو استخدام برنامج نصي للتحويل.

المتطلبات الأساسية

تسمية بيانات التعلم الآلي من Microsoft Azure

إذا لم تكن لديك بيانات مصنفة، يمكنك استخدام أداة تسمية البيانات في التعلم الآلي من Microsoft Azure لتسمية الصور يدوياً. تقوم هذه الأداة تلقائياً بإنشاء البيانات المطلوبة للتدريب بالتنسيق المقبول.

يساعد على إنشاء وإدارة ومراقبة مهام تسمية البيانات لـ

  • تصنيف الصور (متعدد الفئات ومتعدد الملصقات)
  • كشف العنصر (مربع الإحاطة)
  • تجزئة المثيل (مضلع)

إذا كان لديك بالفعل مشروع تسمية البيانات وتريد استخدام هذه البيانات، يمكنك تصدير البيانات المصنفة على هيئة التعلم الآلي منMicrosoft Azure TabularDataset، والتي يمكن استخدامها بعد ذلك مباشرة مع التعلم الآلي من Microsoft Azure لتدريب نماذج رؤية الكمبيوتر.

استخدم نصوص التحويل

إذا قمت بتسمية البيانات بتنسيقات بيانات رؤية الكمبيوتر الشائعة، مثل VOC أو COCO، فإن البرامج النصية المساعدة لإنشاء ملفات JSONL للتدريب وبيانات التحقق من الصحة متاحة في أمثلة على الكمبيوتر المحمول.

إذا لم تتبع بياناتك أيا من التنسيقات المذكورة سابقا، يمكنك استخدام البرنامج النصي الخاص بك لإنشاء ملفات خطوط JSON. لإنشاء ملفات خطوط JSON، استخدم المخططات المعرفة في المخطط لملفات JSONL لتجارب صور AutoML.

بعد تحويل ملفات البيانات إلى تنسيق JSONL المقبول، يمكنك تحميلها إلى حساب التخزين الخاص بك على Azure.

قم بتحميل ملف JSONL والصور إلى وحدة التخزين

لاستخدام البيانات لتدريب التعلم الآلي من Microsoft Azure، قم بتحميل البيانات إلى مساحة عمل التعلم الآلي من Microsoft Azure عبر مخزن بيانات. يوفر مخزن البيانات آلية لتحميل/تنزيل البيانات للتخزين على Azure، والتفاعل معها من أهداف الحوسبة البعيدة.

قم بتحميل الدليل الأصلي بالكامل الذي يتكون من الصور وملفات JSONL إلى مخزن البيانات الافتراضي الذي يتم إنشاؤه تلقائياً عند إنشاء مساحة العمل. يتصل مخزن البيانات هذا بحاوية تخزين البيانات الثنائية الكبيرة Azure الافتراضية التي تم إنشاؤها كجزء من إنشاء مساحة العمل.

# Retrieve default datastore that's automatically created when we setup a workspace
ds = ws.get_default_datastore()
ds.upload(src_dir='./fridgeObjects', target_path='fridgeObjects')

بمجرد الانتهاء من تحميل البيانات، يمكنك إنشاء Azure التعلم الآلي TabularDataset. ثم قم بتسجيل مجموعة البيانات إلى مساحة العمل الخاصة بك لاستخدامها في المستقبل كمدخل لتجارب التعلم الآلي التلقائية لنماذج رؤية الكمبيوتر.

from azureml.core import Dataset
from azureml.data import DataType

training_dataset_name = 'fridgeObjectsTrainingDataset'
# create training dataset
training_dataset = Dataset.Tabular.from_json_lines_files(path=ds.path("fridgeObjects/train_annotations.jsonl"),
                                                         set_column_types={"image_url": DataType.to_stream(ds.workspace)}
                                                        )
training_dataset = training_dataset.register( workspace=ws,name=training_dataset_name)

print("Training dataset name: " + training_dataset.name)

الخطوات التالية