إعداد بيئة تطوير Python للتعلم الآلي من Microsoft Azure

تعرَّف على كيفية تكوين بيئة تطوير Python للتعلم الآلي.

يوضح الجدول التالي كل بيئة تطوير تغطيها هذه المقالة، إلى جانب الإيجابيات والسلبيات.

البيئة إيجابيات السلبيات
البيئة المحلية التحكم الكامل في بيئة التطوير لديك وفي التبعيات الخاصة بك. قم بتشغيل أي أداة تحديث إصدار أو بيئة أو IDE (بيئة التطوير المتكامل) من اختيارك. يستغرق وقتاً أطول للبدء. يجب تثبيت حزم SDK الضرورية، كما يجب تثبيت بيئة إذا لم يكن لديك واحدة بالفعل.
Data Science Virtual Machine (DSVM) على غرار مثيل الحساب المستند إلى السحابة (Python مثبت مسبقا)، ولكن مع علوم البيانات الشائعة الإضافية وأدوات التعلم الآلي المثبتة مسبقا. سهولة تغيير الحجم والدمج مع أدوات وسير العمل الأخرى المخصصة. تجربة بدء أبطأ مقارنة بمثيل الحساب المسند إلى السحابة.
مثيل حساب التعلم الآلي من Azure أسهل طريقة للبدء. تم تثبيت SDK بالفعل في الجهاز الظاهري لمساحة العمل، ويتم استنساخ البرامج التعليمية لدفتر الملاحظات مسبقا وجاهزة للتشغيل. نقص التحكم في بيئة التطوير الخاصة بك والتبعيات. تكلفة إضافية تُكبدت لـ Linux VM (يمكن إيقاف VM عندما لا يكون قيد الاستخدام لتجنب فرض رسوم). راجع ⁧⁩تفاصيل الأسعار⁧⁩.

توفر هذه المقالة أيضاً نصائح استخدام إضافية للأدوات التالية:

  • Jupyter Notebooks: إذا كنت تستخدم بالفعل Jupyter Notebooks، فإن SDK بها بعض الإضافات التي يجب عليك تثبيتها.

  • Visual Studio Code: إذا كنت تستخدم Visual Studio Code، فإن ملحق التعلم الآلي من Microsoft Azure يتضمن دعم اللغة ل Python، وميزات لجعل العمل مع التعلم الآلي من Microsoft Azure أكثر ملاءمة وإنتاجية.

المتطلبات الأساسية

محلي وDSVM فقط: إنشاء ملف تكوين مساحة العمل

ملف تكوين مساحة العمل هو ملف JSON يخبر SDK بكيفية الاتصال بمساحة عمل التعلم الآلي. اسم الملف config.json، وله التنسيق التالي:

{
    "subscription_id": "<subscription-id>",
    "resource_group": "<resource-group>",
    "workspace_name": "<workspace-name>"
}

يجب أن يكون ملف JSON هذا في بنية الدليل الذي يحتوي على نصوص Python أو Jupyter Notebooks الخاصتين بك. يمكن أن يكون في نفس الدليل أو دليل فرعي يسمى.azureml*، أو في دليل أصل.

لاستخدام هذا الملف من التعليمة البرمجية الخاصة بك، استخدم أسلوب MLClient.from_config. تقوم هذه التعليمة البرمجية بتحميل المعلومات من الملف وتُعين مساحة العمل الخاصة بك.

إنشاء ملف تكوين مساحة العمل بإحدى الأساليب التالية:

  • خدمة التعلم الآلي من Microsoft Azure

    قم بتنزيل الملف:

    1. تسجيل الدخول إلى Azure Machine Learning studio
    2. في شريط أدوات أستوديو Azure Machine Learning العلوي الأيمن، حدد اسم مساحة العمل الخاصة بك.
    3. حدد ارتباط تنزيل ملف التكوين .

    لقطة شاشة توضح كيفية تنزيل ملف التكوين الخاص بك.

  • Azure Machine Learning Python SDK

    إنشاء برنامج نصي للاتصال بمساحة عمل التعلم الآلي من Microsoft Azure. تأكد من استبدال subscription_idوresource_groupو workspace_name بآخر خاص بك.

    ينطبق على: Python SDK azure-ai-ml v2 (الحالي)

    #import required libraries
    from azure.ai.ml import MLClient
    from azure.identity import DefaultAzureCredential
    
    #Enter details of your Azure Machine Learning workspace
    subscription_id = '<SUBSCRIPTION_ID>'
    resource_group = '<RESOURCE_GROUP>'
    workspace = '<AZUREML_WORKSPACE_NAME>'
    
    #connect to the workspace
    ml_client = MLClient(DefaultAzureCredential(), subscription_id, resource_group, workspace)
    

الكمبيوتر المحلي أو بيئة VM البعيدة

يمكنك إعداد بيئة على كمبيوتر محلي أو جهاز ظاهري بعيد، مثل مثيل حساب التعلم الآلي من Microsoft Azure أو Data Science VM.

لتكوين بيئة تطوير محلية أو جهاز ظاهري بعيد:

  1. قم بإنشاء بيئة ظاهرية Python (virtualenv وconda).

    ملاحظة

    على الرغم من أنه ليس مطلوباً، يوصى باستخدام Anaconda أو Miniconda لإدارة بيئات Python الظاهرية وتثبيت الحزم.

    هام

    إذا كنت تستخدم نظام التشغيل Linux أو macOS وتستخدم shell بخلاف bash (على سبيل المثال zsh)، فقد تتلقى أخطاء عند تشغيل بعض الأوامر. للتغلب على هذه المشكلة، استخدم الأمر bash لبدء bash shell جديد وتشغيل الأوامر هناك.

  2. قم بتنشيط بيئة Python الظاهرية التي أُنشئت حديثاً.

  3. قم بتثبيت Azure Machine Learning Python SDK.

  4. لتكوين بيئتك المحلية لاستخدام مساحة عملك التعلم الآلي، أنشئ ملف تكوين مساحة عمل أو استخدم واحداً موجوداً.

الآن بعد أن تم إعداد بيئتك المحلية، فأنت جاهز لبدء العمل مع التعلم الآلي. راجع البرنامج التعليمي: التعلم الآلي من Microsoft Azure في يوم واحد للبدء.

دفاتر Jupyter Notebooks

عند تشغيل خادم Jupyter Notebook محلي، يوصى بإنشاء نواة IPython لبيئة Python الظاهرية. يساعد هذا في ضمان سلوك النواة، واستيراد الحزمة المتوقعة.

  1. تمكين نواة IPython الخاصة بالبيئة

    conda install notebook ipykernel
    
  2. قم بإنشاء نواة لبيئة Python الظاهرية الخاصة بك. تأكد من استبدال <myenv> باسم بيئة Python الظاهرية الخاصة بك.

    ipython kernel install --user --name <myenv> --display-name "Python (myenv)"
    
  3. تشغيل خادم Jupyter Notebook

تلميح

على سبيل المثال دفاتر الملاحظات، راجع مستودع AzureML-Examples . توجد أمثلة SDK ضمن /sdk/python. على سبيل المثال، مثال دفتر ملاحظات التكوين .

تعليمة Visual Studio برمجية

لاستخدام Visual Studio Code للتطوير:

  1. ثبت التعليمات البرمجية لتطبيق Visual Studio.
  2. قم بتثبيت ملحق التعلم الآلي Visual Studio Code (إصدار أوَّلي).

بمجرد تثبيت ملحق Visual Studio Code، استخدمه من أجل:

مثيل حساب التعلم الآلي من Azure

يعد التعلم الآلي من Microsoft Azure مثيل الحساب عبارة عن محطة عمل Azure آمنة ومستندة إلى السحابة والتي توفر لعلماء البيانات خادم Jupyter Notebook وJupyterLab وخدمة بيئة التعلم الآلي المُدارة بشكل كامل.

لا يوجد شيء لتثبيته أو تكوينه لمثيل حساب.

قم بإنشاء واحد في أي وقت من داخل مساحة عمل التعلم الآلي من Microsoft Azure. أدخل اسماً فقط وحدد نوع Azure VM. جربه الآن باستخدام إنشاء موارد للبدء.

لمعرفة المزيد حول مثيلات الحوسبة، بما في ذلك كيفية تثبيت الحزم، راجع إنشاء مثيل حساب التعلم الآلي من Microsoft Azure.

تلميح

لمنع تكبد رسوم لمثيل حساب غير مستخدم، قم بتمكين إيقاف التشغيل الخامل.

بالإضافة إلى خادم Jupyter Notebook وJupyterLab، يمكنك استخدام مثيلات الحساب في ميزة دفتر الملاحظات المدمجة داخل أستوديو التعلم الآلي.

يمكنك أيضاً استخدام ملحق Azure Machine Learning Visual Studio Code للتعيين بمثيل حساب بعيد باستخدام VS Code.

الجهاز الظاهري لعلوم البيانات

جهاز Data Science VM عبارة عن صورة مخصصة لجهاز ظاهري (VM) يمكنك استخدامها كبيئة تطوير. إنه مصمم للعمل في علم البيانات والذي يتكون من أدوات مكونة مسبقاً وبرامج مثل:

  • حزم مثل TensorFlow وPyTorch وScikit-learn وXGBoost وAzure Machine Learning SDK
  • أدوات علوم البيانات الشائعة مثل Spark Standalone وDrill
  • أدوات Azure مثل Azure CLI وAzCopy وStorage Explorer
  • بيئات التطوير المتكاملة (IDEs) مثل Visual Studio Code وPyCharm
  • خادم دفتر Jupyter

للحصول على قائمة أكثر شمولاً بالأدوات، راجع إرشاد Data Science VM للبيانات.

هام

إذا كنت تخطط لاستخدام Data Science VM بوصفها هدفاً حسابياً لمهام التدريب أو الاستدلال، فإن Ubuntu هو المدعوم فقط.

لاستخدام VM Data Science بوصفها بيئة تطوير:

  1. إنشاء Data Science VM باستخدام إحدى الطرق التالية:

    • استخدم مدخل Microsoft Azure لإنشاء Ubuntu or Windows DSVM.

    • إنشاء Data Science VM باستخدام قوالب ARM.

    • استخدام Azure CLI

      لإنشاء Ubuntu Data Science VM، استخدم الأمر التالي:

      # create a Ubuntu Data Science VM in your resource group
      # note you need to be at least a contributor to the resource group in order to execute this command successfully
      # If you need to create a new resource group use: "az group create --name YOUR-RESOURCE-GROUP-NAME --location YOUR-REGION (For example: westus2)"
      az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:linux-data-science-vm-ubuntu:linuxdsvmubuntu:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --generate-ssh-keys --authentication-type password
      

      لإنشاء Windows DSVM، استخدم الأمر التالي:

      # create a Windows Server 2016 DSVM in your resource group
      # note you need to be at least a contributor to the resource group in order to execute this command successfully
      az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:dsvm-windows:server-2016:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --authentication-type password
      
  2. إنشاء بيئة conda ل Azure Machine Learning SDK:

    conda create -n py310 python=310
    
  3. بمجرد إنشاء البيئة، قم بتنشيطها وتثبيت SDK

    conda activate py310
    pip install azure-ai-ml azure-identity
    
  4. لتكوين Data Science VM لاستخدام مساحة عمل التعلم الآلي، أنشئ ملف تكوين مساحة عمل أو استخدم ملفاً موجوداً.

    تلميح

    على غرار البيئات المحلية، يمكنك استخدام Visual Studio Code وملحق التعلم الآلي Visual Studio Code للتفاعل مع التعلم الآلي.

    لمزيد من المعلومات، راجع Data Science Virtual Machines.

الخطوات التالية