إعداد بيئة تطوير Python للتعلم الآلي من Microsoft Azure
تعرَّف على كيفية تكوين بيئة تطوير Python للتعلم الآلي.
يوضح الجدول التالي كل بيئة تطوير تغطيها هذه المقالة، إلى جانب الإيجابيات والسلبيات.
البيئة | إيجابيات | السلبيات |
---|---|---|
البيئة المحلية | التحكم الكامل في بيئة التطوير لديك وفي التبعيات الخاصة بك. قم بتشغيل أي أداة تحديث إصدار أو بيئة أو IDE (بيئة التطوير المتكامل) من اختيارك. | يستغرق وقتاً أطول للبدء. يجب تثبيت حزم SDK الضرورية، كما يجب تثبيت بيئة إذا لم يكن لديك واحدة بالفعل. |
Data Science Virtual Machine (DSVM) | على غرار مثيل الحساب المستند إلى السحابة (Python مثبت مسبقا)، ولكن مع علوم البيانات الشائعة الإضافية وأدوات التعلم الآلي المثبتة مسبقا. سهولة تغيير الحجم والدمج مع أدوات وسير العمل الأخرى المخصصة. | تجربة بدء أبطأ مقارنة بمثيل الحساب المسند إلى السحابة. |
مثيل حساب التعلم الآلي من Azure | أسهل طريقة للبدء. تم تثبيت SDK بالفعل في الجهاز الظاهري لمساحة العمل، ويتم استنساخ البرامج التعليمية لدفتر الملاحظات مسبقا وجاهزة للتشغيل. | نقص التحكم في بيئة التطوير الخاصة بك والتبعيات. تكلفة إضافية تُكبدت لـ Linux VM (يمكن إيقاف VM عندما لا يكون قيد الاستخدام لتجنب فرض رسوم). راجع تفاصيل الأسعار. |
توفر هذه المقالة أيضاً نصائح استخدام إضافية للأدوات التالية:
Jupyter Notebooks: إذا كنت تستخدم بالفعل Jupyter Notebooks، فإن SDK بها بعض الإضافات التي يجب عليك تثبيتها.
Visual Studio Code: إذا كنت تستخدم Visual Studio Code، فإن ملحق التعلم الآلي من Microsoft Azure يتضمن دعم اللغة ل Python، وميزات لجعل العمل مع التعلم الآلي من Microsoft Azure أكثر ملاءمة وإنتاجية.
المتطلبات الأساسية
- Azure Machine Learning Workspace. إذا لم يكن لديك واحدة، فيمكنك إنشاء مساحة عمل التعلم الآلي من خلال مدخل Microsoft Azureو Azure CLI وقوالب Azure Resource Manager.
محلي وDSVM فقط: إنشاء ملف تكوين مساحة العمل
ملف تكوين مساحة العمل هو ملف JSON يخبر SDK بكيفية الاتصال بمساحة عمل التعلم الآلي. اسم الملف config.json، وله التنسيق التالي:
{
"subscription_id": "<subscription-id>",
"resource_group": "<resource-group>",
"workspace_name": "<workspace-name>"
}
يجب أن يكون ملف JSON هذا في بنية الدليل الذي يحتوي على نصوص Python أو Jupyter Notebooks الخاصتين بك. يمكن أن يكون في نفس الدليل أو دليل فرعي يسمى.azureml*، أو في دليل أصل.
لاستخدام هذا الملف من التعليمة البرمجية الخاصة بك، استخدم أسلوب MLClient.from_config
. تقوم هذه التعليمة البرمجية بتحميل المعلومات من الملف وتُعين مساحة العمل الخاصة بك.
إنشاء ملف تكوين مساحة العمل بإحدى الأساليب التالية:
خدمة التعلم الآلي من Microsoft Azure
قم بتنزيل الملف:
- تسجيل الدخول إلى Azure Machine Learning studio
- في شريط أدوات أستوديو Azure Machine Learning العلوي الأيمن، حدد اسم مساحة العمل الخاصة بك.
- حدد ارتباط تنزيل ملف التكوين .
Azure Machine Learning Python SDK
إنشاء برنامج نصي للاتصال بمساحة عمل التعلم الآلي من Microsoft Azure. تأكد من استبدال
subscription_id
وresource_group
وworkspace_name
بآخر خاص بك.ينطبق على: Python SDK azure-ai-ml v2 (الحالي)
#import required libraries from azure.ai.ml import MLClient from azure.identity import DefaultAzureCredential #Enter details of your Azure Machine Learning workspace subscription_id = '<SUBSCRIPTION_ID>' resource_group = '<RESOURCE_GROUP>' workspace = '<AZUREML_WORKSPACE_NAME>' #connect to the workspace ml_client = MLClient(DefaultAzureCredential(), subscription_id, resource_group, workspace)
الكمبيوتر المحلي أو بيئة VM البعيدة
يمكنك إعداد بيئة على كمبيوتر محلي أو جهاز ظاهري بعيد، مثل مثيل حساب التعلم الآلي من Microsoft Azure أو Data Science VM.
لتكوين بيئة تطوير محلية أو جهاز ظاهري بعيد:
قم بإنشاء بيئة ظاهرية Python (virtualenv وconda).
ملاحظة
على الرغم من أنه ليس مطلوباً، يوصى باستخدام Anaconda أو Miniconda لإدارة بيئات Python الظاهرية وتثبيت الحزم.
هام
إذا كنت تستخدم نظام التشغيل Linux أو macOS وتستخدم shell بخلاف bash (على سبيل المثال zsh)، فقد تتلقى أخطاء عند تشغيل بعض الأوامر. للتغلب على هذه المشكلة، استخدم الأمر
bash
لبدء bash shell جديد وتشغيل الأوامر هناك.قم بتنشيط بيئة Python الظاهرية التي أُنشئت حديثاً.
قم بتثبيت Azure Machine Learning Python SDK.
لتكوين بيئتك المحلية لاستخدام مساحة عملك التعلم الآلي، أنشئ ملف تكوين مساحة عمل أو استخدم واحداً موجوداً.
الآن بعد أن تم إعداد بيئتك المحلية، فأنت جاهز لبدء العمل مع التعلم الآلي. راجع البرنامج التعليمي: التعلم الآلي من Microsoft Azure في يوم واحد للبدء.
دفاتر Jupyter Notebooks
عند تشغيل خادم Jupyter Notebook محلي، يوصى بإنشاء نواة IPython لبيئة Python الظاهرية. يساعد هذا في ضمان سلوك النواة، واستيراد الحزمة المتوقعة.
تمكين نواة IPython الخاصة بالبيئة
conda install notebook ipykernel
قم بإنشاء نواة لبيئة Python الظاهرية الخاصة بك. تأكد من استبدال
<myenv>
باسم بيئة Python الظاهرية الخاصة بك.ipython kernel install --user --name <myenv> --display-name "Python (myenv)"
تشغيل خادم Jupyter Notebook
تلميح
على سبيل المثال دفاتر الملاحظات، راجع مستودع AzureML-Examples . توجد أمثلة SDK ضمن /sdk/python. على سبيل المثال، مثال دفتر ملاحظات التكوين .
تعليمة Visual Studio برمجية
لاستخدام Visual Studio Code للتطوير:
- ثبت التعليمات البرمجية لتطبيق Visual Studio.
- قم بتثبيت ملحق التعلم الآلي Visual Studio Code (إصدار أوَّلي).
بمجرد تثبيت ملحق Visual Studio Code، استخدمه من أجل:
- إدارة موارد التعلم الآلي من Microsoft Azure
- تعيين بمثيل حساب التعلم الآلي من Microsoft Azure من Microsoft Azure
- تتبع أخطاء نقاط النهاية عبر الإنترنت محليا
- توزيع النماذج المدربة.
مثيل حساب التعلم الآلي من Azure
يعد التعلم الآلي من Microsoft Azure مثيل الحساب عبارة عن محطة عمل Azure آمنة ومستندة إلى السحابة والتي توفر لعلماء البيانات خادم Jupyter Notebook وJupyterLab وخدمة بيئة التعلم الآلي المُدارة بشكل كامل.
لا يوجد شيء لتثبيته أو تكوينه لمثيل حساب.
قم بإنشاء واحد في أي وقت من داخل مساحة عمل التعلم الآلي من Microsoft Azure. أدخل اسماً فقط وحدد نوع Azure VM. جربه الآن باستخدام إنشاء موارد للبدء.
لمعرفة المزيد حول مثيلات الحوسبة، بما في ذلك كيفية تثبيت الحزم، راجع إنشاء مثيل حساب التعلم الآلي من Microsoft Azure.
تلميح
لمنع تكبد رسوم لمثيل حساب غير مستخدم، قم بتمكين إيقاف التشغيل الخامل.
بالإضافة إلى خادم Jupyter Notebook وJupyterLab، يمكنك استخدام مثيلات الحساب في ميزة دفتر الملاحظات المدمجة داخل أستوديو التعلم الآلي.
يمكنك أيضاً استخدام ملحق Azure Machine Learning Visual Studio Code للتعيين بمثيل حساب بعيد باستخدام VS Code.
الجهاز الظاهري لعلوم البيانات
جهاز Data Science VM عبارة عن صورة مخصصة لجهاز ظاهري (VM) يمكنك استخدامها كبيئة تطوير. إنه مصمم للعمل في علم البيانات والذي يتكون من أدوات مكونة مسبقاً وبرامج مثل:
- حزم مثل TensorFlow وPyTorch وScikit-learn وXGBoost وAzure Machine Learning SDK
- أدوات علوم البيانات الشائعة مثل Spark Standalone وDrill
- أدوات Azure مثل Azure CLI وAzCopy وStorage Explorer
- بيئات التطوير المتكاملة (IDEs) مثل Visual Studio Code وPyCharm
- خادم دفتر Jupyter
للحصول على قائمة أكثر شمولاً بالأدوات، راجع إرشاد Data Science VM للبيانات.
هام
إذا كنت تخطط لاستخدام Data Science VM بوصفها هدفاً حسابياً لمهام التدريب أو الاستدلال، فإن Ubuntu هو المدعوم فقط.
لاستخدام VM Data Science بوصفها بيئة تطوير:
إنشاء Data Science VM باستخدام إحدى الطرق التالية:
استخدام Azure CLI
لإنشاء Ubuntu Data Science VM، استخدم الأمر التالي:
# create a Ubuntu Data Science VM in your resource group # note you need to be at least a contributor to the resource group in order to execute this command successfully # If you need to create a new resource group use: "az group create --name YOUR-RESOURCE-GROUP-NAME --location YOUR-REGION (For example: westus2)" az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:linux-data-science-vm-ubuntu:linuxdsvmubuntu:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --generate-ssh-keys --authentication-type password
لإنشاء Windows DSVM، استخدم الأمر التالي:
# create a Windows Server 2016 DSVM in your resource group # note you need to be at least a contributor to the resource group in order to execute this command successfully az vm create --resource-group YOUR-RESOURCE-GROUP-NAME --name YOUR-VM-NAME --image microsoft-dsvm:dsvm-windows:server-2016:latest --admin-username YOUR-USERNAME --admin-password YOUR-PASSWORD --authentication-type password
إنشاء بيئة conda ل Azure Machine Learning SDK:
conda create -n py310 python=310
بمجرد إنشاء البيئة، قم بتنشيطها وتثبيت SDK
conda activate py310 pip install azure-ai-ml azure-identity
لتكوين Data Science VM لاستخدام مساحة عمل التعلم الآلي، أنشئ ملف تكوين مساحة عمل أو استخدم ملفاً موجوداً.
تلميح
على غرار البيئات المحلية، يمكنك استخدام Visual Studio Code وملحق التعلم الآلي Visual Studio Code للتفاعل مع التعلم الآلي.
لمزيد من المعلومات، راجع Data Science Virtual Machines.
الخطوات التالية
- تدريب وتوزيع النموذج على التعلم الآلي باستخدام مجموعة بيانات MNIST.
- راجع التعلم الآلي SDK لمرجع Python.