التشغيل السريع: إعداد الجهاز الظاهري لعلوم البيانات لـ Linux (Ubuntu)

ابدأ العمل باستخدام Ubuntu 20.04 Data Science Virtual Machine (DSVM) وAzure DSVM ل PyTorch.

المتطلبات الأساسية

تحتاج إلى اشتراك Azure لإنشاء جهاز ظاهري لعلوم البيانات Ubuntu 20.04 أو Azure DSVM ل PyTorch. جرب Azure مجاناً.

إشعار

حسابات Azure المجانية لا تدعم وحدات إدارة المخزون للأجهزة الظاهرية التي تدعم وحدات معالجة الرسومات.

إنشاء جهاز ظاهري لعلوم البيانات لـ Linux

توضح هذه الخطوات كيفية إنشاء مثيل ل Ubuntu 20.04 Data Science Virtual Machine (DSVM) أو Azure DSVM ل PyTorch:

  1. انتقل إلى مدخل Azure. قد تتلقى مطالبة بتسجيل الدخول إلى حساب Azure الخاص بك إذا لم تكن قد سجلت الدخول بعد

  2. ابحث عن قائمة الجهاز الظاهري. اكتب أولا في "الجهاز الظاهري لعلوم البيانات"، ثم حدد "Data Science Virtual Machine- Ubuntu 20.04" أو "Azure DSVM ل PyTorch"

  3. في النافذة التالية، حدد Create

  4. يجب إعادة توجيهك إلى شفرة "إنشاء جهاز ظاهري"

  5. أدخل المعلومات التالية لتكوين كل خطوة من خطوات المعالج:

    1. الأساسيات:

      • الاشتراك: إذا كان لديك أكثر من اشتراك، حدد الاشتراك الذي سيتم إنشاء الجهاز عليه وفوترته. يجب أن يكون لديك امتيازات إنشاء الموارد لهذا الاشتراك.

      • مجموعة الموارد: إنشاء مجموعة جديدة، أو استخدام مجموعة موجودة.

      • اسم الجهاز الظاهري: إدخال اسم الجهاز الظاهري. يتم استخدام هذا الاسم في مدخل Microsoft Azure.

      • المنطقة: حدد مركز البيانات الأنسب. للحصول على أسرع وصول إلى الشبكة، هذا هو مركز البيانات الذي يحتوي على معظم بياناتك، أو الأقرب إلى موقعك الفعلي. لمزيد من المعلومات، تفضل بزيارة مناطق Azure.

      • الصورة: لا تغير القيمة الافتراضية.

      • الحجم: يجب أن تتم ملء هذا الخيار تلقائيا بحجم مناسب لأحمال العمل العامة. لمزيد من المعلومات، تفضل بزيارة أحجام أجهزة Linux الظاهرية في Azure.

      • نوع المصادقة: لإعداد أسرع، حدد "كلمة المرور".

        إشعار

        إذا كنت تخطط لاستخدام JupyterHub، فتأكد من تحديد "كلمة المرور"، لأن JupyterHub لم يتم تكوينه لاستخدام مفاتيح SSH العامة.

      • اسم المستخدم: إدخال اسم المستخدم المسؤول. يمكنك استخدام اسم المستخدم هذا لتسجيل الدخول إلى جهازك الظاهري. لا يحتاج اسم المستخدم هذا إلى مطابقة اسم مستخدم Azure الخاص بك. لا تستخدم الأحرف الكبيرة.

        هام

        إذا كنت تستخدم أحرفًا كبيرة في اسم المستخدم الخاص بك، فإن JupyterHub لن يعمل، وستواجه خطأ داخليًا في الخادم 500.

      • كلمة المرور: أدخل كلمة المرور التي ستستخدمها لتسجيل الدخول إلى جهازك الظاهري.

    2. حدد "Review + create".

    3. مراجعة+إنشاء

      • تحقق من صحة جميع المعلومات التي أدخلتها.
      • حدد إنشاء.

    يجب أن تستغرق عملية التوفير حوالي 5 دقائق. يعرض مدخل Microsoft Azure الحالة.

كيفية الوصول إلى الجهاز الظاهري لعلوم البيانات لـ Ubuntu

يمكنك الوصول إلى Ubuntu DSVM بإحدى الطرق الأربع:

  • SSH للجلسات الطرفية
  • xrdp للجلسات الرسومية
  • X2Go للجلسات الرسومية
  • دفاتر ملاحظات JupyterHub وJupyterLab for Jupyter

SSH

إذا قمت بتكوين الجهاز الظاهري الخاص بك باستخدام مصادقة SSH، يمكنك تسجيل الدخول باستخدام بيانات اعتماد الحساب التي قمت بإنشائها في قسم الأساسيات في الخطوة 3 لواجهة shell النصية. لمزيد من المعلومات، تفضل بزيارة معرفة المزيد حول الاتصال بجهاز Linux الظاهري.

xrdp

xrdp هو الأداة القياسية للوصول إلى جلسات Linux الرسومية. بينما لا تتضمن توزيعة هذه الأداة بشكل افتراضي، تشرح هذه الإرشادات كيفية تثبيتها.

X2Go

إشعار

في الاختبار، كان أداء عميل X2Go أفضل من إعادة توجيه X11. نوصي باستخدام عميل X2Go لواجهة سطح مكتب رسومية.

تم توفير جهاز Linux الظاهري بالفعل مع X2Go Server وهو جاهز لقبول اتصالات العميل. للاتصال بسطح المكتب الرسومي الجهاز الظاهري Linux، أكمل الإجراء التالي بشأن العميل لديك:

  1. قم بتنزيل عميل X2Go وتثبيته للنظام الأساسي للعميل من X2Go.

  2. لاحظ عنوان IP العام للجهاز الظاهري. في مدخل Microsoft Azure، افتح الجهاز الظاهري الذي أنشأته للعثور على هذه المعلومات.

    لقطة شاشة تعرض عنوان IP العام للجهاز الظاهري.

  3. تشغيل عميل X2Go. إذا لم تظهر نافذة "جلسة عمل جديدة" تلقائيا، فانتقل إلى جلسة العمل -> جلسة عمل جديدة.

  4. في نافذة التكوين الناتجة، أدخل معلمات التكوين هذه:

    • علامة تبويب الجلسة:
      • Host: أدخل عنوان IP للجهاز الظاهري لديك، والذي ذكرته سابقًا.
      • Login: أدخل اسم المستخدم على الجهاز الظاهري لـ Linux.
      • منفذ SSH: اتركه عند 22. وتكون هذه هي القيمة الافتراضية.
      • نوع الجلسة: غير القيمة إلى XFCE. حاليًا، يدعم الجهاز الظاهري لـ Linux سطح المكتب XFCE فقط.
    • Media tab: يمكنك إيقاف تشغيل دعم الصوت وطباعة العميل إذا لم تكن بحاجة إلى استخدامها.
    • المجلدات المشتركة: استخدم علامة التبويب هذه لإضافة دليل جهاز العميل الذي ترغب في تحميله على الجهاز الظاهري.

    لقطة شاشة تعرض تفضيلات جلسة عمل X2Go جديدة.

  5. حدد موافق.

  6. حدد على المربع في الجزء الأيسر من نافذة X2Go لإظهار شاشة تسجيل الدخول لجهازك الظاهري.

  7. أدخل كلمة المرور الخاصة بـ الجهاز الظاهري لديك.

  8. حدد موافق.

  9. قد تحتاج إلى منح X2Go إذنا لتجاوز جدار الحماية لإنهاء عملية الاتصال.

  10. يجب أن تشاهد الآن الواجهة الرسومية لـ Ubuntu DSVM لديك.

JupyterHub وJupyterLab

يقوم Ubuntu DSVM بتشغيل JupyterHub، وهو خادم Jupyter متعدد الاستخدام. للاتصال، اتخذ الخطوات التالية:

  1. لاحظ عنوان IP العام للجهاز الظاهري الخاص بك. للعثور على هذه القيمة، ابحث عن الجهاز الظاهري وحدده في مدخل Microsoft Azure، كما هو موضح في لقطة الشاشة هذه:

    لقطة شاشة تبرز عنوان IP العام لجهازك الظاهري.

  2. من جهازك المحلي، افتح مستعرض ويب، وانتقل إلى https:// your-vm-ip:8000، واستبدل "your-vm-ip" بعنوان IP الذي لاحظته سابقا.

  3. من المحتمل أن يمنعك المستعرض من فتح الصفحة مباشرة. قد يخبرك أن هناك خطأ في الشهادة. يوفر DSVM الأمان مع شهادة موقعة ذاتيا. ستسمح لك معظم المستعرضات بالاختيار بعد هذا التحذير. سيستمر العديد من المستعرضات لتوفير نوع من التحذير المرئي حول الشهادة خلال جلسة عمل ويب.

    إشعار

    إذا رأيت ERR_EMPTY_RESPONSE رسالة الخطأ في المستعرض، فتأكد من الوصول إلى الجهاز عن طريق الاستخدام الصريح لبروتوكول HTTPS . لا يعمل HTTP أو عنوان الويب فقط لهذه الخطوة. إذا كتبت عنوان الويب بدون https:// في سطر العنوان، فسيتم تعيين معظم المستعرضات افتراضيا إلى http، وسيظهر الخطأ.

  4. أدخل اسم المستخدم وكلمة المرور اللذين استخدمتهما لإنشاء الجهاز الظاهري، وسجل الدخول، كما هو موضح في لقطة الشاشة هذه

    لقطة شاشة لشاشة تسجيل الدخول إلى JupyterHub.

    إشعار

    إذا تلقيت خطأ 500 في هذه المرحلة، فمن المحتمل أنك استخدمت أحرفا كبيرة في اسم المستخدم الخاص بك. هذا هو التفاعل المعروف بين Jupyter Hub وPAMAuthenticator الذي يستخدمه. إذا تلقيت خطأ "يتعذر الوصول إلى هذه الصفحة"، فمن المحتمل أن أذونات مجموعة أمان الشبكة تحتاج إلى تعديل. في المدخل Azure، ابحث عن مورد مجموعة أمان الشبكة ضمن مجموعة الموارد. للوصول إلى JupyterHub من الإنترنت العام، يجب أن يكون المنفذ 8000 مفتوحًا. (تظهر الصورة أن هذا الجهاز الظاهري قد تم تكوينه للوصول في الوقت المناسب، وهو ما يوصى به بشدة. لمزيد من المعلومات، تفضل بزيارة تأمين منافذ الإدارة الخاصة بك من خلال الوصول في الوقت المناسب.)

    لقطة شاشة لقيم تكوين مجموعة أمان الشبكة.

  5. استعرض نماذج دفاتر الملاحظات المتوفرة.

JupyterLab، الجيل القادم من دفاتر Jupyter وJupyterHub متاح أيضًا. للوصول إليه، سجل الدخول إلى JupyterHub، ثم استعرض للوصول إلى عنوان URL https://your-vm-ip:8000/user/your-username/lab، واستبدل "your-username" باسم المستخدم الذي اخترته عند تكوين الجهاز الظاهري. مرة أخرى، قد تمنعك أخطاء الشهادة المحتملة في البداية من الوصول إلى الموقع.

لتعيين JupyterLab كخادم دفتر الملاحظات الافتراضي، أضف هذا السطر إلى /etc/jupyterhub/jupyterhub_config.py:

c.Spawner.default_url = '/lab'

الخطوات التالية

  • يوضح علم البيانات على الجهاز الظاهري لعلوم البيانات ل Linux كيفية القيام بالعديد من مهام علوم البيانات الشائعة باستخدام Linux DSVM المتوفر هنا.
  • جرب الأدوات التي تصفها هذه المقالة لاستكشاف أدوات علم البيانات المختلفة على DSVM. يمكنك أيضا تشغيل dsvm-more-info على shell داخل الجهاز الظاهري للحصول على مقدمة أساسية ومؤشرات لمزيد من المعلومات حول الأدوات المثبتة على الجهاز الظاهري.
  • تعرف على كيفية بناء حلول تحليلية بشكل منهجي باستخدام عملية علوم بيانات الفريق.
  • تفضل بزيارة معرض الذكاء الاصطناعي Azure للحصول على نماذج التعلم الآلي وتحليلات البيانات التي تستخدم خدمات Azure الذكاء الاصطناعي.
  • قم بزيارة الوثائق المرجعية المناسبة لهذا الجهاز الظاهري.