استخدام Jupyter Notebook الكلاسيكي مع Databricks Connect ل Python

إشعار

تتناول هذه المقالة Databricks Connect ل Databricks Runtime 13.3 LTS وما فوق.

تتناول هذه المقالة كيفية استخدام Databricks Connect ل Python مع Jupyter Notebook الكلاسيكي. يمكنك Databricks Connect من توصيل خوادم دفاتر الملاحظات الشائعة، وIDEs، والتطبيقات المخصصة الأخرى إلى مجموعات Azure Databricks. راجع ما هو Databricks Connect؟.

إشعار

قبل البدء في استخدام Databricks Connect، يجب عليك إعداد عميل Databricks Connect.

لاستخدام Databricks Connect مع Jupyter Notebook الكلاسيكي وPython، اتبع هذه الإرشادات.

  1. لتثبيت Jupyter Notebook الكلاسيكي، مع تنشيط بيئة Python الظاهرية، قم بتشغيل الأمر التالي من المحطة الطرفية أو موجه الأوامر:

    pip3 install notebook
    
  2. لبدء دفتر ملاحظات Jupyter الكلاسيكي في مستعرض الويب الخاص بك، قم بتشغيل الأمر التالي من بيئة Python الظاهرية التي تم تنشيطها:

    jupyter notebook
    

    إذا لم يظهر Jupyter Notebook الكلاسيكي في مستعرض الويب، فانسخ عنوان URL الذي يبدأ بالبيئة localhost الظاهرية أو 127.0.0.1 منها، وأدخله في شريط عناوين مستعرض الويب.

  3. إنشاء دفتر ملاحظات جديد: في Jupyter Notebook الكلاسيكي، على علامة التبويب ملفات ، انقر فوق New > Python 3 (ipykernel).

  4. في الخلية الأولى لدفتر الملاحظات، أدخل التعليمات البرمجية المثال أو التعليمات البرمجية الخاصة بك. إذا كنت تستخدم التعليمات البرمجية الخاصة بك، يجب على الأقل تهيئة DatabricksSession كما هو موضح في مثال التعليمات البرمجية.

  5. لتشغيل دفتر الملاحظات، انقر فوق تشغيل الخلية > الكل. يتم تشغيل جميع التعليمات البرمجية ل Python محليا، بينما يتم إرسال جميع التعليمات البرمجية PySpark التي تتضمن عمليات DataFrame على نظام المجموعة في مساحة عمل Azure Databricks البعيدة ويتم إرسال استجابات التشغيل مرة أخرى إلى المتصل المحلي.

  6. لتصحيح أخطاء دفتر الملاحظات، أضف السطر التالي من التعليمات البرمجية في بداية دفتر الملاحظات:

    from IPython.core.debugger import set_trace

    ثم استدع set_trace() لإدخال عبارات تتبع الأخطاء في تلك النقطة من تنفيذ دفتر الملاحظات. يتم تصحيح جميع التعليمات البرمجية ل Python محليا، بينما تستمر جميع التعليمات البرمجية PySpark في التشغيل على نظام المجموعة في مساحة عمل Azure Databricks البعيدة. لا يمكن تصحيح أخطاء التعليمات البرمجية لمحرك Spark الأساسي مباشرة من العميل.

  7. لإيقاف تشغيل Jupyter Notebook الكلاسيكي، انقر فوق إغلاق الملف > وإيقافه. إذا كانت عملية Jupyter Notebook الكلاسيكية لا تزال قيد التشغيل في المحطة الطرفية أو موجه الأوامر، فتوقف عن هذه العملية بالضغط Ctrl + c ثم الإدخال y للتأكيد.