استكشاف أخطاء Databricks Connect ل Python وإصلاحها

إشعار

تتناول هذه المقالة Databricks Connect ل Databricks Runtime 13.3 LTS وما فوق.

توفر هذه المقالة معلومات استكشاف الأخطاء وإصلاحها ل Databricks Connect ل Python. يمكنك Databricks Connect من توصيل IDEs الشائعة وخوادم دفاتر الملاحظات والتطبيقات المخصصة إلى مجموعات Azure Databricks. راجع ما هو Databricks Connect؟. للحصول على إصدار Scala من هذه المقالة، راجع استكشاف أخطاء Databricks Connect ل Scala وإصلاحها.

خطأ: StatusCode.UNAVAILABLE أو StatusCode.UNKNOWN أو DNS resolution failed أو Received http2 header with status 500

المشكلة: عند محاولة تشغيل التعليمات البرمجية باستخدام Databricks Connect، تتلقى رسائل خطأ تحتوي على سلاسل مثل StatusCode.UNAVAILABLEأو StatusCode.UNKNOWNDNS resolution failedأو أو Received http2 header with status: 500.

السبب المحتمل: لا يمكن ل Databricks Connect الوصول إلى مجموعتك.

الحلول الموصى بها:

  • تحقق للتأكد من صحة اسم مثيل مساحة العمل. إذا كنت تستخدم متغيرات البيئة، فتحقق للتأكد من أن متغير البيئة ذي الصلة متاح وصحيح على جهاز التطوير المحلي.
  • تحقق للتأكد من صحة معرف نظام المجموعة. إذا كنت تستخدم متغيرات البيئة، فتحقق للتأكد من أن متغير البيئة ذي الصلة متاح وصحيح على جهاز التطوير المحلي.
  • تحقق للتأكد من أن مجموعتك تحتوي على إصدار نظام المجموعة المخصص الصحيح المتوافق مع Databricks Connect.

عدم تطابق إصدار Python

تحقق من أن إصدار Python الذي تستخدمه محليا يحتوي على نفس الإصدار الثانوي على الأقل مثل الإصدار على نظام المجموعة (على سبيل المثال، 3.10.11 مقابل 3.10.10 موافق، 3.10 مقابل 3.9 ليس كذلك).

إذا كان لديك إصدارات Python متعددة مثبتة محليا، فتأكد من أن Databricks Connect يستخدم الإصدار الصحيح عن طريق تعيين PYSPARK_PYTHON متغير البيئة (على سبيل المثال، PYSPARK_PYTHON=python3).

عمليات تثبيت PySpark المتعارضة

databricks-connect تتعارض الحزمة مع PySpark. سيؤدي تثبيت كليهما إلى حدوث أخطاء عند تهيئة سياق Spark في Python. يمكن أن يظهر هذا بعدة طرق، بما في ذلك أخطاء "البث التالفة" أو "لم يتم العثور على الفئة". إذا كان لديك PySpark مثبت في بيئة Python الخاصة بك، فتأكد من إلغاء تثبيته قبل تثبيت databricks-connect. بعد إلغاء تثبيت PySpark، تأكد من إعادة تثبيت حزمة Databricks Connect بشكل كامل:

pip3 uninstall pyspark
pip3 uninstall databricks-connect
pip3 install --upgrade "databricks-connect==14.0.*"  # or X.Y.* to match your specific cluster version.

إدخال متعارض أو مفقود PATH للثنائيات

من الممكن تكوين PATH الخاص بك بحيث تقوم الأوامر مثل spark-shell بتشغيل بعض الأوامر الثنائية الأخرى المثبتة مسبقا بدلا من تلك المتوفرة مع Databricks Connect. يجب التأكد من أن ثنائيات Databricks Connect لها الأسبقية، أو إزالة الثنائيات المثبتة مسبقا.

إذا لم تتمكن من تشغيل أوامر مثل spark-shell، فمن المحتمل أيضا أنه لم يتم إعداد PATH تلقائيا بواسطة pip3 install وستحتاج إلى إضافة وقت التثبيت bin إلى PATH يدويا. من الممكن استخدام Databricks Connect مع IDEs حتى إذا لم يتم إعداد هذا.

اسم الملف أو اسم الدليل أو بناء جملة تسمية وحدة التخزين غير صحيح على Windows

إذا كنت تستخدم Databricks Connect على Windows وشاهد:

The filename, directory name, or volume label syntax is incorrect.

تم تثبيت Databricks Connect في دليل به مسافة في المسار الخاص بك. يمكنك حل هذه المشكلة إما عن طريق التثبيت في مسار دليل بدون مسافات، أو تكوين المسار باستخدام نموذج الاسم القصير.