استكشاف أخطاء Databricks Connect ل Python وإصلاحها
إشعار
تتناول هذه المقالة Databricks Connect ل Databricks Runtime 13.3 LTS وما فوق.
توفر هذه المقالة معلومات استكشاف الأخطاء وإصلاحها ل Databricks Connect ل Python. يمكنك Databricks Connect من توصيل IDEs الشائعة وخوادم دفاتر الملاحظات والتطبيقات المخصصة إلى مجموعات Azure Databricks. راجع ما هو Databricks Connect؟. للحصول على إصدار Scala من هذه المقالة، راجع استكشاف أخطاء Databricks Connect ل Scala وإصلاحها.
خطأ: StatusCode.UNAVAILABLE أو StatusCode.UNKNOWN أو DNS resolution failed أو Received http2 header with status 500
المشكلة: عند محاولة تشغيل التعليمات البرمجية باستخدام Databricks Connect، تتلقى رسائل خطأ تحتوي على سلاسل مثل StatusCode.UNAVAILABLE
أو StatusCode.UNKNOWN
DNS resolution failed
أو أو Received http2 header with status: 500
.
السبب المحتمل: لا يمكن ل Databricks Connect الوصول إلى مجموعتك.
الحلول الموصى بها:
- تحقق للتأكد من صحة اسم مثيل مساحة العمل. إذا كنت تستخدم متغيرات البيئة، فتحقق للتأكد من أن متغير البيئة ذي الصلة متاح وصحيح على جهاز التطوير المحلي.
- تحقق للتأكد من صحة معرف نظام المجموعة. إذا كنت تستخدم متغيرات البيئة، فتحقق للتأكد من أن متغير البيئة ذي الصلة متاح وصحيح على جهاز التطوير المحلي.
- تحقق للتأكد من أن مجموعتك تحتوي على إصدار نظام المجموعة المخصص الصحيح المتوافق مع Databricks Connect.
عدم تطابق إصدار Python
تحقق من أن إصدار Python الذي تستخدمه محليا يحتوي على نفس الإصدار الثانوي على الأقل مثل الإصدار على نظام المجموعة (على سبيل المثال، 3.10.11
مقابل 3.10.10
موافق، 3.10
مقابل 3.9
ليس كذلك).
إذا كان لديك إصدارات Python متعددة مثبتة محليا، فتأكد من أن Databricks Connect يستخدم الإصدار الصحيح عن طريق تعيين PYSPARK_PYTHON
متغير البيئة (على سبيل المثال، PYSPARK_PYTHON=python3
).
عمليات تثبيت PySpark المتعارضة
databricks-connect
تتعارض الحزمة مع PySpark. سيؤدي تثبيت كليهما إلى حدوث أخطاء عند تهيئة سياق Spark في Python. يمكن أن يظهر هذا بعدة طرق، بما في ذلك أخطاء "البث التالفة" أو "لم يتم العثور على الفئة". إذا كان لديك PySpark مثبت في بيئة Python الخاصة بك، فتأكد من إلغاء تثبيته قبل تثبيت databricks-connect. بعد إلغاء تثبيت PySpark، تأكد من إعادة تثبيت حزمة Databricks Connect بشكل كامل:
pip3 uninstall pyspark
pip3 uninstall databricks-connect
pip3 install --upgrade "databricks-connect==14.0.*" # or X.Y.* to match your specific cluster version.
إدخال متعارض أو مفقود PATH
للثنائيات
من الممكن تكوين PATH الخاص بك بحيث تقوم الأوامر مثل spark-shell
بتشغيل بعض الأوامر الثنائية الأخرى المثبتة مسبقا بدلا من تلك المتوفرة مع Databricks Connect. يجب التأكد من أن ثنائيات Databricks Connect لها الأسبقية، أو إزالة الثنائيات المثبتة مسبقا.
إذا لم تتمكن من تشغيل أوامر مثل spark-shell
، فمن المحتمل أيضا أنه لم يتم إعداد PATH تلقائيا بواسطة pip3 install
وستحتاج إلى إضافة وقت التثبيت bin
إلى PATH يدويا. من الممكن استخدام Databricks Connect مع IDEs حتى إذا لم يتم إعداد هذا.
اسم الملف أو اسم الدليل أو بناء جملة تسمية وحدة التخزين غير صحيح على Windows
إذا كنت تستخدم Databricks Connect على Windows وشاهد:
The filename, directory name, or volume label syntax is incorrect.
تم تثبيت Databricks Connect في دليل به مسافة في المسار الخاص بك. يمكنك حل هذه المشكلة إما عن طريق التثبيت في مسار دليل بدون مسافات، أو تكوين المسار باستخدام نموذج الاسم القصير.