ما هي ملفات مساحة العمل؟

ملف مساحة العمل هو أي ملف في مساحة عمل Azure Databricks ليس دفتر ملاحظات Databricks. يمكن أن تكون ملفات مساحة العمل أي نوع ملف. تتضمن الأمثلة الشائعة:

  • .py الملفات المستخدمة في الوحدات النمطية المخصصة.
  • .md الملفات، مثل README.md.
  • .csv أو ملفات بيانات صغيرة أخرى.
  • .txt الملفات.
  • .whl المكتبات.
  • ملفات السجل.

تتضمن ملفات مساحة العمل ملفات يشار إليها سابقا باسم "الملفات في Repos".

هام

يتم تمكين ملفات مساحة العمل في كل مكان بشكل افتراضي في Databricks Runtime الإصدار 11.2، ولكن يمكن تعطيلها من قبل المسؤولين الذين يستخدمون واجهة برمجة تطبيقات REST. بالنسبة لأحمال عمل الإنتاج، استخدم Databricks Runtime 11.3 LTS أو أعلى. اتصل بمسؤول مساحة العمل إذا لم تتمكن من الوصول إلى هذه الوظيفة.

ما يمكنك القيام به مع ملفات مساحة العمل

يوفر Azure Databricks وظائف مشابهة للتطوير المحلي للعديد من أنواع ملفات مساحة العمل، بما في ذلك محرر ملفات مضمن. لا يتم دعم جميع حالات الاستخدام لكافة أنواع الملفات. على سبيل المثال، بينما يمكنك تضمين الصور في دليل أو مستودع مستورد، لا يمكنك تضمين الصور في دفاتر الملاحظات.

يمكنك إنشاء الوصول إلى ملفات مساحة العمل وتحريره وإدارته باستخدام أنماط مألوفة من تفاعلات دفتر الملاحظات. يمكنك استخدام مسارات نسبية لاستيراد المكتبة من ملفات مساحة العمل، على غرار التطوير المحلي. لمزيد من التفاصيل، راجع:

البرامج النصية Init المخزنة في ملفات مساحة العمل لها سلوك خاص. يمكنك استخدام ملفات مساحة العمل لتخزين البرامج النصية init والإشارة إليها في أي إصدارات Databricks Runtime. راجع تخزين البرامج النصية init في ملفات مساحة العمل.

إشعار

في Databricks Runtime 14.0 والإصدارات الأحدث، الدليل الافتراضي للعمل الحالي (CWD) للتعليمات البرمجية المنفذة محليا هو الدليل الذي يحتوي على دفتر الملاحظات أو البرنامج النصي قيد التشغيل. هذا تغيير في السلوك من Databricks Runtime 13.3 LTS وما يلي. راجع ما هو دليل العمل الحالي الافتراضي؟.

القيود

تم العثور على قائمة كاملة بقيود ملفات مساحة العمل في قيود ملفات مساحة العمل.

حد حجم الملف

تقتصر ملفات مساحة العمل الفردية على 500 ميغابايت.

يمكن للمستخدمين تحميل أحجام ملفات تصل إلى 500 ميغابايت من واجهة المستخدم. الحد الأقصى لحجم الملف المسموح به عند الكتابة من نظام مجموعة هو 256 ميغابايت.

إصدارات وقت تشغيل Databricks للملفات في مجلدات Git مع نظام مجموعة مع Azure Databricks Container Services

على المجموعات التي تقوم بتشغيل Databricks Runtime 11.3 LTS وما فوق، تسمح لك الإعدادات الافتراضية باستخدام ملفات مساحة العمل في مجلدات Git مع Azure Databricks Container Services (DCS).

على أنظمة المجموعات التي تعمل بإصدارات وقت تشغيل Databricks 10.4 LTS و9.1 LTS، يجب تكوين dockerfile للوصول إلى ملفات مساحة العمل في مجلدات Git على نظام مجموعة مع DCS. راجع dockerfiles التالية لإصدار Databricks Runtime المطلوب:

راجع تخصيص الحاويات باستخدام Databricks Container Service

تمكين ملفات مساحة العمل

لتمكين دعم الملفات غير المتصلة بدفتر الملاحظات في مساحة عمل Databricks، اتصل بواجهة برمجة تطبيقات /api/2.0/workspace-conf REST من دفتر ملاحظات أو بيئة أخرى مع إمكانية الوصول إلى مساحة عمل Databricks. يتم تمكين ملفات مساحة العمل بشكل افتراضي.

لتمكين أو إعادة تمكين الدعم للملفات غير المتصلة بدفتر الملاحظات في مساحة عمل Databricks، قم باستدعاء /api/2.0/workspace-conf والحصول على قيمة enableWorkspaceFileSystem المفتاح. إذا تم تعيينه إلى true، يتم تمكين الملفات غير الموجودة في دفتر الملاحظات بالفعل لمساحة العمل الخاصة بك.

يوضح المثال التالي كيف يمكنك استدعاء واجهة برمجة التطبيقات هذه من دفتر ملاحظات للتحقق مما إذا كانت ملفات مساحة العمل معطلة وإذا كان الأمر كذلك، فقم بإعادة تمكينها.

مثال: دفتر ملاحظات لإعادة تمكين دعم ملف مساحة عمل Databricks

الحصول على دفتر الملاحظات