ماذا حدث ل Databricks Repos؟

قامت Azure Databricks بطرح عناصر واجهة مستخدم جديدة تسمح للمستخدمين بالعمل مباشرة مع مجلدات Git المدعومة من واجهة مستخدم مساحة العمل، ما يحل بشكل فعال محل وظيفة ميزة "Repos" السابقة المنفصلة.

ماذا يعني هذا التغيير بالنسبة لي؟

إذا كنت مستخدما لميزة Databricks Repos للتحكم في مصدر أصول المشروع المستند إلى إصدار مشترك من Git، فلن تتغير الوظيفة الأساسية. الفرق الأكثر بروزا هو أن العديد من عمليات واجهة المستخدم السياقية تشير الآن إلى "مجلدات Git" بدلا من "Repos".

على سبيل المثال، يمكن إنشاء مجلد Databricks مدعوم ب Git repo عن طريق تحديد New ثم Repo من واجهة المستخدم:

خيار القائمة

الآن، حدد جديد واختر مجلد Git. نفس الشيء، اسم مختلف!

يطلب منك خيار القائمة

يوفر هذا التغيير بعض التحسينات التي تبسط العمل مع المجلدات التي يتم التحكم فيها بالإصدار:

  1. تنظيم المجلدات بشكل أفضل: يمكن إنشاء مجلدات Git على أي مستوى من شجرة ملفات مساحة العمل، مما يسمح لك بتنظيم مجلدات Git الخاصة بك بطريقة تناسب مشروعك بشكل أفضل. على سبيل المثال، يمكنك إنشاء مجلدات Git في /Workspace/Users/<user email>/level_1/level_2/level_3/<Git folder name>. يمكن إنشاء Repos فقط على مستوى دليل ثابت، مثل جذر مجلد مستخدم Repos مثل /Workspace/Repos/<user email>/<Repo name>.
    • ملاحظة: يمكن أن تحتوي مجلدات Git على أصول أخرى غير معتمدة من قبل Repos اليوم أو مجمعة معها. يمكن نقل أنواع الأصول غير المدعومة مثل أصول DBSQL وتجارب MLflow إلى مجلدات Git. ستتم إضافة دعم التسلسل للأصول الإضافية بمرور الوقت.
  2. سلوكيات واجهة المستخدم المبسطة: يجلب هذا التغيير تفاعلا شائعا لمساحة العمل - العمل مع Git - مباشرة في مساحة عمل Databricks، ويقلل من الوقت المستغرق في التنقل بين مساحة العمل ومجلدات Git التي يتحكم فيها الإصدار.

ما الذي تغير، على وجه التحديد؟

  1. يمكن إنشاء مجلدات Git خارج /Repos الدليل.
  2. يتم إنشاء مجلدات Git عن طريق تحديد مجلد Git جديد>في مساحة عمل Databricks. يؤدي هذا إلى إنشاء مجلد Git جديد ضمن /Workspace/Users/<user-email>/.
  3. يمكن إنشاء مجلدات Git في أعماق مختلفة من شجرة ملفات مساحة العمل طالما أنها تحت /Workspace/Users/<user-email>. على سبيل المثال، يمكنك إنشاء مجلدات Git في /Workspace/Users/<user-email>/level_1/level_2/level_3/<git-folder-name>. يمكنك الحصول على مجلدات Git متعددة ضمن /Workspace/Users/<user-email>.
  4. يسمح بالأصول غير المدعومة في مجلدات Git. ستتم إضافة دعم التسلسل إلى أنواع الأصول الأخرى بمرور الوقت.
  5. على عكس Repos، لا يمكنك إنشاء مجلد Git جديد في Databricks بدون عنوان URL للمستودع البعيد.

التفاصيل الإضافية

لن تزول المستودعات الموجودة التي أنشأها المستخدمون. لا يطلب من المستخدمين ترحيل Repos الموجودة إلى مجلدات Git. تم دمج المستودعات في واجهة مستخدم مساحة العمل ولم تعد تجربة منفصلة من المستوى الأعلى في واجهة المستخدم.

  • ستستمر المراجع الموجودة /Repos في العمل: jobs، dbutils.notebook.run%run وستستمر المراجع التي تستخدم دفاتر الملاحظات الموجودة ضمن /Repos المسارات في العمل.
  • سيتم تحويل المجلد الموجود /Repos إلى مجلد عادي ضمن /Workspace ك /Workspace/Repos، وقد تتم إزالة أي معالجة خاصة. في حالات نادرة، قد تحتاج إلى إجراء بعض التعديل في مساحة العمل الخاصة بك لإعادة التوجيه هذه للعمل. لمزيد من التفاصيل، راجع مراجع كائنات مساحة العمل.

توصي Databricks بأن يقوم المستخدمون بإنشاء مجلدات Git جديدة بدلا من Repos إذا كانوا بحاجة إلى الاتصال بالتحكم في مصدر Git من مساحة عمل Databricks. يجعل تجميع مستودعات Git وأصول مساحة العمل الأخرى مجلدات Git أكثر قابلية للاكتشاف وأسهل في الإدارة من Repos.

أذونات مجلد Git تحتوي مجلدات Git على نفس أذونات مجلد مساحة العمل مثل مجلدات مساحة العمل الأخرى. يجب أن يكون لدى CAN_MANAGE المستخدمين الإذن لتنفيذ معظم عمليات Git.

ما هو DBR الذي يجب أن أستخدمه لتشغيل التعليمات البرمجية في مجلدات Git؟

لتنفيذ التعليمات البرمجية المتسقة بين مجلدات Git ومستودعات القديمة، توصي Databricks المستخدمين بتشغيل التعليمات البرمجية فقط في مجلدات Git مع DBR 15+.

سلوك دليل العمل الحالي (CWD)

يسمح الإصدار 14 أو أحدث من Databricks Runtime (DBR) باستخدام المسارات النسبية ويوفر نفس تجربة دليل العمل الحالي (CWD) لجميع دفاتر الملاحظات، حيث تقوم بتشغيل دفتر الملاحظات من دليل العمل الحالي. قد تكون سلوكيات دليل العمل الحالي (CWD) غير متسقة بين دفاتر الملاحظات في مجلد Git ومجلد غير Git للإصدارات القديمة من Databricks Runtime (DBR).

سلوك مسار Python sys.path

يوفر الإصدار 14.3 أو أحدث من Databricks Runtime (DBR) السلوك نفسه sys.path في مجلدات Git كما هو الحال في Repos القديمة. مع إصدارات DBR السابقة، يختلف سلوك مجلد Git عن Repos القديم حيث لا تتم إضافة دليل المستودع الجذر تلقائيا إلى sys.path لمجلدات Git. بالنسبة إلى Python، sys.path يحتوي على قائمة بالدلائل التي يبحث عنها المترجم عند استيراد الوحدات النمطية. إذا لم تتمكن من استخدام DBR 15 أو أعلى، يمكنك إلحاق مسار sys.path مجلد يدويا كحل بديل.

للحصول على أمثلة حول كيفية إضافة دلائل إلى sys.path استخدام المسارات النسبية، راجع استيراد وحدات Python وR النمطية.

أسبقية مكتبة Python

يوفر الإصدار 14.3 أو أحدث من Databricks Runtime (DBR) نفس أسبقية مكتبة python في مجلدات Git كما هو الحال في Repos القديمة.