إعداد مجلدات Databricks Git (Repos)

تعرف على كيفية إعداد مجلدات Databricks Git (سابقا Repos) للتحكم في الإصدار. بمجرد إعداد مجلدات Git في Databricks، يمكنك تنفيذ عمليات Git الشائعة مثل النسخ والسحب والتثبيت والدفع والسحب وإدارة الفروع عليها من واجهة مستخدم Databricks. يمكنك أيضا رؤية التغييرات التي أجريتها أثناء التطوير باستخدام دفاتر الملاحظات والملفات في Databricks.

تكوين إعدادات المستخدم

تستخدم مجلدات Databricks Git رمز وصول شخصي (PAT) أو بيانات اعتماد مكافئة للمصادقة مع موفر Git الخاص بك لتنفيذ عمليات مثل النسخ والدفع والسحب وما إلى ذلك. لاستخدام مجلدات Git، يجب أولا إضافة اسم مستخدم Git PAT وموفر Git إلى Databricks. راجع تكوين بيانات اعتماد Git وتوصيل مستودع بعيد ب Azure Databricks.

يمكنك استنساخ المستودعات البعيدة العامة دون بيانات اعتماد Git (رمز مميز للوصول الشخصي واسم مستخدم). لتعديل مستودع بعيد عام أو استنساخ أو تعديل مستودع بعيد خاص، يجب أن يكون لديك اسم مستخدم موفر Git وأذونات PAT مع كتابة (أو أكبر) للمستودع البعيد.

يتم تمكين مجلدات Git بشكل افتراضي. لمزيد من التفاصيل حول تمكين دعم مجلد Git أو تعطيله، راجع تمكين ميزة مجلد Databricks Git أو تعطيلها.

إضافة بيانات اعتماد Git أو تحريرها في Databricks

هام

تدعم مجلدات Databricks Git بيانات اعتماد Git واحدة فقط لكل مستخدم، لكل مساحة عمل.

  1. حدد السهم لأسفل بجوار اسم الحساب في الجزء العلوي الأيسر من الشاشة، ثم حدد الإعدادات.

  2. حدد علامة التبويب الحسابات المرتبطة.

  3. إذا كنت تقوم بإضافة بيانات الاعتماد للمرة الأولى، فاتبع الإرشادات التي تظهر على الشاشة.

    إذا كنت قد أدخلت بيانات الاعتماد مسبقا، فانقر فوق تكوين>تحرير وانتقل إلى الخطوة التالية.

  4. في القائمة المنسدلة لموفر Git، حدد اسم الموفر.

  5. أدخل اسم مستخدم Git أو بريدك الإلكتروني.

  6. في حقل الرمز المميز ، أضف رمز وصول شخصي (PAT) أو بيانات اعتماد أخرى من موفر Git الخاص بك. للحصول على التفاصيل، راجع تكوين بيانات اعتماد Git وتوصيل مستودع بعيد ب Azure Databricks

    هام

    توصي Databricks بتعيين تاريخ انتهاء صلاحية لجميع الرموز المميزة للوصول الشخصي.

    بالنسبة إلى Azure DevOps، إذا لم تدخل رمزا مميزا أو كلمة مرور التطبيق، فإن تكامل Git يستخدم الرمز المميز لمعرف Microsoft Entra بشكل افتراضي. إذا أدخلت رمز وصول شخصي ل Azure DevOps، فسيستخدمه تكامل Git بدلا من ذلك. راجع الاتصال ب Azure DevOps repo باستخدام رمز مميز.

    إشعار

    بعد تحديث كلمة مرور Azure، أعد المصادقة باستخدام Azure Databricks إذا كنت بحاجة إلى المصادقة الجديدة للعمل على الفور. إذا لم تقم بإعادة المصادقة، فقد لا يتم التحقق من صحة اتصال Azure DevOps لمدة تصل إلى 24 ساعة.

    إذا كان لدى مؤسستك SAML SSO ممكن في GitHub، فخول رمز الوصول الشخصي الخاص بك لتسجيل الدخول الأحادي.

  7. أدخل اسم المستخدم الخاص بك في حقل اسم مستخدم موفر Git.

  8. انقر فوق حفظ.

يمكنك أيضا حفظ رمز Git PAT المميز واسم المستخدم إلى Azure Databricks باستخدام Databricks Repos API.

إذا كنت غير قادر على استنساخ المستودع وكنت تستخدم Azure DevOps مع مصادقة معرف Microsoft Entra، فشاهد مشكلة في نهج الوصول المشروط (CAP) لمعرف Microsoft Entra.

اتصال الشبكة بين مجلدات Databricks Git وموفر Git

تحتاج مجلدات Git إلى اتصال الشبكة بموفر Git الخاص بك للعمل. عادة ما يكون هذا عبر الإنترنت ويعمل خارج الصندوق. ومع ذلك، ربما قمت بإعداد قيود إضافية على موفر Git الخاص بك للتحكم في الوصول. على سبيل المثال، قد يكون لديك قائمة السماح ب IP في مكانها، أو قد تستضيف خادم Git المحلي الخاص بك باستخدام خدمات مثل GitHub Enterprise (GHE) أو Bitbucket Server (BBS) أو Gitlab Self-managed. اعتمادا على استضافة الشبكة وتكوينها، قد لا يمكن الوصول إلى خادم Git الخاص بك عبر الإنترنت.

إشعار

  • إذا كان خادم Git الخاص بك قابلا للوصول إلى الإنترنت ولكنه يحتوي على قائمة السماح IP في مكانها، مثل قوائم السماح GitHub، يجب إضافة عناوين IP NAT لمستوى التحكم في Azure Databricks إلى قائمة السماح ب IP لخادم Git. راجع مناطق Azure Databricks للحصول على قائمة بعناوين NAT IP لمستوى التحكم حسب المنطقة. استخدم IP للمنطقة التي توجد بها مساحة عمل Azure Databricks.
  • إذا كنت تستضيف خادم Git بشكل خاص، فاقرأ إعداد اتصال Git خاص لمجلدات Azure Databricks Git (Repos) أو اتصل بفريق حساب Azure Databricks للحصول على إرشادات الإعداد للوصول.

ميزات الأمان في مجلدات Git

تحتوي مجلدات Databricks Git على العديد من ميزات الأمان. ترشدك الأقسام التالية خلال الإعداد والاستخدام:

  • استخدام بيانات اعتماد Git المشفرة
  • قائمة السماح
  • التحكم بالوصول إلى مساحة العمل
  • تسجيل التدقيق
  • الكشف عن الأسرار

إحضار المفتاح الخاص بك: تشفير بيانات اعتماد Git

يمكنك استخدام Azure Key Vault لتشفير رمز الوصول الشخصي Git المميز (PAT) أو بيانات اعتماد Git الأخرى. يشار إلى استخدام مفتاح من خدمة تشفير على أنه مفتاح مدار من قبل العميل (CMK) أو إحضار المفتاح الخاص بك (BYOK).

لمزيد من المعلومات، راجع المفاتيح التي يديرها العميل للتشفير.

تقييد الاستخدام إلى عناوين URL في قائمة السماح

إذا كنت تستخدم معرف Microsoft Entra للمصادقة مع Azure DevOps، فإن قائمة السماح الافتراضية تقيد عناوين URL ل Git بما يلي:

  • dev.azure.com
  • visualstudio.com

بالنسبة إلى AAD مع الأسماء المستعارة المخصصة ل CNAMES أو Git URL، يمكن لمسؤول مساحة العمل تكوين قائمة السماح المخصصة كما هو موضح في الخطوات التالية. إذا كنت تستخدم قائمة السماح المخصصة، يحتاج مسؤول مساحة العمل إلى إضافة عناوين URL هذه إذا كنت تريد العمل معها: dev.azure.com و visualstudio.com.

يمكن لمسؤول مساحة العمل تحديد المستودعات البعيدة التي يمكن للمستخدمين النسخ منها والالتزام بها ودفعها. يساعد هذا في منع تسرب التعليمات البرمجية الخاصة بك؛ على سبيل المثال، لا يمكن للمستخدمين دفع التعليمات البرمجية إلى مستودع عشوائي إذا قمت بتشغيل قيود قائمة السماح. يمكنك أيضا منع المستخدمين من استخدام التعليمات البرمجية غير المرخصة عن طريق تقييد عملية النسخ إلى قائمة المستودعات المسموح بها.

لإعداد قائمة السماح:

  1. انتقل إلى صفحة الإعدادات.

  2. انقر فوق علامة التبويب مسؤول مساحة العمل (تكون مفتوحة بشكل افتراضي).

  3. في قسم Development ، اختر خيارا من Git URL السماح بإذن القائمة:

    • معطل (بدون قيود): لا توجد عمليات تحقق مقابل قائمة السماح.
    • تقييد النسخ والتثبيت والدفع إلى مستودعات Git المسموح بها: يسمح بعمليات الاستنساخ والتثبيت والدفع فقط لعناوين URL للمستودع في قائمة السماح.
    • تقييد التثبيت والدفع فقط إلى مستودعات Git المسموح بها: يسمح بعمليات التثبيت والدفع فقط لعناوين URL للمستودع في قائمة السماح. عمليات الاستنساخ والسحب غير مقيدة.

    جزء التطوير ضمن إعدادات المسؤول، المستخدم لتعيين وصول Git للمستخدم

  4. انقر فوق الزر Edit بجوار Git URL allow list: Empty list وأدخل قائمة مفصولة بفواصل من بادئات URL.

    الزر

  5. انقر فوق حفظ.

إشعار

  • تقوم القائمة التي تحفظها بالكتابة فوق المجموعة الموجودة من بادئات URL المحفوظة.
  • قد يستغرق سريان التغييرات ما يصل إلى 15 دقيقة.

السماح بالوصول إلى جميع المستودعات

لتعطيل قائمة السماح الموجودة والسماح بالوصول إلى جميع المستودعات:

  1. انتقل إلى صفحة الإعدادات.
  2. انقر فوق علامة التبويب مسؤول مساحة العمل.
  3. في قسم Development ، ضمن Git URL allow list permission: حدد Disable (no restrictions).

التحكم في الوصول إلى مستودع في مساحة العمل

إشعار

يتوفر التحكم في الوصول فقط في خطة Premium.

تعيين أذونات لم repo للتحكم في الوصول. تنطبق أذونات المستودع على جميع المحتويات في هذا المستودع. يمكنك تعيين خمسة مستويات أذونات للملفات: NO PERMISSIONS و CAN READ و CAN RUN و CAN EDIT و CAN MANAGE.

لمزيد من التفاصيل حول أذونات مجلد Git، راجع قوائم التحكم في الوصول لمجلد Git.

(اختياري) إعداد وكيل لخوادم Git للمؤسسات

إذا كانت شركتك تستخدم خدمة Git للمؤسسة المحلية، مثل GitHub Enterprise أو Azure DevOps Server، يمكنك استخدام وكيل Databricks Git Server لتوصيل مساحات عمل Databricks الخاصة بك بالمستودعات التي تخدمها.

تسجيل التدقيق

عند تمكين تسجيل التدقيق، يتم تسجيل أحداث التدقيق عند التفاعل مع مجلد Git. على سبيل المثال، يتم تسجيل حدث تدقيق عند إنشاء مجلد Git أو تحديثه أو حذفه، وعند سرد جميع مجلدات Git المقترنة بمساحة عمل، وعند مزامنة التغييرات بين مجلد Git ومجلد Git البعيد.

الكشف عن الأسرار

تفحص مجلدات Git التعليمات البرمجية بحثا عن معرفات مفتاح الوصول التي تبدأ بالبادئة AKIA وتحذر المستخدم قبل الالتزام.

استخدام ملف تكوين المستودع

يمكنك إضافة إعدادات لكل دفتر ملاحظات إلى المستودع في .databricks/commit_outputs ملف تقوم بإنشائه يدويا.

حدد دفتر الملاحظات الذي تريد تضمين المخرجات باستخدام أنماط مشابهة لأنماط gitignore.

أنماط لملف تكوين المستودع

يحتوي الملف على أنماط مسار ملف إيجابية وسالبة. تتضمن أنماط مسار الملف ملحق ملف دفتر الملاحظات مثل .ipynb.

  • تمكن الأنماط الموجبة تضمين المخرجات لدفاتر الملاحظات المطابقة.
  • تعطل الأنماط السالبة تضمين المخرجات لدفاتر الملاحظات المطابقة.

يتم تقييم الأنماط من أجل جميع دفاتر الملاحظات. يتم تجاهل المسارات أو المسارات غير الصالحة التي لا يتم حلها إلى .ipynb دفاتر الملاحظات.

لتضمين المخرجات من مسار folder/innerfolder/notebook.ipynbدفتر ملاحظات، استخدم الأنماط التالية:

**/*
folder/**
folder/innerfolder/note*

لاستبعاد مخرجات دفتر ملاحظات، تحقق من عدم تطابق أي من الأنماط الموجبة أو إضافة نمط سالب في موضع صحيح من ملف التكوين. تبدأ الأنماط السالبة (الاستبعاد) ب !:

!folder/innerfolder/*.ipynb
!folder/**/*.ipynb
!**/notebook.ipynb

نقل مجلد Git إلى سلة المهملات (حذف)

لحذف مجلد Git من مساحة العمل الخاصة بك:

  1. انقر بزر الماوس الأيمن فوق مجلد Git، ثم حدد نقل إلى سلة المهملات.

  2. في مربع الحوار، اكتب اسم مجلد Git الذي تريد حذفه. ثم انقر فوق تأكيد الانتقال إلى سلة المهملات.

    تأكيد مربع الحوار نقل إلى سلة المهملات.

الخطوات التالية