تكوين مهام Databricks وتحريرها
تركز هذه المقالة على إرشادات إنشاء المهام وتكوينها وتحريرها باستخدام واجهة مستخدم مساحة عمل مهام سير العمل . يحتوي Azure Databricks على نقاط إدخال وأدوات أخرى للتكوين، بما في ذلك ما يلي:
- للتعرف على استخدام Databricks CLI لإنشاء الوظائف وتشغيلها، راجع ما هو Databricks CLI؟.
- للتعرف على استخدام واجهة برمجة تطبيقات الوظائف لإنشاء الوظائف وتشغيلها، راجع الوظائف في مرجع واجهة برمجة تطبيقات REST.
- لمعرفة كيفية تشغيل المهام وجدولتها مباشرة في دفتر ملاحظات Databricks، راجع إنشاء مهام دفتر الملاحظات المجدولة وإدارتها.
تلميح
لعرض وظيفة ك YAML، انقر فوق قائمة kebab إلى يسار Run now for the job ثم انقر فوق Switch to code version (YAML).
إنشاء مؤشر KPI جديد
يصف هذا القسم الحد الأدنى من التكوين اللازم لإنشاء مهمة جديدة لجدولة مهمة دفتر ملاحظات باستخدام واجهة مستخدم مساحة العمل.
تحتوي المهام على مهمة واحدة أو أكثر. يمكنك إنشاء مهمة جديدة عن طريق تكوين المهمة الأولى لتلك المهمة.
إشعار
يحتوي كل نوع مهمة على خيارات تكوين ديناميكية في واجهة مستخدم مساحة العمل. راجع تكوين مهام Databricks وتحريرها.
- انقر فوق مهام سير العمل في الشريط الجانبي وانقر فوق .
- أدخل اسم المهمة.
- حدد دفتر ملاحظات لحقل المسار .
- انقر فوق إنشاء مهمة.
إذا لم يتم تمكين مساحة العمل الخاصة بك للحوسبة بلا خادم للمهام، يجب تحديد خيار Compute . توصي Databricks دائما باستخدام حساب الوظائف عند تكوين المهام.
تظهر مهمة جديدة في قائمة مهام مساحة العمل بالاسم New Job <date> <time>
الافتراضي .
تحديد مهمة لتحريرها في مساحة العمل
لتحرير مهمة موجودة باستخدام واجهة مستخدم مساحة العمل، قم بما يلي:
- انقر فوق مهام سير العمل في الشريط الجانبي.
- في العمود الاسم ، انقر فوق اسم المهمة.
استخدم واجهة مستخدم المهام للقيام بما يلي:
- تحرير إعدادات المهمة
- إعادة تسمية مهمة أو استنساخها أو حذفها
- إضافة مهام جديدة إلى مهمة موجودة
- تحرير إعدادات المهمة
إشعار
يمكنك أيضا عرض تعريفات JSON للاستخدام مع REST API الحصول على نقاط النهاية وإنشاءها وإعادة تعيينها.
تحرير إعدادات المهمة
تحتوي اللوحة الجانبية على تفاصيل الوظيفة. يمكنك تغيير مشغل الوظيفة وتكوين الحساب والإعلامات والحد الأقصى لعدد عمليات التشغيل المتزامنة وتكوين حدود المدة وإضافة العلامات أو تغييرها. يمكنك أيضا تحرير أذونات الوظيفة إذا تم تمكين التحكم في الوصول إلى الوظيفة.
إضافة معلمات لكافة مهام الوظيفة
يتم تمرير المعلمات التي تم تكوينها على مستوى الوظيفة إلى مهام الوظيفة التي تقبل معلمات قيمة المفتاح، بما في ذلك ملفات عجلة Python المكونة لقبول وسيطات الكلمة الأساسية. راجع تحديد معلمات المهام.
إضافة علامات إلى وظيفة
لإضافة تسميات أو سمات قيمة المفتاح إلى وظيفتك، يمكنك إضافة علامات عند تحرير الوظيفة. يمكنك استخدام العلامات لتصفية المهام في قائمة المهام. على سبيل المثال، يمكنك استخدام علامة department
لتصفية كافة المهام التي تنتمي إلى قسم معين.
إشعار
نظرا لأن علامات الوظيفة غير مصممة لتخزين المعلومات الحساسة مثل معلومات التعريف الشخصية أو كلمات المرور، توصي Databricks باستخدام العلامات للقيم غير الحساسة فقط.
تنتشر العلامات أيضا إلى مجموعات الوظائف التي تم إنشاؤها عند تشغيل وظيفة، ما يسمح لك باستخدام العلامات مع مراقبة نظام المجموعة الحالية.
انقر فوق + علامة في اللوحة الجانبية تفاصيل المهمة لإضافة علامات أو تحريرها. يمكنك إضافة العلامة كتسمية أو زوج قيم المفاتيح. لإضافة تسمية، أدخل التسمية في حقل المفتاح واترك حقل القيمة فارغا.
إعادة تسمية مهمة أو استنساخها أو حذفها
لإعادة تسمية وظيفة، انتقل إلى واجهة مستخدم الوظائف وانقر فوق اسم الوظيفة.
يمكنك إنشاء وظيفة جديدة بسرعة عن طريق استنساخ وظيفة موجودة. يؤدي استنساخ وظيفة إلى إنشاء نسخة متطابقة من الوظيفة باستثناء معرف الوظيفة. لاستنساخ وظيفة، قم بما يلي:
- انتقل إلى واجهة مستخدم الوظائف للوظيفة.
- انقر إلى جانب الزر تشغيل الآن .
- حدد Clone job من القائمة المنسدلة.
- أدخل اسما للوظيفة المستنسخة.
- انقر Clone.
حذف مهمة
لحذف مهمة، انتقل إلى صفحة المهمة، وانقر فوق بجوار اسم المهمة، وحدد حذف مهمة من القائمة المنسدلة.
استخدام Git مع الوظائف
إذا كانت وظيفتك تحتوي على أي مهام تدعم استخدام موفر Git بعيد، فإن واجهة مستخدم الوظائف تحتوي على حقل Git وخيار إضافة إعدادات Git أو تحريرها.
يمكنك تكوين أنواع المهام التالية لاستخدام مستودع Git بعيد:
- دفاتر الملاحظات
- البرامج النصية ل Python
- ملفات SQL
- dbt
يجب أن تشير جميع المهام في الوظيفة إلى نفس التثبيت في المستودع البعيد. يجب تحديد واحد فقط مما يلي لوظيفة تستخدم مستودعا بعيدا:
- الفرع: اسم الفرع، على سبيل المثال،
main
. - العلامة: اسم العلامة، على سبيل المثال،
release-1.0.0
. - commit: تجزئة تثبيت معين، على سبيل المثال،
e0056d01
.
عند بدء تشغيل مهمة، يأخذ Databricks تثبيت لقطة للمستودع البعيد للتأكد من أن المهمة بأكملها تعمل مقابل نفس الإصدار من التعليمات البرمجية.
عند عرض محفوظات التشغيل لمهمة تقوم بتشغيل التعليمات البرمجية المخزنة في مستودع Git بعيد، تتضمن لوحة تفاصيل تشغيل المهمة تفاصيل Git، بما في ذلك الالتزام SHA المقترن بالتشغيل. راجع عرض محفوظات تشغيل المهمة.
إشعار
لا يمكن كتابة المهام التي تم تكوينها لاستخدام مستودع Git بعيد إلى ملفات مساحة العمل. يجب عليهم كتابة بيانات مؤقتة إلى تخزين برنامج التشغيل المؤقت والبيانات الثابتة إلى وحدة تخزين أو جدول.
توصي Databricks بإنشاء وظائف تشير إلى مسارات مساحة العمل في مجلدات Git فقط للتكرار السريع والاختبار أثناء التطوير. توصي Databricks بإعادة تكوين الوظائف للإشارة إلى مستودع Git البعيد أثناء الانتقال إلى التقسيم المرحلي والإنتاج. تعرف على المزيد حول التعليمات البرمجية المصدر التي يتحكم فيها الإصدار في مهمة Databricks.
تكوين موفر Git
تحتوي واجهة مستخدم الوظائف على مربع حوار لتكوين مستودع Git بعيد. يمكن الوصول إلى مربع الحوار هذا من لوحة Job details ضمن عنوان Git أو في أي مهمة تم تكوينها لاستخدام موفر Git.
تختلف الخيارات المعروضة للوصول إلى مربع الحوار استنادا إلى نوع المهمة وما إذا كان قد تم بالفعل تكوين مرجع git للوظيفة أم لا. تتضمن أزرار تشغيل مربع الحوار إضافة إعدادات Git أو تحرير أو إضافة مرجع git.
في مربع الحوار Git Information (المسمى فقط Git إذا كان الوصول بواسطة لوحة Job details )، أدخل التفاصيل التالية:
- عنوان URL لمستودع Git.
- حدد موفر Git الخاص بك من القائمة المنسدلة.
- في حقل مرجع Git، أدخل معرف فرع أو علامة أو تثبيت يتوافق مع إصدار التعليمات البرمجية المصدر الذي تريد تشغيله.
- حدد الفرع أو العلامة أو التثبيت من القائمة المنسدلة.
إشعار
قد يطالبك مربع الحوار بالآتي: بيانات اعتماد Git لهذا الحساب مفقودة. إضافة بيانات اعتماد. يجب تكوين مستودع Git بعيد قبل استخدامه كمرجع. راجع إعداد مجلدات Databricks Git (Repos).
تكوين وقت إكمال متوقع أو مهلة لوظيفة
يمكنك تكوين حدود المدة الاختيارية لوظيفة، بما في ذلك وقت الإكمال المتوقع والحد الأقصى. لتكوين حدود المدة، انقر فوق تعيين حدود المدة ضمن حدود المدة في لوحة تفاصيل المهمة.
أدخل مدة في حقل التحذير لتكوين وقت الإكمال المتوقع للوظيفة. إذا تجاوزت المهمة هذه العتبة، يتم تشغيل حدث. يمكنك استخدام هذا الحدث لإعلامك عند تشغيل وظيفة ببطء. راجع تكوين الإعلامات للوظائف البطيئة أو المتأخرة.
لتكوين الحد الأقصى لوقت الاكتمال لوظيفة ما، أدخل الحد الأقصى للمدة في حقل المهلة. إذا لم تكتمل المهمة في هذا الوقت، يقوم Azure Databricks بتعيين حالتها إلى "مهلة".
يمكنك اختياريا تحديد حدود المدة للمهام. راجع تكوين وقت إكمال متوقع أو مهلة لمهمة.