تشغيل وظيفة Azure Databricks باستخدام حساب بلا خادم لسير العمل

هام

نظرا لأن الحوسبة بلا خادم لسير العمل لا تدعم التحكم في حركة الخروج، فإن وظائفك تتمتع بالوصول الكامل إلى الإنترنت.

يسمح لك الحساب بلا خادم لسير العمل بتشغيل وظيفة Azure Databricks دون تكوين البنية الأساسية ونشرها. باستخدام الحوسبة بلا خادم، يمكنك التركيز على تنفيذ مسارات معالجة البيانات وتحليلها، وتدير Azure Databricks موارد الحوسبة بكفاءة، بما في ذلك تحسين الحوسبة وتحجيمها لأحمال العمل الخاصة بك. يتم تمكين التحجيم التلقائي والفوتون تلقائيا لموارد الحوسبة التي تشغل وظيفتك.

تعمل الحوسبة بلا خادم للتحسين التلقائي لسير العمل تلقائيا على تحسين الحوسبة عن طريق تحديد الموارد المناسبة مثل أنواع المثيلات والذاكرة ومحركات المعالجة استنادا إلى حمل العمل الخاص بك. يقوم التحسين التلقائي أيضا بإعادة محاولة المهام الفاشلة تلقائيا.

يقوم Databricks تلقائيا بترقية إصدار Databricks Runtime لدعم التحسينات والترقيات إلى النظام الأساسي مع ضمان استقرار وظائف Azure Databricks. لمشاهدة إصدار وقت تشغيل Databricks الحالي المستخدم بواسطة الحوسبة بلا خادم لسير العمل، راجع ملاحظات إصدار الحوسبة بلا خادم.

نظرا لأن إذن إنشاء نظام المجموعة غير مطلوب، يمكن لجميع مستخدمي مساحة العمل استخدام الحوسبة بلا خادم لتشغيل مهام سير العمل الخاصة بهم.

توضح هذه المقالة استخدام واجهة مستخدم وظائف Azure Databricks لإنشاء وتشغيل المهام التي تستخدم الحوسبة بلا خادم. يمكنك أيضا أتمتة إنشاء الوظائف وتشغيلها التي تستخدم حساب بلا خادم مع واجهة برمجة تطبيقات الوظائف وحزم أصول Databricks وDatabricks SDK ل Python.

  • للتعرف على استخدام واجهة برمجة تطبيقات الوظائف لإنشاء الوظائف التي تستخدم الحوسبة بلا خادم وتشغيلها، راجع الوظائف في مرجع واجهة برمجة تطبيقات REST.
  • للتعرف على استخدام حزم أصول Databricks لإنشاء وتشغيل المهام التي تستخدم الحوسبة بلا خادم، راجع تطوير وظيفة على Azure Databricks باستخدام حزم أصول Databricks.
  • للتعرف على استخدام Databricks SDK ل Python لإنشاء وتشغيل المهام التي تستخدم الحوسبة بلا خادم، راجع Databricks SDK ل Python.

المتطلبات

  • يجب تمكين كتالوج Unity لمساحة عمل Azure Databricks.

  • نظرا لأن الحوسبة بلا خادم لسير العمل تستخدم وضع الوصول المشترك، يجب أن تدعم أحمال العمل وضع الوصول هذا.

  • يجب أن تكون مساحة عمل Azure Databricks في منطقة مدعومة. راجع توفر الميزة.

  • يجب تمكين حساب Azure Databricks الخاص بك بدون خادم. راجع تمكين الحوسبة بلا خادم.

إنشاء مهمة باستخدام الحوسبة بلا خادم

إشعار

نظرا لأن الحوسبة بلا خادم لسير العمل تضمن توفير موارد كافية لتشغيل أحمال العمل الخاصة بك، فقد تواجه أوقات بدء تشغيل متزايدة عند تشغيل مهمة Azure Databricks التي تتطلب كميات كبيرة من الذاكرة أو تتضمن العديد من المهام.

يتم دعم الحوسبة بلا خادم مع دفتر الملاحظات، والبرنامج النصي Python، وdbt، وأنواع مهام عجلة Python. بشكل افتراضي، يتم تحديد الحوسبة بلا خادم كنوع حساب عند إنشاء مهمة جديدة وإضافة أحد أنواع المهام المدعومة هذه.

إنشاء مهمة بلا خادم

توصي Databricks باستخدام حساب بلا خادم لجميع مهام الوظيفة. يمكنك أيضا تحديد أنواع حوسبة مختلفة للمهام في وظيفة، والتي قد تكون مطلوبة إذا لم يكن نوع المهمة مدعوما بواسطة حساب بلا خادم لسير العمل.

تكوين مهمة موجودة لاستخدام الحوسبة بلا خادم

يمكنك تبديل مهمة موجودة لاستخدام الحوسبة بلا خادم أنواع المهام المدعومة عند تحرير المهمة. للتبديل إلى الحوسبة بلا خادم، إما:

  • في اللوحة الجانبية تفاصيل المهمة، انقر فوق تبديل ضمن حساب، وانقر فوق جديد، وأدخل أي إعدادات أو حدثها، وانقر فوق تحديث.
  • انقر في علامة الإقهار لأسفل القائمة المنسدلة Compute وحدد Serverless.

تبديل المهمة إلى حساب بلا خادم

جدولة دفتر ملاحظات باستخدام حساب بلا خادم

بالإضافة إلى استخدام واجهة مستخدم الوظائف لإنشاء وظيفة وجدولتها باستخدام حساب بلا خادم، يمكنك إنشاء وتشغيل وظيفة تستخدم حساب بلا خادم مباشرة من دفتر ملاحظات Databricks. راجع إنشاء مهام دفتر الملاحظات المجدولة وإدارتها.

تعيين معلمات تكوين Spark

لأتمتة تكوين Spark على الحوسبة بلا خادم، يسمح Databricks بتعيين معلمات تكوين Spark محددة فقط. للحصول على قائمة المعلمات المسموح بها، راجع معلمات تكوين Spark المدعومة.

يمكنك تعيين معلمات تكوين Spark على مستوى الجلسة فقط. للقيام بذلك، قم بتعيينها في دفتر ملاحظات وإضافة دفتر الملاحظات إلى مهمة مضمنة في نفس المهمة التي تستخدم المعلمات. راجع الحصول على خصائص تكوين Apache Spark وتعيينها في دفتر ملاحظات.

تكوين البيئات والتبعيات

لمعرفة كيفية تثبيت libaries والتبعيات باستخدام الحوسبة بلا خادم، راجع تثبيت تبعيات دفتر الملاحظات.

تكوين التحسين التلقائي للحساب بلا خادم لعدم السماح بإعادة المحاولة

يعمل الحوسبة بلا خادم لسير العمل على تحسين الحوسبة المستخدمة لتشغيل مهامك تلقائيا وإعادة محاولة المهام الفاشلة. يتم تمكين التحسين التلقائي بشكل افتراضي، وتوصي Databricks بتركها ممكنة لضمان تشغيل أحمال العمل الهامة بنجاح مرة واحدة على الأقل. ومع ذلك، إذا كان لديك أحمال عمل يجب تنفيذها مرة واحدة على الأكثر، على سبيل المثال، الوظائف غير المتكررة، يمكنك إيقاف تشغيل التحسين التلقائي عند إضافة مهمة أو تحريرها:

  1. إلى جانب عمليات إعادة المحاولة، انقر فوق إضافة (أو أيقونة إذا كان نهج إعادة المحاولة موجودا بالفعل).
  2. في مربع الحوار نهج إعادة المحاولة ، قم بإلغاء تحديد تمكين التحسين التلقائي بلا خادم (قد يتضمن إعادة محاولة إضافية).
  3. انقر فوق تأكيد.
  4. إذا كنت تقوم بإضافة مهمة، فانقر فوق إنشاء مهمة. إذا كنت تقوم بتحرير مهمة، فانقر فوق حفظ المهمة.

مراقبة تكلفة المهام التي تستخدم الحوسبة بلا خادم لسير العمل

يمكنك مراقبة تكلفة المهام التي تستخدم الحوسبة بلا خادم لسير العمل عن طريق الاستعلام عن جدول نظام الاستخدام القابل للفوترة. يتم تحديث هذا الجدول لتضمين سمات المستخدم وأحمال العمل حول التكاليف بلا خادم. راجع مرجع جدول نظام الاستخدام القابل للفوترة.

عرض تفاصيل استعلامات Spark

يحتوي الحساب بلا خادم لسير العمل على واجهة جديدة لعرض معلومات وقت التشغيل التفصيلية لعبارات Spark، مثل المقاييس وخطط الاستعلام. لعرض رؤى الاستعلام لعبارات Spark المضمنة في مهامك، قم بتشغيل على حساب بلا خادم:

  1. انقر فوق أيقونة مهام سير العمل مهام سير العمل في الشريط الجانبي.
  2. في العمود الاسم ، انقر فوق اسم الوظيفة الذي تريد عرض نتائج التحليلات له.
  3. انقر فوق التشغيل المحدد الذي تريد عرض نتائج التحليلات له.
  4. في قسم Compute من اللوحة الجانبية Task run، انقر فوق Query history.
  5. تتم إعادة توجيهك إلى "محفوظات الاستعلام"، تتم التصفية مسبقا استنادا إلى معرف تشغيل المهمة للمهمة التي كنت فيها.

للحصول على معلومات حول استخدام محفوظات الاستعلام، راجع محفوظات الاستعلام.

القيود

للحصول على قائمة بالحوسبة بلا خادم لقيود سير العمل، راجع قيود الحوسبة بلا خادم في ملاحظات إصدار الحوسبة بلا خادم.