مشاركة عبر


وقت تشغيل Databricks التعلم الآلي

يعمل Databricks Runtime for التعلم الآلي (Databricks Runtime ML) على أتمتة إنشاء نظام مجموعة مع بنية أساسية للتعلم الآلي والتعلم العميق تم إنشاؤها مسبقا بما في ذلك مكتبات التعلم الآلي وDL الأكثر شيوعا. للحصول على القائمة الكاملة للمكتبات في كل إصدار من Databricks Runtime ML، راجع ملاحظات الإصدار.

إشعار

للوصول إلى البيانات في كتالوج Unity لسير عمل التعلم الآلي، يجب أن يكون وضع الوصول لنظام المجموعة مستخدما واحدا (معينا). المجموعات المشتركة غير متوافقة مع وقت تشغيل Databricks التعلم الآلي. بالإضافة إلى ذلك، Databricks Runtime ML غير مدعوم على مجموعات TableACLs أو المجموعات مع spark.databricks.pyspark.enableProcessIsolation config تعيين إلى true.

إنشاء نظام مجموعة باستخدام Databricks Runtime ML

عند إنشاء نظام مجموعة، حدد إصدار Databricks Runtime ML من القائمة المنسدلة Databricks runtime version . تتوفر أوقات تشغيل التعلم الآلي الممكنة من وحدة المعالجة المركزية (CPU) وGPU.

حدد Databricks Runtime ML

إذا حددت مجموعة من القائمة المنسدلة في دفتر الملاحظات، يظهر إصدار Databricks Runtime على يمين اسم نظام المجموعة:

عرض إصدار التعلم الآلي من Databricks Runtime

إذا حددت وقت تشغيل التعلم الآلي الذي يدعم GPU، فستتم مطالبتك بتحديد نوع برنامج تشغيل متوافق ونوع عامل. تظهر أنواع المثيلات غير المتوافقة باللون الرمادي في القائمة المنسدلة. يتم سرد أنواع المثيلات الممكنة لوحدة معالجة الرسومات ضمن التسمية المسرعة لوحدة معالجة الرسومات . للحصول على معلومات حول إنشاء مجموعات Azure Databricks GPU، راجع الحوسبة الممكنة بواسطة وحدة معالجة الرسومات. يتضمن التعلم الآلي من Databricks Runtime برامج تشغيل أجهزة GPU ومكتبات NVIDIA مثل CUDA.

Photon وDatabricks Runtime ML

عند إنشاء مجموعة وحدة المعالجة المركزية التي تقوم بتشغيل Databricks Runtime 15.2 ML أو أعلى، يمكنك اختيار تمكين Photon. يعمل Photon على تحسين أداء التطبيقات باستخدام Spark SQL وSpark DataFrames وهندسة الميزات وGraphFrames وxgboost4j. من غير المتوقع تحسين الأداء على التطبيقات باستخدام Spark RDDs وPandas UDFs واللغات غير JVM مثل Python. وبالتالي، لن تشهد حزم Python مثل XGBoost وPyTorch وTensorFlow تحسنا في Photon.

واجهات برمجة تطبيقات Spark RDD وSpark MLlib لديها توافق محدود مع Photon. عند معالجة مجموعات البيانات الكبيرة باستخدام Spark RDD أو Spark MLlib، قد تواجه مشكلات في ذاكرة Spark. راجع مشكلات ذاكرة Spark.

المكتبات المضمنة في Databricks Runtime ML

يتضمن التعلم الآلي من Databricks Runtime مجموعة متنوعة من مكتبات التعلم الآلي الشائعة. يتم تحديث المكتبات مع كل إصدار لتضمين ميزات وإصلاحات جديدة.

قامت Databricks بتعيين مجموعة فرعية من المكتبات المدعومة كمكتبات من المستوى الأعلى. بالنسبة لهذه المكتبات، يوفر Databricks إيقاع تحديث أسرع، يتم التحديث إلى أحدث إصدارات الحزمة مع كل إصدار وقت تشغيل (منع تعارضات التبعية). يوفر Databricks أيضا دعما متقدما واختبارا وتحسينات مضمنة لمكتبات المستوى الأعلى.

للحصول على قائمة كاملة من المستوى الأعلى والمكتبات الأخرى المقدمة، راجع ملاحظات الإصدار الخاصة ب Databricks Runtime ML.

يمكنك تثبيت مكتبات إضافية لإنشاء بيئة مخصصة لدفتر الملاحظات أو نظام المجموعة.