استخدام XGBoost على Azure Databricks
توفر هذه المقالة أمثلة لتدريب نماذج التعلم الآلي باستخدام XGBoost في Azure Databricks. يتضمن وقت تشغيل Databricks التعلم الآلي مكتبات XGBoost لكل من Python وSc scala. يمكنك تدريب نماذج XGBoost على جهاز فردي أو بطريقة موزعة.
تدريب نماذج XGBoost على عقدة واحدة
يمكنك تدريب النماذج باستخدام حزمة Python xgboost
. تدعم هذه الحزمة أحمال عمل عقدة واحدة فقط. لتدريب مسار PySpark ML والاستفادة من التدريب الموزع، راجع التدريب الموزع لنماذج XGBoost.
دفتر ملاحظات XGBoost Python
التدريب الموزع لنماذج XGBoost
للتدريب الموزع لنماذج XGBoost، يتضمن Databricks مقدرات PySpark استنادا إلى الحزمة xgboost
. يتضمن Databricks أيضا حزمة xgboost-4j
Scala . للحصول على التفاصيل وأمثلة على دفاتر الملاحظات، راجع ما يلي:
- تدريب موزع لنماذج XGBoost باستخدام xgboost.spark (Databricks Runtime 12.0 ML وما فوق)
- تدريب موزع لنماذج XGBoost باستخدام sparkdl.xgboost (مهمل بدءا من Databricks Runtime 12.0 ML)
- تدريب موزع لنماذج XGBoost باستخدام Scala
تثبيت XGBoost على Azure Databricks
إذا كنت بحاجة إلى تثبيت XGBoost على Databricks Runtime أو استخدام إصدار مختلف عن الإصدار المثبت مسبقا مع Databricks Runtime ML، فاتبع هذه الإرشادات.
تثبيت XGBoost على Databricks Runtime ML
يتم تضمين XGBoost في Databricks Runtime ML. يمكنك استخدام هذه المكتبات في Databricks Runtime ML دون تثبيت أي حزم.
للحصول على إصدار XGBoost المثبت في إصدار Databricks Runtime ML الذي تستخدمه، راجع ملاحظات الإصدار. لتثبيت إصدارات Python الأخرى في Databricks Runtime ML، قم بتثبيت XGBoost كمكتبة Databricks PyPI. حدده كما يلي واستبدل <xgboost version>
بالإصدار المطلوب.
xgboost==<xgboost version>
تثبيت XGBoost على Databricks Runtime
حزمة Python: تنفيذ الأمر التالي في خلية دفتر ملاحظات:
%pip install xgboost
لتثبيت إصدار معين، استبدل <xgboost version>
بالإصدار المطلوب:
%pip install xgboost==<xgboost version>