استخدام XGBoost على Azure Databricks

توفر هذه المقالة أمثلة لتدريب نماذج التعلم الآلي باستخدام XGBoost في Azure Databricks. يتضمن وقت تشغيل Databricks التعلم الآلي مكتبات XGBoost لكل من Python وSc scala. يمكنك تدريب نماذج XGBoost على جهاز فردي أو بطريقة موزعة.

تدريب نماذج XGBoost على عقدة واحدة

يمكنك تدريب النماذج باستخدام حزمة Python xgboost . تدعم هذه الحزمة أحمال عمل عقدة واحدة فقط. لتدريب مسار PySpark ML والاستفادة من التدريب الموزع، راجع التدريب الموزع لنماذج XGBoost.

دفتر ملاحظات XGBoost Python

الحصول على دفتر الملاحظات

التدريب الموزع لنماذج XGBoost

للتدريب الموزع لنماذج XGBoost، يتضمن Databricks مقدرات PySpark استنادا إلى الحزمة xgboost . يتضمن Databricks أيضا حزمة xgboost-4jScala . للحصول على التفاصيل وأمثلة على دفاتر الملاحظات، راجع ما يلي:

تثبيت XGBoost على Azure Databricks

إذا كنت بحاجة إلى تثبيت XGBoost على Databricks Runtime أو استخدام إصدار مختلف عن الإصدار المثبت مسبقا مع Databricks Runtime ML، فاتبع هذه الإرشادات.

تثبيت XGBoost على Databricks Runtime ML

يتم تضمين XGBoost في Databricks Runtime ML. يمكنك استخدام هذه المكتبات في Databricks Runtime ML دون تثبيت أي حزم.

للحصول على إصدار XGBoost المثبت في إصدار Databricks Runtime ML الذي تستخدمه، راجع ملاحظات الإصدار. لتثبيت إصدارات Python الأخرى في Databricks Runtime ML، قم بتثبيت XGBoost كمكتبة Databricks PyPI. حدده كما يلي واستبدل <xgboost version> بالإصدار المطلوب.

xgboost==<xgboost version>

تثبيت XGBoost على Databricks Runtime

  • حزمة Python: تنفيذ الأمر التالي في خلية دفتر ملاحظات:

    %pip install xgboost
    

لتثبيت إصدار معين، استبدل <xgboost version> بالإصدار المطلوب:

  %pip install xgboost==<xgboost version>
  • حزم Scala/Java: تثبيت كمكتبة Databricks باسم xgboost-linux64حزمة Spark .