Az XGBoost használata az Azure Databricksben

Ez a cikk példákat tartalmaz a gépi tanulási modellek betanítására az Azure Databricks XGBoost használatával. A Databricks Runtime for Machine Tanulás XGBoost-kódtárakat tartalmaz a Pythonhoz és a Scalához is. Az XGBoost-modelleket egyéni gépen vagy elosztott módon taníthatja be.

XGBoost-modellek betanítása egyetlen csomóponton

Modelleket a Python-csomag xgboost használatával taníthat be. Ez a csomag csak egyetlen csomópontos számítási feladatokat támogat. PySpark ML-folyamat betanításához és az elosztott betanítás előnyeinek kihasználásához lásd az XGBoost-modellek elosztott betanítását.

XGBoost Python-jegyzetfüzet

Jegyzetfüzet beszerzése

XGBoost-modellek elosztott betanítása

Az XGBoost-modellek elosztott betanításához a Databricks a csomagon xgboost alapuló PySpark-becslőket tartalmazza. A Databricks tartalmazza a Scala-csomagot xgboost-4jis. Részletekért és példajegyzetfüzetekért tekintse meg a következőket:

Az XGBoost telepítése az Azure Databricksre

Ha telepítenie kell az XGBoostot a Databricks Runtime-ra, vagy a Databricks Runtime ML-vel előre telepített verziótól eltérő verziót kell használnia, kövesse az alábbi utasításokat.

Az XGBoost telepítése a Databricks Runtime ML-ben

Az XGBoost a Databricks Runtime ML részét képezi. Ezeket a kódtárakat csomag telepítése nélkül használhatja a Databricks Runtime ML-ben.

A használt Databricks Runtime ML-verzióban telepített XGBoost-verziót a kibocsátási megjegyzésekben tekintheti meg. Ha a Databricks Runtime ML-ben más Python-verziókat szeretne telepíteni, az XGBoostot Databricks PyPI-kódtárként telepítse. Az alábbiak szerint adja meg, és cserélje le az <xgboost version> paramétert a kívánt verzióra.

xgboost==<xgboost version>

Az XGBoost telepítése a Databricks Runtime-ban

  • Python-csomag: Hajtsa végre a következő parancsot egy jegyzetfüzetcellában:

    %pip install xgboost
    

Egy adott verzió telepítéséhez cserélje le <xgboost version> a kívánt verzióra:

  %pip install xgboost==<xgboost version>
  • Scala/Java-csomagok: Telepítés Databricks-kódtárként a Spark-csomag nevévelxgboost-linux64.