Azure Databricks'te XGBoost kullanma
Bu makalede, Azure Databricks'te XGBoost kullanarak makine öğrenmesi modellerini eğiten örnekler sağlanmaktadır. Machine Learning için Databricks Runtime hem Python hem de Scala için XGBoost kitaplıkları içerir. XGBoost modellerini tek bir makinede veya dağıtılmış bir şekilde eğitebilirsiniz.
XGBoost modellerini tek bir düğümde eğitin
Python xgboost
paketini kullanarak modelleri eğitebilirsiniz. Bu paket yalnızca tek düğüm iş yüklerini destekler. PySpark ML işlem hattını eğitmek ve dağıtılmış eğitimden yararlanmak için bkz . XGBoost modellerinin dağıtılmış eğitimi.
XGBoost Python not defteri
XGBoost modellerinin dağıtılmış eğitimi
XGBoost modellerinin dağıtılmış eğitimi için Databricks, paketi temel alan xgboost
PySpark tahmin aracılarını içerir. Databricks scala paketini xgboost-4j
de içerir. Ayrıntılar ve örnek not defterleri için aşağıdakilere bakın:
- xgboost.spark kullanarak XGBoost modellerinin dağıtılmış eğitimi (Databricks Runtime 12.0 ML ve üzeri)
- Sparkdl.xgboost kullanarak XGBoost modellerinin dağıtılmış eğitimi (Databricks Runtime 12.0 ML ile başlayarak kullanım dışı bırakıldı)
- Scala kullanarak XGBoost modellerinin dağıtılmış eğitimi
Azure Databricks'e XGBoost yükleme
Databricks Runtime'a XGBoost yüklemeniz veya Databricks Runtime ML ile önceden yüklenmiş olandan farklı bir sürüm kullanmanız gerekiyorsa bu yönergeleri izleyin.
Databricks Runtime ML'de XGBoost'u yükleme
XGBoost, Databricks Runtime ML'ye dahildir. Bu kitaplıkları, herhangi bir paket yüklemeden Databricks Runtime ML'de kullanabilirsiniz.
Kullandığınız Databricks Runtime ML sürümünde yüklü XGBoost sürümü için sürüm notlarınabakın. Databricks Runtime ML'ye başka Python sürümlerini yüklemek için XGBoost'u Databricks PyPI kitaplığı olarak yükleyin. Bu seçeneği aşağıdaki gibi belirtip <xgboost version>
değerini istenen sürümle değiştirin.
xgboost==<xgboost version>
Databricks Runtime'a XGBoost'u yükleme
Python paketi: Not defteri hücresinde aşağıdaki komutu yürütür:
%pip install xgboost
Belirli bir sürümü yüklemek için değerini istenen sürümle değiştirin <xgboost version>
:
%pip install xgboost==<xgboost version>
- Scala/Java paketleri: Spark Paketi adıyla
xgboost-linux64
databricks kitaplığı olarak yükleyin.