XGBoost modelini tek bir GPU'da eğitin

Bu sayfanın not defteri sürümünü aç

Bu not defteri, Databricks sunucusuz GPU işlemi kullanarak tek bir GPU üzerinde XGBoost regresyon modelini eğitmeyi gösterir. GPU hızlandırma, özellikle büyük veri kümeleri için CPU tabanlı eğitime kıyasla model eğitimini önemli ölçüde hızlandırır.

Ele alınan temel kavramlar:

GPU hızlandırmalı eğitim: Daha hızlı eğitim için CUDA cihazıyla XGBoost'un hist ağaç yöntemini kullanır
Model denetim noktası oluşturma: Kurtarma ve artımlı eğitim için model durumunu düzenli aralıklarla Unity Kataloğu birimlerine kaydeder
California Konut veri kümesi: Ortanca ev değerlerini tahmin eden bir regresyon görevi

Daha fazla bilgi için Bkz. XGBoost GPU Desteği ve Unity Kataloğu hacimleri.

Gereksinimler

Bu not defteri GPU özellikli bir işlem kümesi gerektirir. Hücreler çalıştırılırken Databricks sunucusuz GPU hesaplama işlemi otomatik olarak seçilir.

Gerekli kitaplıkları yükleme

Veri kümesi yükleme ve değerlendirme ölçümleri için XGBoost sürüm 2.0.3 ve scikit-learn'ü yükleyin.

%pip install xgboost==2.0.3 # due to this issue: https://github.com/ray-project/xgboost_ray/issues/312
%pip install scikit-learn
dbutils.library.restartPython()

XGBoost 2.0.3'in doğru yüklendiğini doğrulayın.

%pip show xgboost

Unity Kataloğu denetim noktası konumunu yapılandırma

Model denetim noktalarının kaydedileceği Unity Kataloğu birim konumunu tanımlayın. Not defteri, katalog, şema, birim ve model adını yapılandırmak için sorgu parametrelerini kullanır.

# You must have `USE CATALOG` privileges on the catalog, and you must have `USE SCHEMA` privileges on the schema.
# If necessary, change the catalog and schema name here.
dbutils.widgets.text("uc_catalog", "main")
dbutils.widgets.text("uc_schema", "default")
dbutils.widgets.text("uc_model_name", "custom_transformer")
dbutils.widgets.text("uc_volume", "checkpoints")

UC_CATALOG = dbutils.widgets.get("uc_catalog")
UC_SCHEMA = dbutils.widgets.get("uc_schema")
UC_VOLUME = dbutils.widgets.get("uc_volume")
MODEL_NAME = dbutils.widgets.get("uc_model_name")
CHECKPOINT_PATH = f"/Volumes/{UC_CATALOG}/{UC_SCHEMA}/{UC_VOLUME}/{MODEL_NAME}"
CHECKPOINT_PREFIX = "checkpoint"

print(f"UC_CATALOG: {UC_CATALOG}")
print(f"UC_SCHEMA: {UC_SCHEMA}")
print(f"UC_VOLUME: {UC_VOLUME}")
print(f"CHECKPOINT_PATH: {CHECKPOINT_PATH}")

Unity Kataloğu birimine her 50 yükseltme turunda model durumunu kaydeden bir denetim noktası geri çağırması oluşturun. Bu, hatalardan kurtarma ve artımlı eğitim başlatılmasını sağlar.

import os
from xgboost.callback import TrainingCheckPoint

# Create the UC Volume where the checkpoint will be saved if it doesn't exist already
os.makedirs(CHECKPOINT_PATH, exist_ok=True)

# Create a callback to checkpoint to a UC volume
checkpoint_cb = TrainingCheckPoint(
    directory=CHECKPOINT_PATH,
    name=CHECKPOINT_PREFIX,
    iterations=50,       # save every 50 boosting rounds
)