Model eğitimi örnekleri

Bu bölüm, birçok popüler açık kaynak kitaplığını kullanarak makine öğrenmesi modellerini Azure Databricks eğitmeyi gösteren örnekler içerir.

Ayrıca AutoML kullanarak bir veri kümesini otomatik olarak model eğitimine hazırlar, scikit-learn ve XGBoost gibi açık kaynak kitaplıkları kullanarak bir dizi deneme gerçekleştirir ve kodu gözden geçirebilmeniz, yeniden oluşturabilmeniz ve değiştirebilmeniz için her deneme çalıştırması için kaynak kodu içeren bir Python not defteri oluşturur.

Makine öğrenmesi örnekleri

Paket Not defterleri Özellikler
scikit-learn Makine öğrenmesi eğitimi Unity Kataloğu, sınıflandırma modeli, MLflow, Hyperopt ve MLflow ile otomatik hiper parametre ayarlama
scikit-learn Uçtan uca örnek Unity Kataloğu, sınıflandırma modeli, MLflow, Hyperopt ve MLflow ile otomatik hiper parametre ayarlama, XGBoost
MLlib MLlib örnekleri İkili sınıflandırma, karar ağaçları, GBT regresyonu, Yapılandırılmış Akış, özel transformatör
xgboost XGBoost örnekleri Python, PySpark ve Scala, tek düğüm iş yükleri ve dağıtılmış eğitim

Hiper parametre ayarlama örnekleri

Azure Databricks hiper parametre ayarlama hakkında genel bilgi için bkz. Hyperparameter tuning.

Uyarı

Hyperopt'un açık kaynak sürümü artık korunmaz.

Hyperopt, 16.4 LTS ML sonrasında Machine Learning için Databricks Runtime'a dahil değildir. Azure Databricks, tek düğümlü iyileştirme için Optuna veya kullanım dışı bırakılan Hyperopt dağıtılmış hiper parametre ayarlama işlevine benzer bir deneyim için RayTune kullanılmasını önerir. Azure Databricks üzerinde RayTune kullanma hakkında daha fazla bilgi edinin.

Paket Not Defteri Özellikler
Optuna Optuna kullanmaya başlama Optuna, dağıtık Optuna, scikit-learn, MLflow
Hyperopt Dağıtılmış Hyperopt Dağıtılmış hyperopt, scikit-learn, MLflow
Hyperopt Modelleri karşılaştırma Farklı model türleri için hiper parametre alanında aynı anda arama yapmak için dağıtılmış hyperopt kullanma
Hyperopt Dağıtılmış eğitim algoritmaları ve hyperopt Hyperopt, MLlib
Hyperopt Hyperopt en iyi uygulamaları Farklı boyutlardaki veri kümeleri için en iyi yöntemler