Contoh untuk pelatihan model
Bagian ini mencakup contoh yang menunjukkan cara melatih model pembelajaran mesin di Azure Databricks menggunakan banyak pustaka sumber terbuka populer.
Anda juga dapat menggunakan AutoML, yang secara otomatis menyiapkan himpunan data untuk pelatihan model, melakukan serangkaian uji coba menggunakan pustaka sumber terbuka seperti scikit-learn dan XGBoost, dan membuat notebook Python dengan kode sumber untuk setiap uji coba sehingga Anda dapat meninjau, mereproduksi, dan memodifikasi kode.
Contoh pembelajaran mesin
Paket | Notebook | Fitur |
---|---|---|
scikit-learn | Tutorial pembelajaran mesin | Unity Catalog, model klasifikasi, MLflow, penyetelan hyperparameter otomatis dengan Hyperopt dan MLflow |
scikit-learn | Contoh ujung-ke-ujung | Unity Catalog, model klasifikasi, MLflow, penyetelan hyperparameter otomatis dengan Hyperopt dan MLflow, XGBoost |
MLlib | Contoh untuk MLlib | Klasifikasi biner, pohon keputusan, regresi GBT, Streaming Terstruktur, serta transformator kustom |
xgboost | Contoh untuk XGBoost | Python, PySpark, dan Scala, beban kerja simpul tunggal serta pelatihan terdistribusi |
Contoh penyesuaian hiperparameter
Untuk memperoleh informasi umum tentang penyetelan hiperparameter pada Azure Databricks, lihat Penyetelan hiperparameter.
Paket | Notebook | Fitur |
---|---|---|
Optuna | Mulai menggunakan Optuna | Optuna, Optuna terdistribusi, scikit-learn, MLflow |
Hyperopt | Hyperopt yang terdistribusi | Hyperopt terdistribusi, scikit-learn, serta MLflow |
Hyperopt | Membandingkan beberapa model | Gunakan hyperopt terdistribusi untuk mencari ruang hiperparameter bagi berbagai jenis model secara bersamaan |
Hyperopt | Algoritma pelatihan terdistribusi dan hyperopt | Hyperopt dan MLlib |
Hyperopt | Praktik terbaik Hyperopt | Praktik terbaik untuk himpunan data dengan berbagai ukuran |