Contoh pelatihan model

Bagian ini mencakup contoh yang menunjukkan cara melatih model pembelajaran mesin pada Azure Databricks menggunakan banyak pustaka sumber terbuka populer.

Anda juga dapat menggunakan AutoML, yang secara otomatis menyiapkan himpunan data untuk pelatihan model, melakukan serangkaian uji coba menggunakan pustaka sumber terbuka seperti scikit-learn dan XGBoost, dan membuat buku catatan Python dengan kode sumber untuk setiap percobaan yang dijalankan sehingga Anda dapat meninjau, mereproduksi, dan memodifikasi kode.

Contoh pembelajaran mesin

Paket Notebook Fitur
scikit-learn Tutorial pembelajaran mesin Unity Catalog, model klasifikasi, MLflow, penyetelan hyperparameter otomatis dengan Hyperopt dan MLflow
scikit-learn Contoh ujung-ke-ujung Unity Catalog, model klasifikasi, MLflow, penyetelan hyperparameter otomatis dengan Hyperopt dan MLflow, XGBoost
MLlib Contoh untuk MLlib Klasifikasi biner, pohon keputusan, regresi GBT, Streaming Terstruktur, serta transformator kustom
xgboost Contoh untuk XGBoost Python, PySpark, dan Scala, beban kerja simpul tunggal dan pelatihan terdistribusi

Contoh penyesuaian hiperparameter

Untuk informasi umum tentang tuning hyperparameter di Azure Databricks, lihat Tuning Hyperparameter.

Nota

Hyperopt versi sumber terbuka tidak lagi dipertahankan .

Hyperopt tidak termasuk dalam Databricks Runtime untuk Machine Learning setelah 16.4 LTS ML. Azure Databricks merekomendasikan penggunaan Optuna untuk pengoptimalan simpul tunggal atau RayTune untuk pengalaman serupa dengan fungsionalitas penyetelan hyperparameter terdistribusi Hyperopt yang tidak digunakan lagi. Pelajari selengkapnya tentang menggunakan RayTune di Azure Databricks.

Paket Notebook Fitur
Optuna Mulai menggunakan optuna Optuna, Optuna terdistribusi, scikit-learn, MLflow
Hyperopt Hyperopt yang terdistribusi Hyperopt terdistribusi, scikit-learn, serta MLflow
Hyperopt Membandingkan beberapa model Gunakan hyperopt terdistribusi untuk mencari ruang hiperparameter bagi berbagai jenis model secara bersamaan
Hyperopt Algoritma pelatihan terdistribusi dan hyperopt Hyperopt dan MLlib
Hyperopt Praktik terbaik Hyperopt Praktik terbaik untuk himpunan data dengan berbagai ukuran