Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Bagian ini mencakup contoh yang menunjukkan cara melatih model pembelajaran mesin pada Azure Databricks menggunakan banyak pustaka sumber terbuka populer.
Anda juga dapat menggunakan AutoML, yang secara otomatis menyiapkan himpunan data untuk pelatihan model, melakukan serangkaian uji coba menggunakan pustaka sumber terbuka seperti scikit-learn dan XGBoost, dan membuat buku catatan Python dengan kode sumber untuk setiap percobaan yang dijalankan sehingga Anda dapat meninjau, mereproduksi, dan memodifikasi kode.
Contoh pembelajaran mesin
| Paket | Notebook | Fitur |
|---|---|---|
| scikit-learn | Tutorial pembelajaran mesin | Unity Catalog, model klasifikasi, MLflow, penyetelan hyperparameter otomatis dengan Hyperopt dan MLflow |
| scikit-learn | Contoh ujung-ke-ujung | Unity Catalog, model klasifikasi, MLflow, penyetelan hyperparameter otomatis dengan Hyperopt dan MLflow, XGBoost |
| MLlib | Contoh untuk MLlib | Klasifikasi biner, pohon keputusan, regresi GBT, Streaming Terstruktur, serta transformator kustom |
| xgboost | Contoh untuk XGBoost | Python, PySpark, dan Scala, beban kerja simpul tunggal dan pelatihan terdistribusi |
Contoh penyesuaian hiperparameter
Untuk informasi umum tentang tuning hyperparameter di Azure Databricks, lihat Tuning Hyperparameter.
Nota
Hyperopt versi sumber terbuka tidak lagi dipertahankan .
Hyperopt tidak termasuk dalam Databricks Runtime untuk Machine Learning setelah 16.4 LTS ML. Azure Databricks merekomendasikan penggunaan Optuna untuk pengoptimalan simpul tunggal atau RayTune untuk pengalaman serupa dengan fungsionalitas penyetelan hyperparameter terdistribusi Hyperopt yang tidak digunakan lagi. Pelajari selengkapnya tentang menggunakan RayTune di Azure Databricks.
| Paket | Notebook | Fitur |
|---|---|---|
| Optuna | Mulai menggunakan optuna | Optuna, Optuna terdistribusi, scikit-learn, MLflow |
| Hyperopt | Hyperopt yang terdistribusi | Hyperopt terdistribusi, scikit-learn, serta MLflow |
| Hyperopt | Membandingkan beberapa model | Gunakan hyperopt terdistribusi untuk mencari ruang hiperparameter bagi berbagai jenis model secara bersamaan |
| Hyperopt | Algoritma pelatihan terdistribusi dan hyperopt | Hyperopt dan MLlib |
| Hyperopt | Praktik terbaik Hyperopt | Praktik terbaik untuk himpunan data dengan berbagai ukuran |