Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Gunakan AutoML untuk secara otomatis menemukan algoritma prakiraan terbaik dan konfigurasi hiperparameter untuk memprediksi nilai berdasarkan data rangkaian waktu.
Prakiraan rangkaian waktu hanya tersedia untuk Databricks Runtime 10.0 ML atau lebih tinggi.
Menyiapkan eksperimen prakiraan dengan UI
Anda dapat menyiapkan masalah prakiraan menggunakan UI AutoML dengan langkah-langkah berikut:
- Di bar samping, pilih eksperimen .
- Pada kartu Prakiraan, pilih Mulai pelatihan.
Antarmuka Pengguna (UI) prakiraan secara default ke prakiraan tanpa server. Untuk mengakses prakiraan dengan komputasi Anda sendiri, pilih kembali ke pengalaman lama.
Konfigurasi eksperimen AutoML
Halaman konfigurasikan eksperimen AutoML ditampilkan. Pada halaman ini, Anda mengonfigurasi proses AutoML, menentukan himpunan data, jenis masalah, target, atau kolom label untuk memprediksi, metrik yang akan digunakan untuk mengevaluasi dan menilai eksperimen yang dijalankan, dan menghentikan kondisi.
Di bidang Komputasi, pilih kluster yang menjalankan Databricks Runtime 10.0 ML atau lebih tinggi.
Di bawah Himpunan Data, klik Telusuri. Navigasi ke tabel yang ingin Anda gunakan dan klik Pilih. Skema tabel muncul.
Klik di bidang Target prediksi. Menu dropdown muncul, mencantumkan kolom yang diperlihatkan dalam skema. Pilih kolom yang Anda inginkan untuk diprediksi model.
Klik pada bidang kolom Waktu . Drop-down muncul memperlihatkan kolom himpunan data yang berjenis
timestampataudate. Pilih kolom yang berisi periode waktu untuk rangkaian waktu.Untuk prakiraan multi-seri, pilih kolom yang mengidentifikasi rangkaian waktu individual dari pengidentifikasi rangkaian waktu drop-down. AutoML mengelompokkan data menurut kolom ini sebagai rangkaian waktu yang berbeda dan melatih model untuk setiap seri secara independen. Jika Anda membiarkan bidang ini kosong, AutoML mengasumsikan bahwa himpunan data berisi satu deret waktu.
Di bidang cakrawala prakiraan dan frekuensi, tentukan jumlah periode waktu ke masa depan yang harus dihitung oleh AutoML nilai prakiraannya. Di kotak kiri, masukkan bilangan bulat periode untuk memprakirakan. Di kotak kanan, pilih unit.
Catatan
Untuk menggunakan ARIMA Otomatis, rangkaian waktu harus memiliki frekuensi reguler di mana interval antara dua titik harus sama sepanjang rangkaian waktu. Frekuensi harus cocok dengan unit frekuensi yang ditentukan dalam panggilan API atau di UI AutoML. AutoML menangani langkah-langkah waktu yang hilang dengan mengisi nilai-nilai tersebut dengan nilai sebelumnya.
Di Databricks Runtime 11.3 LTS ML ke atas, Anda dapat menyimpan hasil prediksi. Untuk melakukannya, tentukan database di bidang Database Output. Klik Telusuri dan pilih database dari dialog. AutoML menulis hasil prediksi ke tabel dalam database ini.
Bidang Nama eksperimen menunjukkan nama default. Untuk mengubahnya, ketik nama baru di kolom.
Anda juga dapat:
- Tentukan opsi konfigurasi tambahan.
- Gunakan tabel fitur yang ada di Feature Store untuk melengkapi himpunan data input asli.
Konfigurasi tingkat lanjut
Buka bagian Konfigurasi Lanjutan
- Metrik evaluasi adalah metrik utama yang digunakan untuk menilai pelaksanaan.
- Dalam Databricks Runtime 10.4 LTS ML ke atas, Anda dapat mengecualikan kerangka kerja pelatihan dari pertimbangan. Secara default, AutoML melatih model menggunakan kerangka kerja yang tercantum di bawah algoritma AutoML.
- Anda dapat mengedit kondisi berhenti. Kondisi penghentian default adalah:
- Untuk perkiraan eksperimen, berhenti setelah 120 menit.
- Dalam Databricks Runtime 10.4 LTS ML ke bawah, untuk eksperimen klasifikasi dan regresi, hentikan setelah 60 menit atau setelah menyelesaikan 200 uji coba, mana pun yang terjadi terlebih dahulu. Untuk Databricks Runtime 11.0 ML ke atas, jumlah uji coba tidak digunakan sebagai kondisi penghentian.
- Dalam Databricks Runtime 10.4 LTS ML ke atas, untuk eksperimen klasifikasi dan regresi, AutoML menggabungkan penghentian awal; ini menghentikan pelatihan dan penyetelan model jika metrik validasi tidak lagi membaik.
- Dalam Databricks Runtime 10.4 LTS ML ke atas, Anda dapat memilih
untuk membagi data untuk pelatihan, validasi, dan pengujian dalam urutan kronologis (hanya berlaku untuk klasifikasi dan regresi ). - Databricks merekomendasikan agar bidang Direktori data kosong. Tidak mengisi bidang ini memicu perilaku default menyimpan himpunan data dengan aman sebagai artefak MLflow. Jalur DBFS dapat ditentukan, tetapi dalam hal ini, himpunan data tidak mewarisi izin akses eksperimen AutoML.
Menjalankan eksperimen dan memeriksa hasilnya
Untuk memulai eksperimen AutoML, klik Mulai AutoML. Eksperimen mulai berjalan, dan halaman pelatihan AutoML muncul. Untuk merefresh tabel eksekusi, klik tombol Refresh
.
Lihat kemajuan eksperimen
Dari halaman ini, Anda dapat:
- Hentikan eksperimen kapan saja.
- Buka notebook eksplorasi data.
- Monitor beroperasi.
- Buka halaman run untuk menjalankan apa pun.
Dengan Databricks Runtime 10.1 ML ke atas, AutoML menampilkan peringatan untuk potensi masalah dengan himpunan data, seperti jenis kolom yang tidak didukung atau kolom kardinalitas tinggi.
Catatan
Databricks melakukan yang terbaik untuk menunjukkan potensi kesalahan atau masalah. Namun, ini mungkin tidak komprehensif dan mungkin tidak menangkap masalah atau kesalahan yang mungkin Anda cari.
Untuk melihat peringatan untuk himpunan data, klik tab Peringatan di halaman pelatihan atau halaman eksperimen setelah eksperimen selesai.
Peringatan AutoML
Melihat hasil
Ketika percobaan selesai, Anda dapat:
- Daftar dan sebarkan salah satu model dengan MLflow.
- Pilih Lihat buku catatan untuk model terbaik agar dapat meninjau dan mengedit buku catatan yang menghasilkan model terbaik.
- Pilih Tampilkan buku catatan eksplorasi data untuk membuka buku catatan eksplorasi data.
- Cari, filter, dan urutkan eksekusi dalam tabel eksekusi.
- Lihat detail untuk eksekusi apa pun:
- Buku catatan yang dihasilkan yang berisi kode sumber untuk uji coba dapat ditemukan dengan mengklik eksekusi MLflow. Buku catatan disimpan di bagian Artefak dari halaman proses. Anda dapat mengunduh buku catatan ini dan mengimpornya ke ruang kerja, jika mengunduh artefak diaktifkan oleh administrator ruang kerja Anda.
- Untuk menampilkan hasil eksekusi, klik kolom Model
atau kolom Waktu Mulai . Halaman eksekusi muncul, memperlihatkan informasi tentang eksekusi uji coba (seperti parameter, metrik, dan tag) dan artefak yang dibuat oleh eksekusi, termasuk model. Halaman ini juga menyertakan cuplikan kode yang dapat Anda gunakan untuk membuat prediksi dengan model.
Untuk kembali ke eksperimen AutoML ini di kemudian hari, temukan eksperimen tersebut di tabel pada halaman . Hasil setiap eksperimen AutoML, termasuk notebook eksplorasi dan pelatihan data, disimpan dalam folder databricks_automl di folder home pengguna yang menjalankan eksperimen.
Mendaftarkan dan menyebarkan model
Daftarkan dan sebarkan model Anda menggunakan UI AutoML. Saat eksekusi selesai, baris atas menampilkan model terbaik berdasarkan metrik utama.
- Pilih tautan di kolom Model untuk model yang ingin Anda daftarkan.
- Pilih
untuk mendaftarkannya ke Unity Catalog atau Model Registry.
Catatan
Databricks merekomendasikan Anda mendaftarkan model ke Unity Catalog untuk fitur terbaru.
- Setelah pendaftaran, Anda dapat menyebarkan model ke model kustom yang melayani titik akhir.
Tidak ada modul bernama 'pandas.core.indexes.numeric
Saat melayani model yang dibangun menggunakan AutoML dengan Model Serving, Anda mungkin mendapatkan kesalahan: No module named 'pandas.core.indexes.numeric.
Hal ini disebabkan oleh versi yang tidak kompatibel pandas antara AutoML dan model yang melayani lingkungan titik akhir. Anda dapat mengatasi kesalahan ini dengan menjalankan skrip add-pandas-dependency.py. Skrip mengedit requirements.txt dan conda.yaml untuk model yang telah dicatat untuk menyertakan versi dependensi yang sesuai pandas : pandas==1.5.3
- Ubah skrip untuk menyertakan
run_iddari run MLflow di mana model Anda dicatat. - Daftarkan ulang model ke Unity Catalog atau registri model.
- Coba menjalankan versi baru model MLflow.