Mesin Two-Class Bayes Point
Penting
Dukungan untuk Studio Azure Machine Learning (klasik) akan berakhir pada 31 Agustus 2024. Sebaiknya Anda transisi ke Azure Machine Learning sebelum tanggal tersebut.
Mulai 1 Desember 2021, Anda tidak akan dapat membuat sumber daya Studio Azure Machine Learning (klasik) baru. Hingga 31 Agustus 2024, Anda dapat terus menggunakan sumber daya Pembelajaran Mesin Studio (klasik) yang ada.
- Lihat informasi tentang memindahkan proyek pembelajaran mesin dari ML Studio (klasik) ke Azure Machine Learning.
- Mer informasjon tentang Azure Machine Learning.
ML Dokumentasi Studio (klasik) sedang berhenti dan mungkin tidak diperbarui di masa mendatang.
Membuat model klasifikasi biner mesin titik Bayes
Kategori: Pembelajaran Mesin / Inisialisasi Model / Klasifikasi
Catatan
Berlaku untuk: Pembelajaran Mesin Studio (klasik) saja
Modul drag-and-drop serupa tersedia di Azure Machine Learning desainer.
Ringkasan Modul
Artikel ini menjelaskan cara menggunakan modul Two-Class Bayes Point Machine di Pembelajaran Mesin Studio (klasik), untuk membuat model klasifikasi biner yang tidak terlatih.
Algoritma dalam modul ini menggunakan pendekatan Bayesian untuk klasifikasi linier yang disebut "Bayes Point Machine". Algoritma ini secara efisien mendekati rata-rata Bayesian yang secara teoritis optimal dari pengklasifikasi linier (dalam hal kinerja generalisasi) dengan memilih satu pengklasifikasi "rata-rata", Bayes Point. Karena Bayes Point Machine adalah model klasifikasi Bayesian, tidak cenderung terlalu sesuai dengan data pelatihan.
Untuk informasi lebih lanjut, lihat posting Chris Bishop di blog Microsoft Pembelajaran Mesin: Embracing Uncertainty - Probabilistic Inference.
Cara mengkonfigurasi Two-Class Bayes Point Machine
Di Pembelajaran Mesin Studio (klasik), tambahkan modul Two-Class Bayes Point Machine ke eksperimen Anda. Anda dapat menemukan modul di bawah Pembelajaran Mesin, Model Inisialisasi, Klasifikasi.
Untuk Jumlah iterasi pelatihan, ketik angka untuk menentukan seberapa sering algoritma pengiriman pesan berulang atas data pelatihan. Biasanya, jumlah iterasi harus diatur ke nilai dalam kisaran 5 - 100.
Semakin tinggi jumlah iterasi pelatihan, semakin akurat prediksinya; Namun, pelatihan akan lebih lambat.
Untuk sebagian besar dataset, pengaturan default dari 30 iterasi pelatihan sudah cukup bagi algoritma untuk membuat prediksi yang akurat. Terkadang prediksi yang akurat dapat dibuat dengan menggunakan lebih sedikit iterasi. Untuk himpunan data dengan fitur yang sangat berkorelasi, Anda mungkin mendapat manfaat dari lebih banyak iterasi pelatihan.
Pilih opsi, Sertakan bias, jika Anda ingin fitur konstan atau bias ditambahkan ke setiap instans dalam pelatihan dan prediksi.
Termasuk bias diperlukan ketika data belum mengandung fitur konstan.
Pilih opsi, Izinkan nilai yang tidak diketahui dalam fitur kategoris, untuk membuat grup untuk nilai yang tidak diketahui.
Jika Anda membatalkan pilihan ini, model hanya dapat menerima nilai yang terdapat dalam data pelatihan.
Jika Anda memilih opsi ini dan mengizinkan nilai yang tidak diketahui, model mungkin kurang tepat untuk nilai yang diketahui, tetapi dapat memberikan prediksi yang lebih baik untuk nilai baru (tidak diketahui).
Tambahkan contoh modul Model Kereta Api , dan data pelatihan Anda.
Koneksi data pelatihan dan output modul Two-Class Bayes Point Machine ke modul Train Model, dan pilih kolom label.
Jalankan eksperimen.
Hasil
Setelah pelatihan selesai, klik kanan output modul Model Kereta api untuk melihat hasilnya:
Untuk melihat ringkasan parameter model, bersama dengan bobot fitur yang dipelajari dari pelatihan, pilih Visualisasikan.
Untuk menyimpan model untuk digunakan nanti, klik kanan output Train MOdel, dan pilih Simpan sebagai Model Terlatih.
Untuk membuat prediksi, gunakan model terlatih sebagai input ke modul Model Skor .
Model yang tidak terlatih juga dapat diteruskan ke Model Validasi Silang untuk validasi silang terhadap kumpulan data berlabel.
Contoh
Untuk melihat bagaimana Two-Class Bayes Point Machine digunakan dalam pembelajaran mesin, lihat eksperimen sampel ini di Galeri AI Azure:
- Bandingkan Pengklasifikasi Biner: Sampel ini menunjukkan penggunaan beberapa pengklasifikasi dua kelas.
Catatan teknis
Bagian ini berisi detail implementasi dan pertanyaan yang sering diajukan tentang algoritma ini.
Rincian dari penelitian asli dan teori yang mendasarinya tersedia dalam makalah ini (PDF): Bayes Point Machines, oleh Herbert, Graepe, dan Campbell
Namun, implementasi ini meningkatkan algoritma asli dalam beberapa cara:
Ini menggunakan algoritma pengiriman pesan propagasi harapan. Untuk informasi lebih lanjut, lihat Keluarga algoritma untuk perkiraan inferensi Bayesian.
Sapuan parameter tidak diperlukan.
Metode ini tidak memerlukan data untuk dinormalisasi.
Peningkatan ini membuat model klasifikasi Bayes Point Machine lebih kuat dan lebih mudah digunakan, dan Anda dapat melewati langkah penyetelan parameter yang memakan waktu.
Parameter modul
Nama | Rentang | Jenis | Default | Deskripsi |
---|---|---|---|---|
Jumlah perulangan pelatihan | >=1 | Bilangan bulat | 30 | Tentukan jumlah iterasi yang akan digunakan saat pelatihan |
Sertakan bias | Apa pun | Boolean | True | Menunjukkan apakah fitur konstan atau bias harus ditambahkan ke setiap instance |
Mengizinkan nilai yang tidak diketahui dalam fitur kategoris | Apa pun | Boolean | True | Jika Benar, buat level tambahan untuk setiap kolom kategoris. Setiap level dalam himpunan data pengujian yang tidak tersedia dalam himpunan data pelatihan dipetakan ke tingkat tambahan ini. |
Output
Nama | Jenis | Deskripsi |
---|---|---|
Model tak terlatih | Antarmuka ILearner | Model klasifikasi biner yang tidak terlatih |