Mesin Two-Class Bayes Point

Artikel
03/05/2020

Penting

Dukungan untuk Studio Azure Machine Learning (klasik) akan berakhir pada 31 Agustus 2024. Sebaiknya Anda transisi ke Azure Machine Learning sebelum tanggal tersebut.

Mulai 1 Desember 2021, Anda tidak akan dapat membuat sumber daya Studio Azure Machine Learning (klasik) baru. Hingga 31 Agustus 2024, Anda dapat terus menggunakan sumber daya Pembelajaran Mesin Studio (klasik) yang ada.

Lihat informasi tentang memindahkan proyek pembelajaran mesin dari ML Studio (klasik) ke Azure Machine Learning.
Mer informasjon tentang Azure Machine Learning.

ML Dokumentasi Studio (klasik) sedang berhenti dan mungkin tidak diperbarui di masa mendatang.

Membuat model klasifikasi biner mesin titik Bayes

Kategori: Pembelajaran Mesin / Inisialisasi Model / Klasifikasi

Catatan

Berlaku untuk: Pembelajaran Mesin Studio (klasik) saja

Modul drag-and-drop serupa tersedia di Azure Machine Learning desainer.

Ringkasan Modul

Artikel ini menjelaskan cara menggunakan modul Two-Class Bayes Point Machine di Pembelajaran Mesin Studio (klasik), untuk membuat model klasifikasi biner yang tidak terlatih.

Algoritma dalam modul ini menggunakan pendekatan Bayesian untuk klasifikasi linier yang disebut "Bayes Point Machine". Algoritma ini secara efisien mendekati rata-rata Bayesian yang secara teoritis optimal dari pengklasifikasi linier (dalam hal kinerja generalisasi) dengan memilih satu pengklasifikasi "rata-rata", Bayes Point. Karena Bayes Point Machine adalah model klasifikasi Bayesian, tidak cenderung terlalu sesuai dengan data pelatihan.

Untuk informasi lebih lanjut, lihat posting Chris Bishop di blog Microsoft Pembelajaran Mesin: Embracing Uncertainty - Probabilistic Inference.

Cara mengkonfigurasi Two-Class Bayes Point Machine

Di Pembelajaran Mesin Studio (klasik), tambahkan modul Two-Class Bayes Point Machine ke eksperimen Anda. Anda dapat menemukan modul di bawah Pembelajaran Mesin, Model Inisialisasi, Klasifikasi.
Untuk Jumlah iterasi pelatihan, ketik angka untuk menentukan seberapa sering algoritma pengiriman pesan berulang atas data pelatihan. Biasanya, jumlah iterasi harus diatur ke nilai dalam kisaran 5 - 100.

Semakin tinggi jumlah iterasi pelatihan, semakin akurat prediksinya; Namun, pelatihan akan lebih lambat.

Untuk sebagian besar dataset, pengaturan default dari 30 iterasi pelatihan sudah cukup bagi algoritma untuk membuat prediksi yang akurat. Terkadang prediksi yang akurat dapat dibuat dengan menggunakan lebih sedikit iterasi. Untuk himpunan data dengan fitur yang sangat berkorelasi, Anda mungkin mendapat manfaat dari lebih banyak iterasi pelatihan.
Pilih opsi, Sertakan bias, jika Anda ingin fitur konstan atau bias ditambahkan ke setiap instans dalam pelatihan dan prediksi.

Termasuk bias diperlukan ketika data belum mengandung fitur konstan.
Pilih opsi, Izinkan nilai yang tidak diketahui dalam fitur kategoris, untuk membuat grup untuk nilai yang tidak diketahui.

Jika Anda membatalkan pilihan ini, model hanya dapat menerima nilai yang terdapat dalam data pelatihan.

Jika Anda memilih opsi ini dan mengizinkan nilai yang tidak diketahui, model mungkin kurang tepat untuk nilai yang diketahui, tetapi dapat memberikan prediksi yang lebih baik untuk nilai baru (tidak diketahui).
Tambahkan contoh modul Model Kereta Api , dan data pelatihan Anda.
Koneksi data pelatihan dan output modul Two-Class Bayes Point Machine ke modul Train Model, dan pilih kolom label.
Jalankan eksperimen.

Hasil

Setelah pelatihan selesai, klik kanan output modul Model Kereta api untuk melihat hasilnya:

Untuk melihat ringkasan parameter model, bersama dengan bobot fitur yang dipelajari dari pelatihan, pilih Visualisasikan.
Untuk menyimpan model untuk digunakan nanti, klik kanan output Train MOdel, dan pilih Simpan sebagai Model Terlatih.
Untuk membuat prediksi, gunakan model terlatih sebagai input ke modul Model Skor .

Model yang tidak terlatih juga dapat diteruskan ke Model Validasi Silang untuk validasi silang terhadap kumpulan data berlabel.

Contoh

Untuk melihat bagaimana Two-Class Bayes Point Machine digunakan dalam pembelajaran mesin, lihat eksperimen sampel ini di Galeri AI Azure:

Bandingkan Pengklasifikasi Biner: Sampel ini menunjukkan penggunaan beberapa pengklasifikasi dua kelas.

Catatan teknis

Bagian ini berisi detail implementasi dan pertanyaan yang sering diajukan tentang algoritma ini.

Rincian dari penelitian asli dan teori yang mendasarinya tersedia dalam makalah ini (PDF): Bayes Point Machines, oleh Herbert, Graepe, dan Campbell

Namun, implementasi ini meningkatkan algoritma asli dalam beberapa cara:

Ini menggunakan algoritma pengiriman pesan propagasi harapan. Untuk informasi lebih lanjut, lihat Keluarga algoritma untuk perkiraan inferensi Bayesian.
Sapuan parameter tidak diperlukan.
Metode ini tidak memerlukan data untuk dinormalisasi.

Peningkatan ini membuat model klasifikasi Bayes Point Machine lebih kuat dan lebih mudah digunakan, dan Anda dapat melewati langkah penyetelan parameter yang memakan waktu.

Parameter modul

Nama	Rentang	Jenis	Default	Deskripsi
Jumlah perulangan pelatihan	>=1	Bilangan bulat	30	Tentukan jumlah iterasi yang akan digunakan saat pelatihan
Sertakan bias	Apa pun	Boolean	True	Menunjukkan apakah fitur konstan atau bias harus ditambahkan ke setiap instance
Mengizinkan nilai yang tidak diketahui dalam fitur kategoris	Apa pun	Boolean	True	Jika Benar, buat level tambahan untuk setiap kolom kategoris. Setiap level dalam himpunan data pengujian yang tidak tersedia dalam himpunan data pelatihan dipetakan ke tingkat tambahan ini.

Output

Nama	Jenis	Deskripsi
Model tak terlatih	Antarmuka ILearner	Model klasifikasi biner yang tidak terlatih

Lihat juga

Daftar Modul ClassificationA-Z

Bagikan melalui