Bagikan melalui


Mesin Two-Class Bayes Point

Penting

Dukungan untuk Studio Azure Machine Learning (klasik) akan berakhir pada 31 Agustus 2024. Sebaiknya Anda transisi ke Azure Machine Learning sebelum tanggal tersebut.

Mulai 1 Desember 2021, Anda tidak akan dapat membuat sumber daya Studio Azure Machine Learning (klasik) baru. Hingga 31 Agustus 2024, Anda dapat terus menggunakan sumber daya Pembelajaran Mesin Studio (klasik) yang ada.

ML Dokumentasi Studio (klasik) sedang berhenti dan mungkin tidak diperbarui di masa mendatang.

Membuat model klasifikasi biner mesin titik Bayes

Kategori: Pembelajaran Mesin / Inisialisasi Model / Klasifikasi

Catatan

Berlaku untuk: Pembelajaran Mesin Studio (klasik) saja

Modul drag-and-drop serupa tersedia di Azure Machine Learning desainer.

Ringkasan Modul

Artikel ini menjelaskan cara menggunakan modul Two-Class Bayes Point Machine di Pembelajaran Mesin Studio (klasik), untuk membuat model klasifikasi biner yang tidak terlatih.

Algoritma dalam modul ini menggunakan pendekatan Bayesian untuk klasifikasi linier yang disebut "Bayes Point Machine". Algoritma ini secara efisien mendekati rata-rata Bayesian yang secara teoritis optimal dari pengklasifikasi linier (dalam hal kinerja generalisasi) dengan memilih satu pengklasifikasi "rata-rata", Bayes Point. Karena Bayes Point Machine adalah model klasifikasi Bayesian, tidak cenderung terlalu sesuai dengan data pelatihan.

Untuk informasi lebih lanjut, lihat posting Chris Bishop di blog Microsoft Pembelajaran Mesin: Embracing Uncertainty - Probabilistic Inference.

Cara mengkonfigurasi Two-Class Bayes Point Machine

  1. Di Pembelajaran Mesin Studio (klasik), tambahkan modul Two-Class Bayes Point Machine ke eksperimen Anda. Anda dapat menemukan modul di bawah Pembelajaran Mesin, Model Inisialisasi, Klasifikasi.

  2. Untuk Jumlah iterasi pelatihan, ketik angka untuk menentukan seberapa sering algoritma pengiriman pesan berulang atas data pelatihan. Biasanya, jumlah iterasi harus diatur ke nilai dalam kisaran 5 - 100.

    Semakin tinggi jumlah iterasi pelatihan, semakin akurat prediksinya; Namun, pelatihan akan lebih lambat.

    Untuk sebagian besar dataset, pengaturan default dari 30 iterasi pelatihan sudah cukup bagi algoritma untuk membuat prediksi yang akurat. Terkadang prediksi yang akurat dapat dibuat dengan menggunakan lebih sedikit iterasi. Untuk himpunan data dengan fitur yang sangat berkorelasi, Anda mungkin mendapat manfaat dari lebih banyak iterasi pelatihan.

  3. Pilih opsi, Sertakan bias, jika Anda ingin fitur konstan atau bias ditambahkan ke setiap instans dalam pelatihan dan prediksi.

    Termasuk bias diperlukan ketika data belum mengandung fitur konstan.

  4. Pilih opsi, Izinkan nilai yang tidak diketahui dalam fitur kategoris, untuk membuat grup untuk nilai yang tidak diketahui.

    Jika Anda membatalkan pilihan ini, model hanya dapat menerima nilai yang terdapat dalam data pelatihan.

    Jika Anda memilih opsi ini dan mengizinkan nilai yang tidak diketahui, model mungkin kurang tepat untuk nilai yang diketahui, tetapi dapat memberikan prediksi yang lebih baik untuk nilai baru (tidak diketahui).

  5. Tambahkan contoh modul Model Kereta Api , dan data pelatihan Anda.

  6. Koneksi data pelatihan dan output modul Two-Class Bayes Point Machine ke modul Train Model, dan pilih kolom label.

  7. Jalankan eksperimen.

Hasil

Setelah pelatihan selesai, klik kanan output modul Model Kereta api untuk melihat hasilnya:

  • Untuk melihat ringkasan parameter model, bersama dengan bobot fitur yang dipelajari dari pelatihan, pilih Visualisasikan.

  • Untuk menyimpan model untuk digunakan nanti, klik kanan output Train MOdel, dan pilih Simpan sebagai Model Terlatih.

  • Untuk membuat prediksi, gunakan model terlatih sebagai input ke modul Model Skor .

    Model yang tidak terlatih juga dapat diteruskan ke Model Validasi Silang untuk validasi silang terhadap kumpulan data berlabel.

Contoh

Untuk melihat bagaimana Two-Class Bayes Point Machine digunakan dalam pembelajaran mesin, lihat eksperimen sampel ini di Galeri AI Azure:

Catatan teknis

Bagian ini berisi detail implementasi dan pertanyaan yang sering diajukan tentang algoritma ini.

Rincian dari penelitian asli dan teori yang mendasarinya tersedia dalam makalah ini (PDF): Bayes Point Machines, oleh Herbert, Graepe, dan Campbell

Namun, implementasi ini meningkatkan algoritma asli dalam beberapa cara:

Peningkatan ini membuat model klasifikasi Bayes Point Machine lebih kuat dan lebih mudah digunakan, dan Anda dapat melewati langkah penyetelan parameter yang memakan waktu.

Parameter modul

Nama Rentang Jenis Default Deskripsi
Jumlah perulangan pelatihan >=1 Bilangan bulat 30 Tentukan jumlah iterasi yang akan digunakan saat pelatihan
Sertakan bias Apa pun Boolean True Menunjukkan apakah fitur konstan atau bias harus ditambahkan ke setiap instance
Mengizinkan nilai yang tidak diketahui dalam fitur kategoris Apa pun Boolean True Jika Benar, buat level tambahan untuk setiap kolom kategoris. Setiap level dalam himpunan data pengujian yang tidak tersedia dalam himpunan data pelatihan dipetakan ke tingkat tambahan ini.

Output

Nama Jenis Deskripsi
Model tak terlatih Antarmuka ILearner Model klasifikasi biner yang tidak terlatih

Lihat juga

Daftar Modul ClassificationA-Z