Bagikan melalui


Latih Model Pengelompokan

Penting

Dukungan untuk Studio Azure Machine Learning (klasik) akan berakhir pada 31 Agustus 2024. Sebaiknya Anda transisi ke Azure Machine Learning sebelum tanggal tersebut.

Mulai 1 Desember 2021, Anda tidak akan dapat membuat sumber daya Studio Azure Machine Learning (klasik) baru. Hingga 31 Agustus 2024, Anda dapat terus menggunakan sumber daya Pembelajaran Mesin Studio (klasik) yang ada.

ML Dokumentasi Studio (klasik) sedang berhenti dan mungkin tidak diperbarui di masa mendatang.

Melatih model pengelompokan dan menetapkan data dari pelatihan yang ditetapkan ke kluster

Kategori: Pembelajaran Mesin / Kereta Api

Catatan

Berlaku untuk: Pembelajaran Mesin Studio (klasik) saja

Modul drag-and-drop serupa tersedia di Azure Machine Learning desainer.

Ringkasan Modul

Artikel ini menjelaskan cara menggunakan modul Train Clustering Model di Pembelajaran Mesin Studio (klasik), untuk melatih model pengelompokan.

Modul ini mengambil model pengklusteran yang tidak terlatih yang telah Anda konfigurasi menggunakan modul Pengklusteran K Berarti, dan melatih model menggunakan set data berlabel atau tanpa label. Modul ini membuat model terlatih yang dapat Anda gunakan untuk prediksi, dan serangkaian tugas kluster untuk setiap kasus dalam data pelatihan.

Catatan

Model pengelompokan tidak dapat dilatih menggunakan modul Model Kereta Api , yang merupakan modul generik untuk membuat model pembelajaran mesin. Itu karena Melatih Model hanya berfungsi dengan algoritma pembelajaran yang diawasi. K berarti dan algoritma pengklusteran lainnya memungkinkan pembelajaran tanpa pengawasan, yang berarti bahwa algoritma dapat belajar dari data yang tidak berlabel.

Cara menggunakan Melatih Model Pengklusteran

  1. Tambahkan modul Train Clustering Model ke eksperimen Anda di Studio (klasik). Anda dapat menemukan modul di bawah Modul Pembelajaran Mesin, dalam kategori Pelatihan.

  2. Tambahkan modul Kluster K Berarti, atau modul kustom lain yang membuat model pengklusteran yang kompatibel, dan atur parameter model pengklusteran.

  3. Lampirkan kumpulan data pelatihan ke input sebelah kanan Melatih Model Pengklusteran.

  4. Di Set Kolom, pilih kolom dari set data untuk digunakan dalam membuat kluster. Pastikan untuk memilih kolom yang membuat fitur yang bagus: misalnya, hindari menggunakan ID atau kolom lain yang memiliki nilai unik, atau kolom yang memiliki semua nilai yang sama.

    Jika label tersedia, Anda dapat menggunakannya sebagai fitur, atau meninggalkannya.

  5. Pilih opsi, Periksa Tambah atau Hapus Centang untuk Hanya Hasil, jika Anda ingin mengeluarkan data pelatihan bersama dengan label kluster baru.

    Jika Anda membatalkan pilihan opsi ini, hanya penugasan kluster yang dioutput.

  6. Jalankan eksperimen, atau klik modul Train Clustering Model dan pilih Run Selected.

Hasil

Setelah pelatihan selesai:

  • Untuk melihat kluster dan pemisahannya dalam grafik, klik kanan output himpunan data Hasil dan pilih Visualisasikan.

    Grafik mewakili komponen utama dari cluster, bukan nilai aktual. Lihat Analisis Komponen Utama untuk informasi lebih lanjut.

  • Untuk melihat nilai dalam himpunan data, tambahkan instans modul Konversi ke Himpunan Data , dan hubungkan ke output himpunan data Hasil . Jalankan modul Konversi ke Himpunan Data untuk mendapatkan salinan data yang dapat Anda lihat atau unduh.

  • Untuk menyimpan model terlatih untuk digunakan kembali nanti, klik kanan modul, pilih Model terlatih, dan klik Simpan Sebagai Model Terlatih.

  • Untuk menghasilkan skor dari model, gunakan Tetapkan Data ke Kluster.

Contoh

Untuk contoh bagaimana pengelompokan digunakan dalam pembelajaran mesin, lihat Galeri AI Azure:

Input yang diharapkan

Nama Jenis Deskripsi
Model tak terlatih Antarmuka ICluster Model pengelompokan yang tidak terlatih
Himpunan Data Tabel Data Masukkan sumber data

Parameter modul

Nama Rentang Jenis Default Deskripsi
Kumpulan Kolom apa pun Pilihan Kolom Pola pemilihan kolom
Periksa Tambahkan atau Hapus Centang hanya untuk Hasil apa pun Boolean TRUE Apakah himpunan data output harus berisi himpunan data input yang ditambahkan oleh kolom tugas (Dicentang) atau kolom tugas saja (Tidak dicentang)

Output

Nama Jenis Deskripsi
Model terlatih Antarmuka ICluster Model pengelompokan terlatih
Kumpulan data hasil Tabel Data Input himpunan data yang ditambahkan oleh kolom data tugas atau kolom tugas saja

Pengecualian

Pengecualian Deskripsi
Kesalahan 0003 Pengecualian terjadi jika satu atau beberapa input null atau kosong.

Untuk daftar kesalahan khusus untuk modul Studio (klasik), lihat Pembelajaran Mesin Kode kesalahan.

Untuk daftar pengecualian API, lihat Pembelajaran Mesin Kode Kesalahan REST API.

Lihat juga

Daftar Modul A-Z
Berlatih
Tetapkan Data ke Kluster
Pengklusteran K-Means