Latih Model Pengelompokan

Artikel
05/06/2019

Penting

Dukungan untuk Studio Azure Machine Learning (klasik) akan berakhir pada 31 Agustus 2024. Sebaiknya Anda transisi ke Azure Machine Learning sebelum tanggal tersebut.

Mulai 1 Desember 2021, Anda tidak akan dapat membuat sumber daya Studio Azure Machine Learning (klasik) baru. Hingga 31 Agustus 2024, Anda dapat terus menggunakan sumber daya Pembelajaran Mesin Studio (klasik) yang ada.

Lihat informasi tentang memindahkan proyek pembelajaran mesin dari ML Studio (klasik) ke Azure Machine Learning.
Mer informasjon tentang Azure Machine Learning.

ML Dokumentasi Studio (klasik) sedang berhenti dan mungkin tidak diperbarui di masa mendatang.

Melatih model pengelompokan dan menetapkan data dari pelatihan yang ditetapkan ke kluster

Kategori: Pembelajaran Mesin / Kereta Api

Catatan

Berlaku untuk: Pembelajaran Mesin Studio (klasik) saja

Modul drag-and-drop serupa tersedia di Azure Machine Learning desainer.

Ringkasan Modul

Artikel ini menjelaskan cara menggunakan modul Train Clustering Model di Pembelajaran Mesin Studio (klasik), untuk melatih model pengelompokan.

Modul ini mengambil model pengklusteran yang tidak terlatih yang telah Anda konfigurasi menggunakan modul Pengklusteran K Berarti, dan melatih model menggunakan set data berlabel atau tanpa label. Modul ini membuat model terlatih yang dapat Anda gunakan untuk prediksi, dan serangkaian tugas kluster untuk setiap kasus dalam data pelatihan.

Catatan

Model pengelompokan tidak dapat dilatih menggunakan modul Model Kereta Api , yang merupakan modul generik untuk membuat model pembelajaran mesin. Itu karena Melatih Model hanya berfungsi dengan algoritma pembelajaran yang diawasi. K berarti dan algoritma pengklusteran lainnya memungkinkan pembelajaran tanpa pengawasan, yang berarti bahwa algoritma dapat belajar dari data yang tidak berlabel.

Cara menggunakan Melatih Model Pengklusteran

Tambahkan modul Train Clustering Model ke eksperimen Anda di Studio (klasik). Anda dapat menemukan modul di bawah Modul Pembelajaran Mesin, dalam kategori Pelatihan.
Tambahkan modul Kluster K Berarti, atau modul kustom lain yang membuat model pengklusteran yang kompatibel, dan atur parameter model pengklusteran.
Lampirkan kumpulan data pelatihan ke input sebelah kanan Melatih Model Pengklusteran.
Di Set Kolom, pilih kolom dari set data untuk digunakan dalam membuat kluster. Pastikan untuk memilih kolom yang membuat fitur yang bagus: misalnya, hindari menggunakan ID atau kolom lain yang memiliki nilai unik, atau kolom yang memiliki semua nilai yang sama.

Jika label tersedia, Anda dapat menggunakannya sebagai fitur, atau meninggalkannya.
Pilih opsi, Periksa Tambah atau Hapus Centang untuk Hanya Hasil, jika Anda ingin mengeluarkan data pelatihan bersama dengan label kluster baru.

Jika Anda membatalkan pilihan opsi ini, hanya penugasan kluster yang dioutput.
Jalankan eksperimen, atau klik modul Train Clustering Model dan pilih Run Selected.

Hasil

Setelah pelatihan selesai:

Untuk melihat kluster dan pemisahannya dalam grafik, klik kanan output himpunan data Hasil dan pilih Visualisasikan.

Grafik mewakili komponen utama dari cluster, bukan nilai aktual. Lihat Analisis Komponen Utama untuk informasi lebih lanjut.
Untuk melihat nilai dalam himpunan data, tambahkan instans modul Konversi ke Himpunan Data , dan hubungkan ke output himpunan data Hasil . Jalankan modul Konversi ke Himpunan Data untuk mendapatkan salinan data yang dapat Anda lihat atau unduh.
Untuk menyimpan model terlatih untuk digunakan kembali nanti, klik kanan modul, pilih Model terlatih, dan klik Simpan Sebagai Model Terlatih.
Untuk menghasilkan skor dari model, gunakan Tetapkan Data ke Kluster.

Contoh

Untuk contoh bagaimana pengelompokan digunakan dalam pembelajaran mesin, lihat Galeri AI Azure:

Pengelompokan: Temukan Perusahaan serupa: Menunjukkan cara menggunakan pengelompokan pada atribut yang berasal dari teks tidak terstruktur.
Pengelompokan: Kuantisasi warna: Menunjukkan cara menggunakan pengelompokan untuk menemukan warna terkait dan mengurangi jumlah bit yang digunakan dalam gambar.
Pengelompokan: Mengelompokkan data iris: Memberikan contoh sederhana pengelompokan berdasarkan himpunan data iris.

Input yang diharapkan

Nama	Jenis	Deskripsi
Model tak terlatih	Antarmuka ICluster	Model pengelompokan yang tidak terlatih
Himpunan Data	Tabel Data	Masukkan sumber data

Parameter modul

Nama	Rentang	Jenis	Default	Deskripsi
Kumpulan Kolom	apa pun	Pilihan Kolom		Pola pemilihan kolom
Periksa Tambahkan atau Hapus Centang hanya untuk Hasil	apa pun	Boolean	TRUE	Apakah himpunan data output harus berisi himpunan data input yang ditambahkan oleh kolom tugas (Dicentang) atau kolom tugas saja (Tidak dicentang)

Output

Nama	Jenis	Deskripsi
Model terlatih	Antarmuka ICluster	Model pengelompokan terlatih
Kumpulan data hasil	Tabel Data	Input himpunan data yang ditambahkan oleh kolom data tugas atau kolom tugas saja

Pengecualian

Pengecualian	Deskripsi
Kesalahan 0003	Pengecualian terjadi jika satu atau beberapa input null atau kosong.

Untuk daftar kesalahan khusus untuk modul Studio (klasik), lihat Pembelajaran Mesin Kode kesalahan.

Untuk daftar pengecualian API, lihat Pembelajaran Mesin Kode Kesalahan REST API.

Lihat juga

Daftar Modul A-Z
Berlatih
Tetapkan Data ke Kluster
Pengklusteran K-Means

Bagikan melalui