Modul pengelompokan

Penting

Dukungan untuk Studio Azure Machine Learning (klasik) akan berakhir pada 31 Agustus 2024. Sebaiknya Anda transisi ke Azure Machine Learning sebelum tanggal tersebut.

Mulai 1 Desember 2021, Anda tidak akan dapat membuat sumber daya Studio Azure Machine Learning (klasik) baru. Hingga 31 Agustus 2024, Anda dapat terus menggunakan sumber daya Pembelajaran Mesin Studio (klasik) yang ada.

Lihat informasi tentang memindahkan proyek pembelajaran mesin dari ML Studio (klasik) ke Azure Machine Learning.
Mer informasjon tentang Azure Machine Learning.

ML Dokumentasi Studio (klasik) sedang berhenti dan mungkin tidak diperbarui di masa mendatang.

Artikel ini menjelaskan modul di Pembelajaran Mesin Studio (klasik) yang mendukung pembuatan model pengelompokan.

Catatan

Berlaku untuk: Pembelajaran Mesin Studio (klasik) saja

Modul drag-and-drop serupa tersedia di Azure Machine Learning desainer.

Apa itu pengklusteran?

Clustering, dalam pembelajaran mesin, adalah metode pengelompokan titik data ke dalam kelompok serupa. Ini juga disebut segmentasi.

Selama bertahun-tahun, banyak algoritma pengelompokan telah dikembangkan. Hampir semua algoritma pengelompokan menggunakan fitur item individu untuk menemukan item serupa. Misalnya, Anda mungkin menerapkan pengelompokan untuk menemukan orang serupa berdasarkan demografi. Anda dapat menggunakan pengelompokan dengan analisis teks untuk mengelompokkan kalimat dengan topik atau sentimen serupa.

Clustering disebut teknik pembelajaran yang tidak diawasi karena dapat digunakan dalam data yang tidak berlabel. Memang, pengelompokan adalah langkah pertama yang berguna untuk menemukan pola baru, dan membutuhkan sedikit pengetahuan sebelumnya tentang bagaimana data dapat disusun atau bagaimana item terkait. Clustering sering digunakan untuk eksplorasi data sebelum analisis dengan algoritma lain yang lebih prediktif.

Cara membuat model pengelompokan

Di Pembelajaran Mesin Studio (klasik), Anda dapat menggunakan pengelompokan dengan data berlabel atau tidak berlabel.

Dalam data yang tidak diberi label, algoritma pengelompokan menentukan titik data mana yang paling dekat bersama, dan membuat kluster di sekitar titik pusat, atau sentroid. Anda kemudian dapat menggunakan ID kluster sebagai label sementara untuk grup data.
Jika data memiliki label, Anda dapat menggunakan label untuk mendorong jumlah kluster, atau menggunakan label hanya sebagai fitur lain.

Setelah Anda mengonfigurasi algoritme pengelompokan, Anda melatihnya pada data dengan menggunakan modul Train Clustering Model atau Sweep Clustering .

Saat model dilatih, gunakan untuk memprediksi keanggotaan kluster untuk titik data baru. Misalnya, jika Anda telah menggunakan pengelompokan untuk mengelompokkan pelanggan dengan perilaku pembelian, Anda dapat menggunakan model untuk memprediksi perilaku pembelian pelanggan baru.

Daftar modul

Kategori pengelompokan mencakup modul ini:

K-Means Clustering: Mengonfigurasi dan menginisialisasi model pengelompokan K-means.

Untuk menggunakan algoritme pengelompokan yang berbeda, atau membuat model pengelompokan kustom dengan menggunakan R, lihat topik berikut:

Contoh

Untuk contoh pengelompokan dalam tindakan, lihat Galeri AI Azure.

Lihat artikel ini untuk bantuan memilih algoritma:

Lembar contekan algoritma pembelajaran mesin untuk Pembelajaran Mesin Studio (klasik)

Menyediakan bagan keputusan grafis untuk memandu Anda melalui proses seleksi.
Cara memilih algoritma Pembelajaran Mesin untuk pengelompokan, klasifikasi, atau regresi

Menjelaskan secara lebih rinci berbagai jenis algoritma pembelajaran mesin, dan bagaimana mereka digunakan.

Lihat juga

Last updated on 2019-05-06