Pengantar
Pengklusteran adalah proses pengelompokan objek dengan objek serupa. Misalnya, pada gambar di bawah ini kami memiliki kumpulan koordinat 2D yang telah dikelompokkan ke dalam tiga kategori - kiri atas (kuning), bawah (merah), dan kanan atas (biru).
Perbedaan utama antara model pengklusteran dan klasifikasi adalah bahwa pengklusteran adalah metode yang tidak diawasi , di mana pelatihan dilakukan tanpa label. Model pengklusteran mengidentifikasi contoh yang memiliki kumpulan fitur yang serupa. Pada gambar sebelumnya, contoh yang berada di lokasi yang sama dikelompokkan bersama.
Pengklusteran umum dan berguna untuk menjelajahi data baru di mana pola antara titik data, seperti kategori tingkat tinggi, belum diketahui. Pengklusteran ini digunakan di banyak bidang yang perlu secara otomatis memberi label pada data kompleks, termasuk analisis jaringan sosial, konektivitas otak, pemfilteran spam, dan sebagainya.