การคลัสเตอร์คืออะไร
Clustering เป็นรูปแบบ การเรียนรู้ของเครื่อง ที่ไม่ได้ใช้งาน ซึ่งการสังเกตการณ์จะถูกจัดกลุ่มเป็นคลัสเตอร์ตามความคล้ายคลึงกันในค่าข้อมูล หรือคุณลักษณะ การเรียนรู้ของเครื่องประเภทนี้ถือว่าไม่ได้ใช้งานเนื่องจากไม่ได้ใช้ป้ายชื่อ ที่รู้จักก่อนหน้านี้ ค่าในการฝึกแบบจําลอง ในแบบจําลองการคลัสเตอร์ ป้ายชื่อคือคลัสเตอร์ที่มีการกําหนดข้อสังเกตตามคุณลักษณะเท่านั้น
ตัวอย่างเช่นสมมติว่าผู้ถือพฤกษชาติสังเกตตัวอย่างของดอกไม้และบันทึกจํานวนกลีบดอกไม้และใบบนดอกไม้แต่ละดอก
ซึ่งอาจเป็นประโยชน์ในการจัดกลุ่มดอกไม้เหล่านี้ลงในกลุ่มตามความคล้ายคลึงกันระหว่างคุณลักษณะของพวกเขา
มีหลายวิธีในการกําหนดการจัดกลุ่มนี้ ตัวอย่างเช่นหากดอกไม้ส่วนใหญ่มีใบจํานวนเท่ากันพวกเขาสามารถถูกจัดกลุ่มเป็นดอกไม้ที่มีกลีบดอกไม้หลายชนิดเทียบกับกลีบดอกไม้ไม่กี่ตัว อีกวิธีหนึ่งคือถ้าทั้งกลีบดอกไม้และจํานวนใบแตกต่างกันมากอาจมีรูปแบบการค้นพบเช่นดอกไม้ที่มีใบไม้หลายใบยังมีกลีบดอกไม้จํานวนมาก เป้าหมายของอัลกอริทึมการคลัสเตอร์คือการหาวิธีที่ดีที่สุดในการแยกชุดข้อมูลออกเป็นกลุ่ม ความหมาย ที่เหมาะสมที่สุด ขึ้นอยู่กับทั้งอัลกอริทึมที่ใช้และชุดข้อมูลที่ให้ไว้
แม้ว่าตัวอย่างดอกไม้นี้จะง่ายต่อการจัดหมวดหมู่ด้วยตัวอย่างเพียงไม่กี่ตัวอย่าง เนื่องจากชุดข้อมูลเพิ่มขึ้นเป็นพันตัวอย่างหรือมากกว่าสองคุณลักษณะ การคลัสเตอร์อัลกอริทึมจะมีประโยชน์ในการเรียงลําดับชุดข้อมูลเป็นกลุ่มอย่างรวดเร็ว