Introdução

Concluído

Clustering é o processo de agrupamento de objetos com objetos semelhantes. Por exemplo, na imagem abaixo temos uma coleção de coordenadas 2D que foram agrupadas em três categorias - superior esquerdo (amarelo), inferior (vermelho) e superior direito (azul).

Yellow, red, and blue clusters.

Uma grande diferença entre os modelos de agrupamento e classificação é que o agrupamento é um método não supervisionado , onde o treinamento é feito sem rótulos. Os modelos de clustering identificam exemplos que têm uma coleção semelhante de recursos. Na imagem anterior, os exemplos que estão em um local semelhante são agrupados.

O clustering é comum e útil para explorar novos dados onde os padrões entre pontos de dados, como categorias de alto nível, ainda não são conhecidos. Ele é usado em muitos campos que precisam rotular automaticamente dados complexos, incluindo análise de redes sociais, conectividade cerebral, filtragem de spam e assim por diante.