K Means

04 Oct 2019

Agrupamento não supervisionado

Este é um algoritmo não supervisionado, o que significa que fornecemos a base de dados sem rótulos e o algoritmo se organiza automaticamente, levando em consideração as similaridades entre os dados e a quantidade de k especificada.

Na imagem abaixo, o valor escolhido para k é igual a 3. Inicialmente, três pontos são escolhidos aleatoriamente e, em seguida, os pontos mais próximos vão sendo assimilados por esses pontos iniciais (centros dos clusters), ao mesmo tempo em que o centro de cada cluster se move. No final, os itens do conjunto de dados são agrupados em categorias com base em sua proximidade com esses centros de cluster, e os centros se estabilizam, prontos para lidar com novos dados de entrada.