Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
O algoritmo Clustering da Microsoft agrupa casos em clusters que contêm características semelhantes. Esses agrupamentos são úteis para explorar dados, identificar anomalias nos dados e criar previsões.
O Visualizador de Cluster da Microsoft fornece as seguintes guias para uso na análise de modelos de mineração de clustering:
Guia do Diagrama de Agrupamento
A guia Diagrama de Agrupamento exibe todos os clusters que estão em um modelo de mineração. As linhas entre os clusters representam "proximidade" e são sombreadas com base em quão semelhantes são os clusters. A cor real de cada cluster representa a frequência da variável e o estado no cluster.
Para explorar o modelo na guia Diagrama de Agrupamento
Use a lista Modelo de Mineração na parte superior da guia Visualizador de Modelos de Mineração para alternar para o
TM_Clusteringmodelo.Na lista Visualizador , selecione o Visualizador de Cluster da Microsoft.
Na caixa Variável de Sombreamento , selecione Comprador de Bicicleta.
A variável padrão é População, mas você pode alterá-la para qualquer atributo no modelo, para descobrir quais clusters contêm membros que têm os atributos desejados.
Selecione 1 na caixa Estado para explorar os casos em que uma bicicleta foi comprada.
A legenda Densidade descreve a densidade do par de estado de atributo selecionado na Variável de Sombreamento e no Estado. Neste exemplo, ele nos informa que o cluster com o sombreamento mais escuro tem a maior porcentagem de compradores de bicicletas.
Pause o mouse sobre o cluster com o sombreamento mais escuro.
Uma dica de ferramenta exibe a porcentagem de casos que têm o atributo,
Bike Buyer = 1.Selecione o cluster que tem a densidade mais alta, clique com o botão direito do mouse no cluster, selecione Renomear Cluster e digite Bike Buyers High para identificação posterior. Clique em OK.
Localize o cluster que tem o sombreamento mais leve (e a densidade mais baixa). Clique com o botão direito do mouse no cluster, selecione Renomear Cluster e digite Bike Buyers Low. Clique em OK.
Clique no cluster Bike Buyers High e arraste-o para uma área do painel que lhe dará uma visão clara de suas conexões com os outros clusters.
Quando você seleciona um cluster, as linhas que conectam esse cluster a outros clusters são realçadas, para que você possa ver facilmente todas as relações desse cluster. Quando o cluster não está selecionado, você pode dizer pela escuridão das linhas o quão fortes são as relações entre todos os clusters no diagrama. Se o sombreamento for claro ou inexistente, os clusters não serão muito semelhantes.
Use o controle deslizante à esquerda da rede, para filtrar os links mais fracos e localizar os clusters com as relações mais próximas. O departamento de marketing da Adventure Works Cycles pode querer combinar clusters semelhantes ao determinar o melhor método para fornecer o endereçamento direcionado.
Aba Perfis de Cluster
A guia Perfis de Cluster fornece uma exibição geral do TM_Clustering modelo. A guia Perfis de Cluster contém uma coluna para cada cluster no modelo. A primeira coluna lista os atributos associados a pelo menos um cluster. O restante do visualizador contém a distribuição dos estados de um atributo para cada cluster. A distribuição de uma variável discreta é mostrada como uma barra colorida com o número máximo de barras exibidas na lista de barras de Histograma . Atributos contínuos são exibidos com um gráfico de diamantes, que representa a média e o desvio padrão em cada cluster.
Para explorar o modelo na aba Perfis do Cluster
Defina as barras do Histograma para 5.
Em nosso modelo, 5 é o número máximo de estados para qualquer variável.
Se a Legenda de Mineração bloquear a exibição dos perfis de atributo, mova-a para fora do caminho.
Selecione a coluna Bike Buyers High e arraste-a para a direita da coluna População .
Selecione a coluna Bike Buyers Low e arraste-a para a direita da coluna Bike Buyers High .
Clique na coluna Bike Buyers High .
A coluna Variáveis é classificada em ordem de importância para esse cluster. Deslize pela coluna e reveja as características do cluster de compradores de bicicletas High. Por exemplo, eles são mais propensos a ter um trajeto curto.
Clique duas vezes na célula Age na coluna Bike Buyers High .
A Legenda de Mineração exibe uma exibição mais detalhada e você pode ver a faixa etária desses clientes, bem como a idade média.
Clique com o botão direito do mouse na coluna Bike Buyers Low e selecione Ocultar Coluna.
Aba Características do Cluster
Com a guia Características do Cluster , você pode examinar com mais detalhes as características que compõem um cluster. Em vez de comparar as características de todos os clusters (como na guia Perfis de Cluster), você pode explorar um cluster por vez. Por exemplo, se você selecionar Bike Buyers High na lista cluster , poderá ver as características dos clientes neste cluster. Embora a exibição seja diferente do visualizador de Perfis de Cluster, as descobertas são as mesmas.
Observação
A menos que você defina um valor inicial para holdoutseed, os resultados variarão cada vez que você processar o modelo. Para obter mais informações, consulte o elemento HoldoutSeed
Aba Discriminação de Agrupamento
Com a aba Discriminação de Cluster, você pode explorar as características que distinguem um cluster de outro. Depois de selecionar dois clusters, um da lista Cluster 1 e outro da lista Cluster 2 , o visualizador calculará as diferenças entre os clusters e exibirá uma lista dos atributos que mais distinguem os clusters.
Para explorar o modelo na guia de Discriminação de Clusters
Na caixa Cluster 1 , selecione Bike Buyers High.
Na caixa Cluster 2 , selecione Compradores de Bicicleta Baixo.
Clique em Variáveis para classificar em ordem alfabética.
Algumas das diferenças mais substanciais entre os clientes nos clusters Bike Buyers Low and Bike Buyers High incluem idade, propriedade do carro, número de crianças e região.
Tarefas Relacionadas
Consulte os tópicos a seguir para explorar os outros modelos de mineração.
Explorando o modelo de árvore de decisão (Tutorial básico de mineração de dados)
Explorando o modelo Naive Bayes (Tutorial básico de mineração de dados)
Próxima tarefa da lição
Explorando o modelo Naive Bayes (Tutorial básico de mineração de dados)
Tarefa anterior na lição
Explorando o modelo de árvore de decisão (Tutorial básico de mineração de dados)
Consulte Também
Procurar um modelo usando o Visualizador de Cluster da Microsoft
Guia Discriminação de Cluster (Visualizador de Modelos de Mineração)
Aba de Perfis de Cluster (Visualizador de Modelos de Mineração)
Guia Características do Cluster (Visualizador do Modelo de Mineração)
Aba Diagrama de Cluster (Visualizador de Modelos de Mineração)