Compartilhar via


Explorando o modelo de árvore de decisão (Tutorial de mineração de dados básico)

O algoritmo Árvores de Decisão da Microsoft prevê quais colunas influenciam a decisão de comprar uma bicicleta com base nas colunas restantes no conjunto de treinamento.

Guia Árvore de Decisão

Na guia Árvore de Decisão , você pode exibir árvores de decisão para cada atributo previsível no conjunto de dados.

Nesse caso, o modelo prevê apenas uma coluna, Bike Buyer, portanto, há apenas uma árvore a ser vista. Se houvesse mais árvores, você poderia usar a caixa Árvore para escolher outra árvore.

Ao exibir o TM_Decision_Tree modelo no visualizador da Árvore de Decisão, você pode ver os atributos mais importantes no lado esquerdo do gráfico. "Mais importante" significa que esses atributos têm a maior influência no resultado. Os atributos mais abaixo na árvore (à direita do gráfico) têm menos influência.

Neste exemplo, a idade é o fator mais importante na previsão da compra de bicicletas. O modelo agrupa os clientes por idade e depois mostra o próximo atributo mais importante de cada faixa etária. Por exemplo, no grupo de clientes com idades entre 34 e 40 anos, o número de carros é o fator de previsão mais importante depois da idade.

Para explorar o modelo na guia Árvore de Decisão

  1. Selecione a guia Visualizador do Modelo de Mineração no Designer de Mineração de Dados.

    Por padrão, o designer abre para o primeiro modelo que foi adicionado à estrutura – nesse caso, TM_Decision_Tree.

  2. Use os botões de lente de aumento para ajustar o tamanho da exibição da árvore.

    Por padrão, o Visualizador de Árvore da Microsoft mostra apenas os três primeiros níveis da árvore. Se a árvore tiver menos de três níveis, o visualizador mostrará só os níveis existentes. Você pode exibir mais níveis usando o controle deslizante Mostrar Nível ou a lista Expansão Padrão .

  3. Nível de Apresentação de Slides para a quarta barra.

  4. Altere o valor de Plano de Fundo para 1.

    Ao alterar a configuração Tela de fundo , você pode ver rapidamente o número de casos em cada nó que têm o valor de destino de 1 para [Comprador de Bicicleta]. Lembre-se de que neste cenário específico, cada caso representa um cliente. O valor 1 indica que o cliente comprou uma bicicleta anteriormente; o valor 0 indica que o cliente não comprou uma bicicleta. Quanto mais escuro for o sombreamento do nó, maior será a porcentagem de casos desse nó com o valor de destino.

  5. Coloque o cursor sobre o nó rotulado Como Todos. Uma dica de ferramenta será exibida com as seguintes informações:

    • Número total de casos

    • Número de casos de pessoas que não compram bicicleta

    • Número de casos de compradores de bicicleta

    • Número de casos com valores ausentes para [Comprador de Bicicleta]

    Como alternativa, coloque o seu cursor sobre qualquer nó da árvore para ver a condição exigida para alcançar aquele nó a partir do nó anterior. Você também pode exibir essas mesmas informações na Legenda de Mineração.

  6. Clique no nó para Idade >=34 e < 41. O histograma é exibido como uma barra horizontal final no nó e representa a distribuição de clientes nesse intervalo de idade que compraram (rosa) e que não compraram (azul) uma bicicleta anteriormente. O Visualizador nos mostra que os clientes entre os 34 e os 40 anos com um ou nenhum carro têm probabilidade de comprar uma bicicleta. Levando isso um pouco mais adiante, descobrimos que a probabilidade de compra de uma bicicleta aumenta caso o cliente tenha realmente entre 38 e 40 anos.

Como você habilitou o detalhamento quando criou a estrutura e o modelo, poderá recuperar informações detalhadas dos casos de modelo e da estrutura de mineração, incluindo as colunas não incluídas no modelo de mineração (por exemplo, emailAddress, FirstName).

Para obter mais informações, consulte Consultas de detalhamento (mineração de dados).

Para detalhar os dados de caso

  1. Clique com o botão direito do mouse em um nó e selecione Detalhar e Modelar Somente Colunas.

    Os detalhes para cada caso de treinamento são exibidos em formato de planilha. Esses detalhes vêm da exibição vTargetMail, selecionada como a tabela de caso durante a criação da estrutura de mineração.

  2. Clique com o botão direito do mouse em um nó e selecione Detalhar e, em seguida, Colunas de Modelo e Estrutura.

    A mesma planilha será exibida com as colunas da estrutura anexadas no final.

Guia Rede de Dependências

A guia Rede de Dependência exibe as relações entre os atributos que contribuem para a capacidade preditiva do modelo de mineração. O visualizador Rede de Dependências reforça as nossas descobertas de que Idade e Região são fatores importantes na previsão de compra de bicicletas.

Para explorar o modelo na guia Rede de Dependências
  1. Clique no Bike Buyer nó para identificar suas dependências.

    O nó central da rede de dependência, Bike Buyer, representa o atributo previsível no modelo de mineração. O gráfico destaca todos os nós conectados que têm um efeito sobre o atributo previsível.

  2. Ajuste o controle deslizante Todos os Links para identificar o atributo mais influente.

    Conforme você arrasta o controle deslizante para baixo, os atributos que têm apenas um efeito fraco na coluna [Bike Buyer] são removidos do grafo. Ao ajustar o controle deslizante, você poderá descobrir que Idade e Região são os principais fatores para prever se alguém é um comprador de bicicletas.

Consulte estes tópicos para explorar os dados usando outros tipos de modelos.

Próxima tarefa da lição

Explorando o modelo de clustering (Tutorial de mineração de dados básico)

Consulte Também

Tarefas e instruções do visualizador do modelo de mineração
Guia Árvore de Decisão (Visualizador do Modelo de Mineração)
Guia Rede de Dependências (Visualizador do Modelo de Mineração)
Procurar um modelo usando a Exibição de Árvore da Microsoft