Compartilhar via


Criando uma estrutura de modelo de mineração de mala direta (Tutorial de mineração de dados básico)

A primeira etapa na criação de um cenário de endereçamento direcionado é usar o Assistente de Mineração de Dados no SQL Server Data Tools (SSDT) para criar uma nova estrutura de mineração e um modelo de mineração de árvore de decisão.

Nesta tarefa, você configurará uma nova estrutura de mineração e adicionará um modelo de mineração inicial com base no algoritmo Árvores de Decisão da Microsoft. Para criar a estrutura, primeiro você selecionará tabelas e exibições e depois identificará as colunas que serão usadas no treinamento e as que serão usadas para teste.

Para criar uma estrutura de mineração para o cenário de mala direta

  1. Em Gerenciador de Soluções, clique com o botão direito do mouse em Estruturas de Mineração e selecione Nova Estrutura de Mineração para iniciar o Assistente de Mineração de Dados.

  2. Na página Bem-vindo ao Assistente de Mineração de Dados , clique em Avançar.

  3. Na página Selecionar o Método de Definição , verifique se Do banco de dados relacional existente ou data warehouse está selecionado e clique em Avançar.

  4. Na página Criar a Estrutura de Mineração de Dados , em Qual técnica de mineração de dados você deseja usar?, selecione Árvores de Decisão da Microsoft.

    Observação

    Se você receber um aviso de que não é possível encontrar nenhum algoritmo de mineração de dados, as propriedades do projeto talvez não sejam configuradas corretamente. Esse aviso ocorre quando o projeto tenta recuperar uma lista de algoritmos de mineração de dados do servidor do Analysis Services e não consegue localizar o servidor. Por padrão, SQL Server Data Tools usará localhost como o servidor. Se você estiver usando uma instância diferente ou uma instância nomeada, altere as propriedades do projeto. Para obter mais informações, consulte Criando um projeto do Analysis Services (Tutorial básico de mineração de dados).

  5. Clique em Próximo.

  6. Na página Selecionar Exibição da Fonte de Dados, no painel Exibições de fonte de dados disponíveis , selecione Correspondência direcionada. Você pode clicar em Procurar para exibir as tabelas na exibição da fonte de dados e, em seguida, clicar em Fechar para retornar ao assistente.

  7. Clique em Próximo.

  8. Na página Especificar Tipos de Tabela, selecione a caixa marcar na coluna Caso para vTargetMail usá-la como a tabela de maiúsculas e minúsculas e clique em Avançar. Você usará a tabela ProspectiveBuyer posteriormente para testes; ignore-a por enquanto.

  9. Na página Especificar os Dados de Treinamento , você identificará pelo menos uma coluna previsível, uma coluna de chave e uma coluna de entrada para o modelo. Selecione a caixa marcar na coluna Previsível na linha BikeBuyer.

    Observação

    Observe o aviso na parte inferior da janela. Você não poderá navegar até a próxima página até selecionar pelo menos uma Entrada e uma coluna Previsível .

  10. Clique em Sugerir para abrir a caixa de diálogo Sugerir Colunas Relacionadas .

    O botão Sugerir é habilitado sempre que pelo menos um atributo previsível é selecionado. A caixa de diálogo Sugerir Colunas Relacionadas lista as colunas que estão mais intimamente relacionadas à coluna previsível e ordena os atributos por sua correlação com o atributo previsível. As colunas com uma correlação significativa (confiança acima de 95%) são selecionadas automaticamente para serem incluídas no modelo.

    Examine as sugestões e clique em Cancelar para atribuir as sugestões.

    Observação

    Se você clicar em OK, todas as sugestões listadas serão marcadas como colunas de entrada no assistente. Se você concordar com apenas algumas das sugestões, deverá alterar os valores manualmente.

  11. Verifique se a caixa marcar na coluna Chave está selecionada na linha CustomerKey.

    Observação

    Se a tabela de origem na exibição de fonte de dados indicar uma chave, o Assistente de Mineração de Dados escolherá automaticamente essa coluna como uma chave para o modelo.

  12. Selecione as caixas marcar na coluna Entrada nas linhas a seguir. Você pode marcar várias colunas ao realçar um intervalo de células e pressionar CTRL durante a marcação de uma caixa de seleção.

    • Age

    • CommuteDistance

    • EnglishEducation

    • EnglishOccupation

    • Gender

    • GeographyKey

    • HouseOwnerFlag

    • MaritalStatus

    • NumberCarsOwned

    • NumberChildrenAtHome

    • Região

    • TotalChildren

    • YearlyIncome

  13. Na coluna mais à esquerda da página, marque as caixas de seleção nas linhas a seguir.

    • AddressLine1

    • Addressline2

    • DateFirstPurchase

    • EmailAddress

    • Nome

    • Sobrenome

    Verifique se essas linhas só possuem marcações na coluna à esquerda. Essas colunas serão adicionadas à sua estrutura mas não serão incluídas no modelo. No entanto, depois que o modelo for criado, elas estarão disponíveis para detalhamento e teste. Para obter mais informações sobre o detalhamento, consulte Consultas de detalhamento (mineração de dados)

  14. Clique em Próximo.

Próxima tarefa da lição

Especificando o tipo de dados e o tipo de conteúdo (Tutorial de mineração de dados básico)

Consulte Também

Especificar tipos de tabelas (Assistente de Mineração de Dados)
Data Mining Designer
Algoritmo Árvores de Decisão da Microsoft