Compartilhar via


Criando uma estrutura de modelo de mineração de clustering de sequências (Tutorial de mineração de dados intermediário)

A primeira etapa na criação de uma sequência clustering modelo de mineração é usar o Assistente de Mineração de Dados para criar uma nova estrutura de mineração e um modelo de mineração com base no algoritmo Clustering de Sequência da Microsoft.

Você usará a mesma exibição da fonte de dados utilizada para a análise da cesta de compras, mas adicionará uma coluna com o identificador sequence. Neste cenário, a sequência significa a ordem em que o cliente adicionou itens à cesta de compras.

Você também adicionará algumas colunas usadas em um dos modelos para agrupar clientes por dados demográficos.

Para criar uma estrutura e um modelo de de clustering de sequências

  1. Em Gerenciador de Soluções no SSDT (SQL Server Data Tools), clique com o botão direito do mouse em Estruturas de Mineração e selecione Nova Estrutura de Mineração.

  2. Na página Bem-vindo ao Assistente de Mineração de Dados , clique em Avançar.

  3. Na página Selecionar o Método de Definição , verifique se Do banco de dados relacional ou data warehouse existente está selecionado e clique em Avançar.

  4. Na página Criar a Estrutura de Mineração de Dados , verifique se a opção Criar estrutura de mineração com um modelo de mineração está selecionada. Em seguida, clique na lista suspensa para a opção Qual técnica de mineração de dados você deseja usar?, e selecione Clustering de Sequência da Microsoft. Clique em Próximo.

    A página Selecionar Exibição da Fonte de Dados é exibida. Em Exibições de fonte de dados disponíveis, selecione Orders.

    Pedidos é a mesma exibição da fonte de dados utilizada para a análise do cenário de cesta de compras. Se você não criou essa exibição de fonte de dados, consulte Adicionando uma exibição de fonte de dados com tabelas aninhadas (Tutorial de mineração de dados intermediário).

  5. Clique em Próximo.

  6. Na página Especificar Tipos de Tabela, selecione a caixa Case marcar ao lado da tabela vAssocSeqOrders e selecione a caixa marcar Aninhada ao lado da tabela vAssocSeqLineItems. Clique em Próximo.

    Observação

    Se ocorrer um erro ao selecionar as caixas Case ou Aninhado marcar, pode ser que a junção na exibição da fonte de dados não esteja correta. A tabela aninhada, vAssocSeqLineItems, deve ser conectada à tabela de maiúsculas e minúsculas, vAssocSeqOrders, por uma junção muitos para um. Você pode editar a relação clicando com o botão direito do mouse na linha de junção e invertendo a direção da junção. Para obter mais informações, consulte Caixa de diálogo Criar ou Editar Relação (Analysis Services – Dados Multidimensionais).

  7. Na página Especificar os Dados de Treinamento, escolha as colunas para uso no modelo selecionando uma caixa de marcar da seguinte maneira:

    • Incomegroup Selecione a caixa Marcar de Entrada.

      Essa coluna contém informações interessantes sobre os clientes que poderão ser usadas para clustering. Você a usará no primeiro modelo e vai ignorá-la no segundo.

    • Ordernumber Selecione a Key caixa marcar.

      Esse campo será usado como o identificador da tabela de casos, ou Key. Em geral, você nunca deve usar o campo de chave da tabela de casos como uma entrada, já que a chave contém valores exclusivos que não são úteis para clustering.

    • Região Selecione a caixa Marcar de Entrada.

      Essa coluna contém informações interessantes sobre os clientes que poderão ser usadas para clustering. Você a usará no primeiro modelo e vai ignorá-la no segundo.

    • Linenumber Selecione as Key caixas e Entrada marcar.

      O campo LineNumber será usado como o identificador para a tabela aninhada ou Sequence Key. A chave para uma tabela aninhada sempre deve ser usada como entrada.

    • Modelo Selecione as caixas Entrada e Marcar Previsível.

    Verifique se as seleções estão corretas e clique em Avançar.

  8. Na página Especificar Conteúdo e Tipo de Dados das Colunas , verifique se a grade contém as colunas, os tipos de conteúdo e os tipos de dados mostrados na tabela a seguir e clique em Avançar.

    Tabelas/Colunas Tipo de conteúdo Tipo de Dados
    IncomeGroup Discreto Texto
    OrderNumber Chave Texto
    Região Discreto Texto
    vAssocSeqLineItems
    Número da Linha Key Sequence long
    Modelar Discreto Texto
  9. Na página Criar Conjunto de Testes , altere o Percentual de dados para teste para 20 e clique em Avançar.

  10. Na página Concluindo o Assistente , para o nome da estrutura de mineração, digite Sequence Clustering with Region.

  11. Para o nome do modelo de mineração, digite Sequence Clustering with Region.

  12. Marque a caixa Permitir detalhamento e clique em Concluir.

Próxima tarefa da lição

Processando o modelo de clustering de sequências

Consulte Também

Data Mining Designer
Microsoft Sequence Clustering Algorithm