Compartilhar via


Criando previsões em um modelo de cluster de sequências (Tutorial de mineração de dados intermediário)

Depois de entender melhor a sequência clustering modelo navegando no visualizador, você pode criar consultas de previsão usando o Construtor de Consultas de Previsão na guia Previsão do Modelo de Mineração no Designer de Mineração de Dados. Para criar uma previsão, primeiro selecione o modelo de clustering de sequências e selecione os dados de entrada. Para entradas, use uma fonte de dados externa ou crie uma consulta singleton e forneça valores em uma caixa de diálogo.

Esta lição supõe que você já saiba usar o construtor de consultas de previsão e que deseja aprender a criar consultas específicas de um modelo de clustering de sequências. Para obter informações gerais sobre como usar o Construtor de Consultas de Previsão, consulte Interfaces de consulta de mineração de dados ou a seção do tutorial mineração de dados básica, Criando previsões (Tutorial básico de mineração de dados).

Criando previsões em um modelo regional

Para este cenário, primeiro você criará algumas consultas de previsão singleton, para ter uma ideia de como as previsões podem variar por região.

Para criar uma consulta de previsão singleton em um modelo de clustering de sequências

  1. Clique na guia Previsão do Modelo de Mineração do Designer de Mineração de Dados.

  2. No menu de coluna Modelo de Mineração , selecione Consulta Singleton.

    O painel Modelo de Mineração e o painel Entrada de Consulta Singleton são exibidos.

  3. No painel Modelo de Mineração , clique em Selecionar Modelo. (se o modo de clustering de sequências já tiver sido selecionado, você poderá ignorar esta etapa).

    A caixa de diálogo Selecionar Modelo de Mineração é aberta.

  4. Expanda o nó que representa a estrutura de mineração Clustering de Sequência com Região e selecione o modelo Clustering de Sequência com Região. Clique em OK. Por ora, ignore o painel de entrada; você especificará as entradas depois de configurar as funções de previsão.

  5. Na grade, clique na célula vazia em Origem e selecione Função de Previsão. Na célula em Campo, selecione PredictSequence.

    Observação

    Você também pode usar a função Predict . Se você fizer isso, escolha a versão da função Predict que usa uma coluna de tabela como argumento.

  6. No painel Modelo de Mineração , selecione a tabela v Assoc Seq Line Itemsaninhada e arraste-a para a grade, para a caixa Critérios/Argumento da função PredictSequence .

    Arrastar e soltar nomes de tabela e coluna permite que você crie instruções complexas sem erros de sintaxe. No entanto, ele substitui o conteúdo atual da célula, que inclui outros argumentos opcionais para a função PredictSequence . Para exibir os outros argumentos, você pode adicionar temporariamente uma segunda instância da função à grade para referência.

  7. Clique no botão Resultado no canto superior do Construtor de Consultas de Previsão.

Os resultados esperados contêm uma única coluna com o título Expressão. A coluna Expressão contém uma tabela aninhada com três colunas da seguinte maneira:

$SEQUENCE Número da Linha Modelar
1 Mountain-200

O que significam esses resultados? Lembre-se de que você não especificou entradas. Dessa forma, a previsão é feita em relação à toda a população de casos, e o Analysis Services retorna a previsão geral mais provável.

Adicionando entradas a uma consulta de previsão singleton

Até agora, você não especificou entradas. Na próxima tarefa, você usará o painel Entrada de Consulta Singleton para especificar algumas entradas para a consulta. Primeiro, use [Região] como uma entrada do modelo de clustering de sequências regional para determinar se as sequências previstas são iguais para todas as regiões. Assim, você aprenderá a modificar a consulta para adicionar a probabilidade de cada previsão e mesclar os resultados para facilitar sua exibição.

Para gerar previsões para um grupo de clientes específico
  1. Clique no botão Design no canto superior esquerdo do Construtor de Consultas de Previsão para voltar para a grade de construção da consulta.

  2. Na caixa de diálogo Entrada de Consulta Singleton , clique na caixa Valor de Regione selecione Europa.

  3. Clique no botão Resultado para exibir previsões para clientes na Europa.

  4. Clique no botão Design no canto superior esquerdo do Construtor de Consultas de Previsão para voltar para a grade de construção da consulta.

  5. Na caixa de diálogo Entrada de Consulta Singleton, clique na caixa Valor de Regione selecione América do Norte.

  6. Clique no botão Resultado para exibir previsões para clientes no América do Norte.

Adicionando probabilidades usando uma expressão personalizada

Gerar a probabilidade de cada previsão é ligeiramente mais complicado, já que a probabilidade é um atributo da previsão e é gerada como uma tabela aninhada. Se você já conhece DMX (Data Mining Extensions), poderá alterar com facilidade a consulta e adicionar uma instrução de subseleção na tabela aninhada. No entanto, você também poderá criar uma instrução de subseleção no Construtor de Consultas de Previsão ao adicionar uma expressão personalizada.

Para gerar probabilidades para uma sequência prevista usando uma expressão personalizada
  1. Clique no botão Design no canto superior esquerdo do Construtor de Consultas de Previsão para voltar para a grade de construção da consulta.

  2. Na grade, em Origem, clique em uma nova linha e selecione Expressão Personalizada.

  3. Deixe a caixa em Campo em branco.

  4. Para Alias, digite t.

  5. Na caixa Critérios/Argumento , digite a instrução de submarcação completa, conforme mostrado no exemplo de código a seguir. Não se esqueça de incluir os parênteses inicial e final.

    (SELECT PredictProbability([Model]) FROM PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]))  
    
  6. Clique no botão Resultado para exibir previsões para clientes na Europa.

Agora, os resultados contêm duas tabelas aninhadas, uma com a previsão e outra com a probabilidade da previsão. Se a consulta não funcionar, você poderá alternar para o modo de design e examinar a instrução completa da consulta, que deve ser assim:

SELECT  
  PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]),  
  ( (SELECT PredictProbability([Model]) FROM PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]))) as [t]  
FROM  
  [Sequence Clustering with Region]  
NATURAL PREDICTION JOIN  
(SELECT 'Europe' AS [Region]) AS t  

Trabalhando com resultados

Quando houver muitas tabelas aninhadas nos resultados, talvez seja melhor mesclá-los para obter uma exibição melhor. Para isso, modifique a consulta manualmente e adicione a palavra-chave FLATTENED.

Para mesclar conjuntos de linhas aninhadas em uma consulta de previsão
  1. Clique no botão Consulta no canto do Construtor de Consultas de Previsão.

    A grade se transformará em um painel aberto, onde você poderá exibir e modificar a instrução DMX criada pelo Construtor de Consultas de Previsão.

  2. Após a palavra-chave SELECT, digite FLATTENED.

    O texto completo da consulta deve ser similar ao seguinte:

    SELECT FLATTENED  
      PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]),  
      ( (SELECT PredictProbability([Model]) FROM PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]))) as [t]  
    FROM  
      [Sequence Clustering with Region]  
    NATURAL PREDICTION JOIN  
    (SELECT 'Europe' AS [Region]) AS t  
    
  3. Clique no botão Resultados no canto superior do Construtor de Consultas de Previsão.

Depois de editar manualmente uma consulta, você não conseguirá voltar ao modo Design sem perder as alterações. No entanto, é possível salvar a instrução DMX criada manualmente em um arquivo de texto e então voltar para o modo Design. Quando você fizer isso, a consulta será revertida para a última versão válida do modo Design.

Os exemplos anteriores usaram uma coluna da tabela de casos, Região, como a entrada da consulta de previsão singleton, porque você estava interessado em saber se o modelo encontrou diferenças entre regiões. No entanto, depois de explorar o modelo, você decidiu que as diferenças não são significativas o suficiente para justificar recomendações de personalização de produtos por região. O que realmente interessa a você na previsão são os itens selecionados pelos clientes. Dessa forma, nas consultas a seguir, você usará o modelo de clustering de sequências que não inclui Região para gerar recomendações para todos os clientes.

Usando colunas da tabela aninhada como entrada

Primeiro, você criará uma consulta de previsão singleton que obtém um único item como entrada e retorna o próximo item mais provável. Para obter uma previsão desse tipo, use uma coluna de tabela aninhada como o valor de entrada. Isso acontece porque o atributo que está sendo previsto, Modelo, faz parte de uma tabela aninhada. O Analysis Services fornece a caixa de diálogo Entrada de Tabela Aninhada para ajudá-lo a criar facilmente consultas de previsão em atributos de tabela aninhada, usando o Construtor de Consultas de Previsão.

Para usar uma tabela aninhada como entrada para uma previsão
  1. Clique no botão Design no canto superior esquerdo do Construtor de Consultas de Previsão para voltar para a grade de construção da consulta.

  2. Na caixa de diálogo Entrada de Consulta Singleton , clique na caixa Valor de Regione selecione a linha vazia para desmarcar a entrada desse campo.

  3. Na caixa de diálogo Entrada de Consulta Singleton , clique na caixa Valor de vAssocSeqLineItemse, em seguida, clique no botão (...).

  4. Na caixa de diálogo Entrada da Tabela Aninhada , clique em Adicionar.

  5. Na nova linha, clique na caixa em Modele selecione Pneu de Touring na lista. Clique em OK.

  6. Clique no botão Resultado para exibir as previsões.

O modelo recomenda os itens a seguir para todos os clientes que escolherem Pneu de Passeio como o primeiro item. Você já sabe, pela exploração do modelo, que os clientes frequentemente compram os produtos Pneu de Passeio e Tubo de Pneu para Passeio juntos e, portanto, essas recomendações parecem boas.

$SEQUENCE Número da Linha Modelar
1 Tubo de pneu para passeio
2 Sport-100
3 Jersey Logo de manga longa

Criando uma consulta de previsão em massa usando entradas de tabela aninhada

Agora que você já está satisfeito com o modelo que cria o tipo de previsões que poderão ser usadas em recomendações, crie uma consulta de previsão mapeada para uma fonte de dados externa. Essa fonte de dados fornecerá valores que representam produtos atuais. Como você está interessado na criação de uma consulta de previsão que ofereça ID do Cliente e uma lista de produtos como entrada, adicione a tabela de clientes como uma tabela de caso e a tabela de compras como a tabela aninhada. Em seguida, adicione funções de previsão, como feito anteriormente, para criar recomendações.

Esse procedimento é igual ao usado na criação de previsões para o cenário de cesta de compras da Lição 3; no entanto, em um modelo de clustering de sequências, as previsões também precisam do pedido como entrada.

Para criar uma consulta de previsão usando entradas de tabela aninhada
  1. No painel Modelo de Mineração , selecione o modelo Clustering de Sequência, se ele ainda não estiver selecionado.

  2. Na caixa de diálogo Selecionar Tabelas de Entrada , clique em Selecionar Tabela de Maiúsculas e Minúsculas.

  3. Na caixa de diálogo Selecionar Tabela , para Fonte de Dados, selecione Pedidos. Na lista Nome da Tabela/Exibição , selecione vAssocSeqOrders e clique em OK.

  4. Na caixa de diálogo Selecionar Tabelas de Entrada , clique em Selecionar Tabela Aninhada.

  5. Na caixa de diálogo Selecionar Tabela , para Fonte de Dados, selecione Pedidos. Na lista Nome da tabela/ exibição, selecione vAssocSeqLineItems e clique em OK.

    O Analysis Services tentará detectar relacionamentos e os criará automaticamente, caso os tipos de dados forem iguais e se os nomes de colunas forem similares. Se as relações que ele cria estiverem erradas, você poderá clicar com o botão direito do mouse na linha de junção e selecionar Modificar Conexões para editar o mapeamento de coluna ou clicar com o botão direito do mouse na linha de junção e selecionar Excluir para remover completamente a relação. Nesse caso, como as tabelas já foram unidas na exibição da fonte de dados, esses relacionamentos serão automaticamente adicionados ao painel de design.

  6. Adicione uma nova linha à grade. Em Origem, selecione vAssocSeqOrders e, para Campo, selecione CustomerKey.

  7. Adicione uma nova linha à grade. Em Origem, selecione Função de Previsão e, para Campo, selecione PredictSequence.

  8. Arraste vAssocSeqLineItems para a caixa Critérios/Argumento . Clique no final da caixa Critérios/Argumento e digite os seguintes argumentos: 2.

    O texto completo na caixa Critérios/Argumento deve ser: [Sequence Clustering].[v Assoc Seq Line Items],2

  9. Clique no botão Resultado para exibir as previsões de cada cliente.

Você concluiu o tutorial sobre modelos de clustering de sequências.

Próximas etapas

Se você concluiu todas as seções no Tutorial de Mineração de Dados Intermediário (Analysis Services – Mineração de Dados), a próxima etapa pode ser aprender a usar instruções DMX (Extensões de Mineração de Dados) para criar modelos e gerar previsões. Para obter mais informações, consulte Criando e consultando modelos de mineração de dados com DMX: tutoriais (Analysis Services – Mineração de dados).

Se você já conhece conceitos de programação, também poderá usar Objetos de Gerenciamento de Análise (AMO) para começar a trabalhar com objetos de mineração de dados programaticamente. Para obter mais informações, consulte Classes de mineração de dados AMO.

Consulte Também

Sequence Clustering Model Query Examples
Conteúdo do modelo de mineração para modelos de clustering de sequências (Analysis Services – Mineração de Dados)