Criando previsões em um modelo de agrupamento de sequência (Tutorial intermediário de mineração de dados)

Depois de entender melhor o modelo de clustering de sequência navegando no visualizador, você pode criar consultas de previsão usando o Construtor de Consultas de Previsão na guia Previsão do Modelo de Mineração no Designer de Mineração de Dados. Para criar uma previsão, primeiro selecione o modelo de clustering de sequência e selecione os dados de entrada. Para entradas, você pode usar uma fonte de dados externa ou criar uma consulta singleton e fornecer valores em uma caixa de diálogo.

Esta lição pressupõe que você já esteja familiarizado com como usar o construtor de consultas de previsão e deseja aprender a criar consultas específicas para um modelo de clustering de sequência. Para obter informações gerais sobre como usar o Construtor de Consultas de Previsão, consulte Interfaces de Consulta de Mineração de Dados ou a seção do tutorial de Mineração de Dados Básico, Criando Previsões (Tutorial básico de mineração de dados).

Criando previsões no modelo regional

Para esse cenário, primeiro você criará algumas consultas de previsão singleton para ter uma ideia de como as previsões podem ser diferentes por região.

Para criar uma consulta única em um modelo de agrupamento de sequências

Clique na guia Previsão do Modelo de Mineração do Designer de Mineração de Dados.
No menu de coluna Modelo de Mineração , selecione Singleton Query.

O painel Modelo de Mineração e o painel Entrada de Consulta Singleton são exibidos.
No painel Modelo de Mineração , clique em Selecionar Modelo. (Você pode ignorar esta etapa se o modo de agrupamento de sequência já estiver selecionado.)

A caixa de diálogo Selecionar Modelo de Mineração é aberta.
Expanda o nó que representa a estrutura de mineração Clustering de Sequência com Região e selecione o modelo Clustering de Sequência com Região. Clique em OK. Por enquanto, ignore o painel de entrada; você especificará as entradas depois de configurar as funções de previsão.
Na grade, clique na célula vazia em Origem e selecione Função de Previsão. Na célula em Campo, selecione PredictSequence.

Observação

Você também pode usar a função Predict . Se você fizer isso, escolha a versão da função Predict que usa uma coluna de tabela como argumento.
No painel Modelo de Mineração , selecione a tabela v Assoc Seq Line Itemsaninhada e arraste-a para a grade para a caixa Critérios/Argumento da função PredictSequence .

Arrastar e soltar nomes de tabela e coluna permite criar instruções complexas sem erros de sintaxe. No entanto, ele substitui o conteúdo atual da célula, que inclui outros argumentos opcionais para a função PredictSequence . Para exibir os outros argumentos, você pode adicionar temporariamente uma segunda instância da função à grade para referência.
Clique no botão Resultado no canto superior do Construtor de Consultas de Previsão.

Os resultados esperados contêm uma única coluna com o título Expressão. A coluna Expressão contém uma tabela aninhada com três colunas da seguinte maneira:

$SEQUENCE	Número da Linha	Modelo
1		Montanha-200

O que esses resultados significam? Lembre-se de que você não especificou nenhuma entrada. Portanto, a previsão é feita em relação a toda a população de casos e o Analysis Services retorna a previsão mais provável em geral.

Adicionando entradas a uma consulta de previsão do tipo singleton

Até agora, você não especificou nenhuma entrada. Na próxima tarefa, você usará o painel Entrada de Consulta Singleton para especificar algumas entradas para a consulta. Primeiro, você usará [Região] como entrada para o modelo de agrupamento de sequências regionais, para determinar se as sequências previstas são as mesmas para todas as regiões. Em seguida, você aprenderá a modificar a consulta para adicionar a probabilidade para cada previsão e nivelar os resultados para facilitar a exibição.

Para gerar previsões para um grupo de clientes específico

Clique no botão Design no canto superior esquerdo do Construtor de Consultas de Previsão para voltar para a grade de construção da consulta.
Na caixa de diálogo Entrada de Consulta Singleton, clique na caixa Valor para Region e selecione Europa.
Clique no botão Resultado para exibir previsões para clientes na Europa.
Clique no botão Design no canto superior esquerdo do Construtor de Consultas de Previsão para voltar para a grade de consulta.
Na caixa de diálogo Entrada de Consulta Singleton, clique na caixa Valor referente a Region, e selecione América do Norte.
Clique no botão Resultado para exibir previsões para clientes na América do Norte.

Adicionando probabilidades usando uma expressão personalizada

Gerar a probabilidade para cada previsão é ligeiramente mais complexo, pois a probabilidade é um atributo da previsão e é gerada como uma tabela aninhada. Se você estiver familiarizado com Extensões de Mineração de Dados (DMX), poderá alterar facilmente a consulta para adicionar uma instrução de sub-seleção na tabela aninhada. No entanto, você também pode criar uma instrução de sub-seleção no Construtor de Consultas para Previsão adicionando uma expressão personalizada.

Para gerar probabilidades para uma sequência prevista usando uma expressão personalizada

Clique no botão Design no canto superior esquerdo do Construtor de Consultas de Previsão para retornar à grade de construção da consulta.
Na grade, em Origem, clique em uma nova linha e selecione Expressão Personalizada.
Deixe a caixa sob campo em branco.
Para alias, digite t.
Na caixa Critérios/Argumento, digite a declaração de sub-seleção completa, conforme mostrado no exemplo de código a seguir. Inclua os parênteses iniciais e finais.
```
(SELECT PredictProbability([Model]) FROM PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]))  
```
Clique no botão Resultado para exibir previsões para clientes na Europa.

Os resultados agora contêm duas tabelas aninhadas, uma com a previsão e outra com a probabilidade para a previsão. Se a consulta não funcionar, você poderá alternar para o modo de exibição de design de consulta e examinar a instrução de consulta completa, que deve ser a seguinte:

SELECT  
  PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]),  
  ( (SELECT PredictProbability([Model]) FROM PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]))) as [t]  
FROM  
  [Sequence Clustering with Region]  
NATURAL PREDICTION JOIN  
(SELECT 'Europe' AS [Region]) AS t

Trabalhando com resultados

Quando há muitas tabelas aninhadas nos resultados, talvez você queira nivelar os resultados para facilitar a exibição. Para fazer isso, você pode modificar manualmente a consulta e adicionar a FLATTENED palavra-chave.

Para transformar conjuntos de linhas aninhados em uma forma plana em uma consulta de previsão

Clique no botão Consulta no canto do Construtor de Consultas de Previsão.

A grade é alterada para um painel aberto em que você pode exibir e modificar a instrução DMX criada pelo Construtor de Consultas de Previsão.

Após a SELECT palavra-chave, digite FLATTENED.

O texto completo da consulta deve ser semelhante ao seguinte:

SELECT FLATTENED  
  PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]),  
  ( (SELECT PredictProbability([Model]) FROM PredictSequence([Sequence Clustering with Region].[v Assoc Seq Line Items]))) as [t]  
FROM  
  [Sequence Clustering with Region]  
NATURAL PREDICTION JOIN  
(SELECT 'Europe' AS [Region]) AS t

Clique no botão Resultados no canto superior do Construtor de Consultas de Previsão.

Depois de editar manualmente uma consulta, você não poderá alternar de volta para o modo Design sem perder as alterações. No entanto, você pode salvar a instrução DMX criada manualmente em um arquivo de texto e, em seguida, alterar de volta para o modo design. Quando você faz isso, a consulta é revertida para a última versão válida no modo Design.

Os exemplos anteriores usavam uma coluna da tabela de casos, Região, como entrada para a consulta de previsão singleton, porque você estava interessado em saber se o modelo havia encontrado alguma diferença entre as regiões. No entanto, depois de explorar o modelo, você decidiu que as diferenças não são fortes o suficiente para justificar a personalização das recomendações do produto por região. O que você realmente está interessado em prever são os itens selecionados pelos clientes. Portanto, nas consultas a seguir, você usará o modelo de clustering de sequência que não inclui a Região, para gerar recomendações para todos os clientes.

Usando colunas de tabela aninhadas como entrada

Primeiro, você criará uma consulta de previsão singleton que usa um único item como entrada e retorna o próximo item mais provável. Para obter uma previsão desse tipo, é necessário usar uma coluna de tabela aninhada como valor inserido. Isso acontece porque o atributo que você está tentando prever, chamado Model, faz parte de uma tabela aninhada. O Analysis Services fornece a caixa de diálogo Entrada de Tabela Aninhada para ajudá-lo a criar facilmente consultas de previsão em atributos de tabela aninhadas usando o Construtor de Consultas de Previsão.

Para usar uma tabela aninhada como dados de entrada para uma previsão

Clique no botão Design no canto superior esquerdo do Construtor de Consultas de Previsão para voltar para a grade de consultas.
Na caixa de diálogo Entrada de Consulta Singleton, clique na caixa Valor para Region, e selecione a linha vazia para remover a entrada deste campo.
Na caixa de diálogo Entrada de Consulta Singleton, clique na caixa de Valor para vAssocSeqLineItems, e depois clique no botão (...).
Na caixa de diálogo Entrada da Tabela Aninhada, clique em Adicionar.
Na nova linha, clique na caixa abaixo de Model e selecione Pneu de Turismo na lista. Clique em OK.
Clique no botão Resultado para exibir as previsões.

O modelo recomenda os próximos itens a seguir para todos os clientes que escolherem o Pneu de Touring como o primeiro item. Você já sabe, por explorar o modelo, que os clientes frequentemente compram juntos os produtos Touring Tire e Touring Tire Tube, então essas recomendações parecem adequadas.

$SEQUENCE	Número da Linha	Modelo
1		Tubo de pneu de touring
2		Sport-100
3		Camisa Logotipo Long-Sleeve

Criando uma consulta de previsão em massa usando entradas de tabela aninhadas

Agora que você está satisfeito que o modelo cria o tipo de previsões que você pode usar ao fazer recomendações, você criará uma consulta de previsão mapeada para uma fonte de dados externa. Essa fonte de dados fornecerá valores que representam os produtos atuais. Como você está interessado em criar uma consulta de previsão que forneça a ID do Cliente e uma lista de produtos como entrada, você adicionará a tabela do cliente como a tabela de casos e a tabela de compras como a tabela aninhada. Em seguida, você adicionará funções de previsão como fez anteriormente para criar recomendações.

Este é o mesmo procedimento que você usa para criar previsões para o cenário de cesta de mercado na Lição 3; no entanto, em um modelo de clustering de sequência, as previsões também precisam da ordem como entrada.

Para criar uma consulta de previsão usando entradas de tabela aninhadas

No painel Modelo de Mineração, selecione o modelo de Agrupamento de Sequência, se ele ainda não estiver selecionado.
Na caixa de diálogo Selecionar Tabela de Entrada, clique em Selecionar Tabela de Case.
Na caixa de diálogo Selecionar Tabela , para Fonte de Dados, selecione Pedidos. Na lista Nomes de Tabela/Exibição , selecione vAssocSeqOrders e clique em OK.
Na caixa de diálogo Selecionar Tabela de Entrada , clique em Selecionar Tabela Aninhada.
Na caixa de diálogo Selecionar Tabela , para Fonte de Dados, selecione Pedidos. Na lista de nomes de tabela/visão, selecione vAssocSeqLineItems e clique em OK.

O Analysis Services tentará detectar relações e criá-las automaticamente se os tipos de dados corresponderem e os nomes de coluna forem semelhantes. Se as relações que ele cria estiverem erradas, você poderá clicar com o botão direito do mouse na linha de junção e selecionar Modificar Conexões para editar o mapeamento de coluna ou clicar com o botão direito do mouse na linha de junção e selecionar Excluir para remover a relação completamente. Nesse caso, como as tabelas já estavam unidas na exibição da fonte de dados, essas relações são adicionadas automaticamente ao painel de design.
Adicione uma nova linha à grade. Para a origem, selecione vAssocSeqOrders e, para Campo, selecione CustomerKey.
Adicione uma nova linha à grade. Para a origem, selecione Função de Previsão e, para Campo, selecione PredictSequence.
Arraste vAssocSeqLineItems para a caixa Critérios/Argumento . Clique no final da caixa Critérios/Argumento e digite os seguintes argumentos: 2.

O texto completo na caixa Critérios/Argumento deve ser: [Sequence Clustering].[v Assoc Seq Line Items],2
Clique no botão Resultado para exibir as previsões de cada cliente.

Você concluiu o tutorial sobre modelos de agrupamento de sequências.

Próximas etapas

Se você concluiu todas as seções no Tutorial de Mineração de Dados Intermediário (Analysis Services – Mineração de Dados), a próxima etapa pode ser aprender a usar instruções DMX (Extensões de Mineração de Dados) para criar modelos e gerar previsões. Para obter mais informações, consulte Criando e consultando modelos de mineração de dados com DMX: tutoriais (Analysis Services – Mineração de Dados).

Se você estiver familiarizado com os conceitos de programação, também poderá usar AMO (Objetos de Gerenciamento de Análise) para trabalhar programaticamente com objetos de mineração de dados. Para obter mais informações, consulte Amo Data Mining Classes.

Consulte Também

Exemplos de consulta de modelo de agrupamento de sequência
Conteúdo do modelo de mineração para modelos de agrupamento de sequências (Analysis Services – Mineração de dados)

Last updated on 2017-03-08

Compartilhar via