Compartilhar via


Previsões de série temporal usando dados de substituição (Tutorial de mineração de dados intermediários)

Nesta tarefa, você criará um novo modelo com base em dados de vendas em todo o mundo. Em seguida, você criará uma consulta de previsão que aplica o modelo de vendas mundial a uma das regiões individuais.

Criando um modelo geral

Lembre-se de que sua análise dos resultados do modelo de mineração original revelou grandes diferenças entre regiões e entre linhas de produto. Por exemplo, as vendas na América do Norte foram fortes para o modelo M200, enquanto as vendas do modelo T1000 não foram tão bem. No entanto, a análise é complicada pelo fato de que algumas séries não tinham muitos dados ou dados iniciados em um momento diferente. Alguns dados também estavam ausentes.

Série que prevê a quantidade de M200 e T1000

Para resolver alguns dos problemas de qualidade de dados, você decide mesclar os dados de vendas em todo o mundo e usar esse conjunto de tendências gerais de vendas para criar um modelo que possa ser aplicado para prever vendas futuras em qualquer região.

Ao criar previsões, você usará o padrão gerado pelo treinamento em dados de vendas em todo o mundo, mas substituirá os pontos de dados históricos pelos dados de vendas de cada região individual. Dessa forma, a forma da tendência é preservada, mas os valores previstos são alinhados com os números históricos de vendas para cada região e modelo.

Executando previsão cruzada com um modelo de série temporal

O processo de usar dados de uma série para prever tendências em outra série é chamado de previsão cruzada. Você pode usar a previsão cruzada em muitos cenários: por exemplo, você pode decidir que as vendas de televisão são um bom preditor da atividade econômica geral e aplicar um modelo treinado em vendas de televisão a dados econômicos gerais.

No SQL Server Data Mining, você executa a previsão cruzada usando o parâmetro REPLACE_MODEL_CASES dentro dos argumentos para a função , PredictTimeSeries (DMX).

Na próxima tarefa, você aprenderá a usar REPLACE_MODEL_CASES. Você usará os dados de vendas do mundo mesclados para criar um modelo e, em seguida, criará uma consulta de previsão que mapeia o modelo geral para os dados de substituição.

Supõe-se que você já esteja familiarizado com a criação de modelos de mineração de dados e, portanto, as instruções para a criação do modelo foram simplificadas.

Para criar uma estrutura de mineração e um modelo de mineração usando os dados agregados

  1. No Gerenciador de Soluções, clique com o botão direito do mouse em Estruturas de Mineração e selecione Nova Estrutura de Mineração para iniciar o Assistente de Mineração de Dados.

  2. No Assistente de Mineração de Dados, faça as seguintes seleções:

    • Algoritmo: Microsoft Time Series

    • Use a fonte de dados criada anteriormente nesta lição avançada como a origem do modelo. Consulte previsões avançadas de série temporal (Tutorial de mineração de dados intermediários).

      Exibição da fonte de dados: AllRegions

    • Escolha as seguintes colunas para a chave de série e a chave de tempo:

      Hora-chave: ReportingDate

      Chave: Região

    • Escolha as seguintes colunas paraInput:Predict

      SomaQuantidade

      SumAmt

      AvgAmt

      AvgQty

    • Para o nome da estrutura de mineração, digite: All Regions

    • Para o nome do modelo de mineração, digite: All Regions

  3. Processe a nova estrutura e o novo modelo.

Para criar a consulta de previsão e mapear os dados de substituição

  1. Se o modelo ainda não estiver aberto, clique duas vezes na estrutura AllRegions e, no Designer de Mineração de Dados, clique na guia Previsão do Modelo de Mineração .

  2. No painel Modelo de Mineração , o modelo AllRegions já deve estar selecionado. Se ele não estiver selecionado, clique em Selecionar Modelo e selecione o modelo AllRegions.

  3. No painel Selecionar Tabelas de Entrada, clique em Selecionar Tabela de Casos.

  4. Na caixa de diálogo Selecionar Tabela, altere a fonte de dados para a Região do Pacífico T1000 e clique em OK.

  5. Clique com o botão direito do mouse na linha de junção entre o modelo de mineração e os dados de entrada e selecione Modificar Conexões. Mapeie os dados na exibição da fonte de dados para o modelo da seguinte maneira:

    1. Verifique se a coluna ReportingDate no modelo de mineração está mapeada para a coluna ReportingDate nos dados de entrada.

    2. Na caixa de diálogo Modificar Mapeamento, na linha referente à coluna de modelo AvgQty, clique embaixo de Coluna da Tabela e, em seguida, selecione T1000 Pacific.Quantity. Clique em OK.

      Nesta etapa, a coluna que você criou no modelo para prever a quantidade média é mapeada para os dados reais da série T1000 relativos à quantidade de vendas.

    3. Não mapeie a região da coluna no modelo para qualquer coluna de entrada.

      Como o modelo agregou os dados em todas as séries, não há correspondência para os valores da série, como T1000 Pacific, e um erro é gerado quando a consulta de previsão é executada.

  6. Agora você criará a consulta de previsão.

    Primeiro, adicione uma coluna aos resultados que gera o rótulo AllRegions do modelo junto com as previsões. Dessa forma, você sabe que os resultados foram baseados no modelo geral.

    1. Na grade, clique na primeira linha vazia, em Origem e selecione o modelo de mineração AllRegions.

    2. Para Campo, selecione Região.

    3. Para alias, digite Modelo Usado.

  7. Em seguida, adicione outro rótulo aos resultados, para que você possa ver para qual série a previsão é.

    1. Clique em uma linha vazia e, em Origem, selecione Expressão Personalizada.

    2. Na coluna Alias , digite ModelRegion.

    3. Na coluna Critérios/Argumento , digite 'T1000 Pacific'.

  8. Agora você configurará a função de previsão cruzada.

    1. Clique em uma linha vazia e, em Origem, selecione Função de Previsão.

    2. Na coluna Campo , selecione PredictTimeSeries.

    3. Para alias, digite Valores Previstos.

    4. Arraste o campo AvgQty do painel Modelo de Mineração para a coluna Critérios/Argumento usando a operação de arrastar e soltar.

    5. Na coluna Critérios/Argumento , após o nome do campo, digite o seguinte texto: ,5, REPLACE_MODEL_CASES

      O texto completo da caixa de texto Critérios/Argumento deve ser o seguinte: [AllRegions].[AvgQty],5,REPLACE_MODEL_CASES

  9. Clique em Resultados.

Criando a consulta de previsão cruzada no DMX

Talvez você tenha notado um problema com a previsão cruzada: ou seja, para aplicar o modelo geral a uma série de dados diferente, como o modelo de produto T1000 na região da América do Norte, você deve criar uma consulta diferente para cada série, para que você possa mapear cada conjunto de entradas para o modelo.

No entanto, em vez de criar a consulta no designer, você pode alternar para o modo de exibição DMX e editar a instrução DMX que você criou. Por exemplo, a seguinte instrução DMX representa a consulta que você acabou de criar:

SELECT  
      ([All Regions].[Region]) as [Model Used],  
      ('T-1000 Pacific') as [ModelRegion],  
      (PredictTimeSeries([All Regions].[Avg Qty],5, REPLACE_MODEL_CASES)) as [Predicted Quantity]  
     FROM [All Regions]  
PREDICTION JOIN  
    OPENQUERY([Adventure Works DW2003R2], 'SELECT [ReportingDate] FROM  
      (  
       SELECT  ReportingDate, ModelRegion, Quantity, Amount   
       FROM dbo.vTimeSeries   
       WHERE (ModelRegion = N''T1000 Pacific'')  
       ) as [T1000 Pacific]    ')   
    AS t  
ON   
[All Regions].[Reporting Date] = t.[ReportingDate]   
AND   
[All Regions].[Avg Qty] = t.[Quantity]  

Para aplicar isso a um modelo diferente, basta editar a instrução de consulta para substituir a condição de filtro e atualizar os rótulos associados a cada resultado.

Por exemplo, se você alterar as condições de filtro e os rótulos de coluna substituindo 'Pacific' por 'América do Norte', você obterá previsões para o produto T1000 na América do Norte, com base nos padrões no modelo geral.

Próxima tarefa da lição

Comparando previsões para modelos de previsão (Tutorial de mineração de dados intermediário)

Consulte Também

Exemplos de consulta de modelo de série temporal
PredictTimeSeries (DMX)