Compartilhar via


Comparando previsões para modelos de previsão (Tutorial de mineração de dados intermediário)

 

Aplicável a: SQL Server 2016 Preview

Nas etapas anteriores deste tutorial, você criou vários modelos de série temporal:

  • Previsões para cada combinação de região e modelo, com base somente em dados para o modelo e a região individuais.

  • Previsões para cada região, com base em dados atualizados.

  • Previsões mundiais para todos os modelos, com base em dados agregados.

  • Previsões para o modelo M200 na região América do Norte, com base no modelo agregado.

Para resumir os recursos para previsões de série temporal, você revisará as alterações para ser como o uso das opções para estender ou substituir dados afetou os resultados da previsão.

EXTEND_MODEL_CASES

REPLACE_MODEL_CASES

Comparando os resultados originais com os resultados após a adição de dados

Vamos observar os dados apenas da linha de produto M200 na região do Pacífico, para ver como atualizar o modelo com novos dados afeta os resultados. Lembre-se de que a série de dados original terminava em junho de 2004, e nós obtivemos novos dados para julho, agosto e setembro.

  • A primeira coluna mostra os novos dados que foram adicionados.

  • A segunda coluna mostra a previsão para julho e posteriormente com base na série de dados original.

  • A terceira coluna mostra a previsão com base nos dados estendidos.

M200 Pacífico Dados de vendas reais atualizados Previsão antes da adição dos dados Previsão estendida
7-25-2008 65 32 65
8-25-2008 54 37 54
9-25-2008 61 32 61
10-25-2008 Sem dados 36 32
11-25-2008 Sem dados 31 41
12-25-2008 Sem dados 34 32

Você observará que as previsões que usam os dados estendidos (mostrados aqui em negrito) repetem exatamente os pontos de dados reais. A repetição ocorre por design. Contanto que haja pontos de dados reais para usar, a consulta de previsão retornará os valores reais e mostrará novos valores de previsão somente depois que os novos pontos de dados reais tiverem ficado obsoletos.

Em geral, o algoritmo pondera as alterações nos novos dados mais fortemente do que nos dados iniciais do modelo. Porém, neste caso, os novos números de vendas representam um aumento de apenas 20-30% sobre o período anterior. Então, só houve um pequeno aumento nas vendas projetadas, depois das quais as projeções de vendas caíram novamente, mais alinhados com a tendência dos meses anteriores aos novos dados.

Comparando os resultados originais com os da previsão cruzada

Lembre-se de que o modelo de mineração original revelou grandes diferenças entre as regiões e as linhas de produtos. Por exemplo, as vendas para o modelo M200 foram muito fortes, ao passo que as vendas para o modelo T1000 foram bastante baixas em todas as regiões. Além disso, algumas séries não tinham muitos dados. As séries ficaram em desvantagem, o que significa que não tinham o mesmo ponto de partida.

Séries que preveem a quantidade M200 e T1000

Então, como as previsões mudaram quando você fez suas projeções com base no modelo geral, que é baseado em vendas mundiais, e não nos conjuntos de dados originais? Para não perder informações nem distorcer as previsões, você pode salvar os resultados a uma tabela, unir a tabela de previsões à tabela de dados históricos, e traçar um gráfico dos dois conjuntos de dados históricos e previsões.

O diagrama a seguir é baseado apenas uma linha de produto, a M200. O gráfico compara as previsões do modelo de mineração inicial com as previsões usando o modelo de mineração agregado.

Gráfico do Excel comparando previsões

Neste diagrama, é possível ver que o modelo de mineração agregado preserva a variação e as tendências gerais em valores ao mesmo tempo em que minimiza as flutuações nas séries de dados individuais.

Conclusão

Você aprendeu a criar e personalizar um modelo de série temporal que pode ser usado para previsão.

Você aprendeu atualizar seus modelos de série temporal sem precisar reprocessá-los, adicionando novos dados e criando previsões usando o parâmetro EXTEND_MODEL_CASES.

Você aprendeu a criar modelos que podem ser usados para previsão cruzada, usando o parâmetro REPLACE_MODEL_CASES e aplicando o modelo a uma série de dados diferente.

Consulte também

Tutorial de mineração de dados intermediário & #40. Analysis Services – Data Mining e 41;
Exemplos de consulta de um modelo de série temporal