Comparando previsões para modelos de previsão (Tutorial de mineração de dados intermediário)
Aplicável a: SQL Server 2016 Preview
Nas etapas anteriores deste tutorial, você criou vários modelos de série temporal:
Previsões para cada combinação de região e modelo, com base somente em dados para o modelo e a região individuais.
Previsões para cada região, com base em dados atualizados.
Previsões mundiais para todos os modelos, com base em dados agregados.
Previsões para o modelo M200 na região América do Norte, com base no modelo agregado.
Para resumir os recursos para previsões de série temporal, você revisará as alterações para ser como o uso das opções para estender ou substituir dados afetou os resultados da previsão.
EXTEND_MODEL_CASES
REPLACE_MODEL_CASES
Comparando os resultados originais com os resultados após a adição de dados
Vamos observar os dados apenas da linha de produto M200 na região do Pacífico, para ver como atualizar o modelo com novos dados afeta os resultados. Lembre-se de que a série de dados original terminava em junho de 2004, e nós obtivemos novos dados para julho, agosto e setembro.
A primeira coluna mostra os novos dados que foram adicionados.
A segunda coluna mostra a previsão para julho e posteriormente com base na série de dados original.
A terceira coluna mostra a previsão com base nos dados estendidos.
M200 Pacífico | Dados de vendas reais atualizados | Previsão antes da adição dos dados | Previsão estendida |
---|---|---|---|
7-25-2008 | 65 | 32 | 65 |
8-25-2008 | 54 | 37 | 54 |
9-25-2008 | 61 | 32 | 61 |
10-25-2008 | Sem dados | 36 | 32 |
11-25-2008 | Sem dados | 31 | 41 |
12-25-2008 | Sem dados | 34 | 32 |
Você observará que as previsões que usam os dados estendidos (mostrados aqui em negrito) repetem exatamente os pontos de dados reais. A repetição ocorre por design. Contanto que haja pontos de dados reais para usar, a consulta de previsão retornará os valores reais e mostrará novos valores de previsão somente depois que os novos pontos de dados reais tiverem ficado obsoletos.
Em geral, o algoritmo pondera as alterações nos novos dados mais fortemente do que nos dados iniciais do modelo. Porém, neste caso, os novos números de vendas representam um aumento de apenas 20-30% sobre o período anterior. Então, só houve um pequeno aumento nas vendas projetadas, depois das quais as projeções de vendas caíram novamente, mais alinhados com a tendência dos meses anteriores aos novos dados.
Comparando os resultados originais com os da previsão cruzada
Lembre-se de que o modelo de mineração original revelou grandes diferenças entre as regiões e as linhas de produtos. Por exemplo, as vendas para o modelo M200 foram muito fortes, ao passo que as vendas para o modelo T1000 foram bastante baixas em todas as regiões. Além disso, algumas séries não tinham muitos dados. As séries ficaram em desvantagem, o que significa que não tinham o mesmo ponto de partida.
Então, como as previsões mudaram quando você fez suas projeções com base no modelo geral, que é baseado em vendas mundiais, e não nos conjuntos de dados originais? Para não perder informações nem distorcer as previsões, você pode salvar os resultados a uma tabela, unir a tabela de previsões à tabela de dados históricos, e traçar um gráfico dos dois conjuntos de dados históricos e previsões.
O diagrama a seguir é baseado apenas uma linha de produto, a M200. O gráfico compara as previsões do modelo de mineração inicial com as previsões usando o modelo de mineração agregado.
Neste diagrama, é possível ver que o modelo de mineração agregado preserva a variação e as tendências gerais em valores ao mesmo tempo em que minimiza as flutuações nas séries de dados individuais.
Conclusão
Você aprendeu a criar e personalizar um modelo de série temporal que pode ser usado para previsão.
Você aprendeu atualizar seus modelos de série temporal sem precisar reprocessá-los, adicionando novos dados e criando previsões usando o parâmetro EXTEND_MODEL_CASES.
Você aprendeu a criar modelos que podem ser usados para previsão cruzada, usando o parâmetro REPLACE_MODEL_CASES e aplicando o modelo a uma série de dados diferente.
Consulte também
Tutorial de mineração de dados intermediário & #40. Analysis Services – Data Mining e 41;
Exemplos de consulta de um modelo de série temporal