Compartilhar via


Explorando o modelo de previsão (Tutorial de mineração de dados intermediário)

Agora que você criou o modelo de mineração de previsão, você pode explorar os resultados usando a guia Visualizador de Modelos de Mineração do Designer de Mineração de Dados. O Visualizador de Séries Temporais da Microsoft contém duas guias: Gráficos e Modelo.

Além disso, você pode usar o Visualizador de Árvore Genérica da Microsoft com todos os modelos. Cada exibição apresenta uma imagem ligeiramente diferente das informações no modelo de série temporal.

Guia Gráficos

A guia Gráficos do Visualizador de Séries Temporais da Microsoft mostra graficamente cada uma das séries, incluindo dados históricos e previsões. Cada linha no grafo de série temporal representa uma combinação exclusiva de produto, região e atributo previsível.

A legenda no lado direito do visualizador lista as séries temporais que estão disponíveis, com base nas seleções feitas na lista suspensa. Você pode selecionar e desmarcar as caixas de seleção na legenda para controlar quais séries temporais são exibidas no grafo.

Você também pode alterar as opções de exibição, como as cores usadas para cada série temporal ou se os valores são exibidos em pontos do gráfico.

Para selecionar uma série temporal

  1. Clique na guia Gráficos da guia Visualizador de Modelos de Mineração , se não estiver visível.

  2. Clique na lista suspensa à direita do modo de exibição do gráfico e selecione todas as caixas de seleção. Clique em OK.

    O gráfico agora deve conter 24 linhas de série diferentes.

  3. Nas caixas de seleção à direita do gráfico, desmarque as caixas para ocultar temporariamente as linhas de todas as séries baseadas em Quantidade.

    Agora, desmarque as caixas de seleção relacionadas às bicicletas R750 e R250.

    O gráfico agora contém apenas as seis linhas de série a seguir, para que você possa comparar mais facilmente as tendências das bicicletas M200 e T1000.

    • M200 Europa: Quantidade

    • M200 América do Norte: Quantidade

    • M200 Pacific: Quantidade

    • T1000 Europa: Quantidade

    • T1000 América do Norte: Quantidade

    • T1000 Pacific: Quantidade

Série que prevê a quantidade de M200 e T1000

O gráfico exibido neste visualizador inclui dados históricos e previstos. Os dados previstos são sombreados para diferenciá-los dos dados históricos. Para facilitar a comparação de séries diferentes, você também pode alterar as cores associadas a cada linha no grafo. Para obter mais informações, consulte Alterar as cores usadas no Visualizador de Mineração de Dados.

Nas linhas de tendência, você pode ver que as vendas totais para todas as regiões geralmente estão aumentando, com um pico a cada 12 meses em dezembro. No gráfico, você também pode ver que os dados da bicicleta T1000 começam muito mais tarde do que os dados da outra série de produtos. Isso ocorre porque é um produto mais recente, mas como essa série é baseada em muito menos dados, as previsões podem não ser tão precisas.

Por padrão, cinco etapas de previsão são mostradas para cada série temporal, exibidas como linhas pontilhadas. Você pode alterar esse valor para exibir mais ou menos previsões. Você também pode exibir graficamente o desvio padrão para as previsões adicionando barras de erro ao gráfico.

Para alterar as opções de previsão e exibição na vista de gráfico

  1. Tente alterar o valor das Etapas de Previsão gradualmente, aumentando-o de 5 para 10 e, em seguida, de volta para 6.

    Quando os dados históricos têm grandes flutuações, as flutuações tendem a ser repetidas ou até mesmo amplificadas à medida que você aumenta o número de previsões. Você provavelmente precisa fazer algumas pesquisas neste momento, para entender a causa do grande aumento dos dados históricos e decidir se aceita esses resultados, busca algum tipo de correção nos dados de origem ou aplica algum tipo de suavização no modelo.

  2. Marque a caixa de seleção Mostrar Desvios.

    Essa opção exibe o erro estimado para cada valor previsto.

  3. Observe a escala do eixo X. As alterações nos dados históricos e previstos são sempre expressas como uma porcentagem, mas os valores reais são ajustados automaticamente para ajustar todos os valores ao grafo. Portanto, você precisa ter cuidado ao comparar modelos para não depender apenas de visuais. Para obter o valor exato ou o aumento percentual e o valor das previsões, pause o mouse sobre a linha pontilhada ou linhas sólidas ou clique nas linhas para exibir os valores na Legenda de Mineração.

    Dica: se a Legenda de Mineração não estiver visível, alterne para o modo de exibição Modelo , clique com o botão direito do mouse em qualquer nó e selecione Mostrar Legenda.

Ao examinar essas tendências, você está preocupado com a falta de dados para algumas das séries e se pergunta se você pode obter previsões mais confiáveis com uma média de vendas por modelo ou talvez uma média de vendas por região. Você explorará essa abordagem em uma lição posterior neste tutorial.

Voltar ao topo

Guia Modelo

A guia Modelo do Visualizador de Séries Temporais da Microsoft no Designer de Mineração de Dados permite exibir o modelo de previsão na forma de um grafo de árvore.

Primeiro, observe que, como seus dados descrevem duas medidas diferentes (Quantidade e Quantidade) para vendas de várias linhas de produtos (T1000 etc.) em três regiões diferentes (Europa, América do Norte e Pacífico), o modelo que você criou contém, na verdade, 24 árvores diferentes, cada árvore que representa um modelo dos padrões de vendas para uma combinação diferente de região, produto, e atributo previsível.

Você pode escolher qual combinação de linha de produto, região e métrica de vendas deseja exibir selecionando uma série na lista suspensa Árvore na guia Modelo .

Então, o que você pode aprender exibindo o modelo como uma árvore? Por exemplo, vamos comparar dois modelos, um que tem vários níveis na árvore e outro que tem um único nó.

  • Quando um grafo de árvore contém um único nó, isso significa que a tendência encontrada no modelo é principalmente homogênea ao longo do tempo. Você pode usar esse único nó, rotulado All, para exibir a fórmula que descreve a relação entre as variáveis de entrada e o resultado.

  • Quando um grafo de árvore para uma série temporal possui várias ramificações, significa que a série temporal detectada é muito complexa para ser representada como uma única equação. Em vez disso, o grafo de árvore pode conter várias ramificações, cada uma rotulada com as condições que causaram a divisão da árvore. Quando a árvore é dividida, cada ramificação representa um segmento de tempo diferente, dentro do qual a tendência pode ser descrita como uma única equação.

    Por exemplo, se você olhar para o grafo do gráfico e ver um salto repentino no volume de vendas a partir de setembro e continuar durante um feriado de fim de ano, poderá alternar para o modo de exibição Modelo para ver a data exata em que a tendência mudou. As ramificações na árvore que representam "antes de setembro" e "depois de setembro" conteriam fórmulas diferentes: uma fórmula que descreve matematicamente as tendências de vendas até a divisão, e outra fórmula que descreve as tendências de vendas de setembro até o feriado de fim de ano.

Para explorar a árvore de decisão para um modelo de série temporal

  1. Na lista Árvore na guia Modelo do visualizador, selecione a série T1000 Europa: Quantidade .

    Clique no nó rotulado Tudo.

    Para um nó All, o Tooltip exibido inclui informações como o número de casos em toda a série e equações de séries temporais derivadas da análise dos dados.

  2. Se a Legenda de Mineração não estiver visível, clique com o botão direito do mouse no nó e selecione Mostrar Legenda.

    A Legenda de Mineração fornece a mesma informação que está na Dica de Ferramenta. Se qualquer uma de suas variáveis independentes for discreta, você também verá um histograma que mostra a distribuição de variáveis no nó.

  3. Agora, selecione uma série temporal diferente para exibir. Usando a lista Árvore na guia Modelo do visualizador, selecione a série M200 North America: Amount .

    O grafo de árvore agora contém um nó All e dois nós filhos. Ao examinar os rótulos nos nós filho, você pode entender em que ponto a linha de tendência mudou.

    Para cada nó filho, a descrição na Legenda de Mineração também inclui a contagem de casos em cada ramificação da árvore.

A lista a seguir descreve alguns recursos adicionais no visualizador de árvores:

  • Você pode alterar a variável representada no gráfico usando o controle Background . Por padrão, os nós mais escuros contêm mais casos, pois o valor de Plano de Fundo é definido como População. Para ver quantos casos há em um nó, posicione o mouse sobre um nó para visualizar a Dica de Ferramenta que aparece, ou clique no nó e visualize os números na janela Legenda do Nó.

  • A fórmula de regressão do nó também pode ser exibida na Dica de Ferramenta ou clicando no nó. Se você tiver criado um modelo misto, poderá ver duas fórmulas, uma para ARTXP (nos nós de folha) e outra para ARIMA (no nó raiz da árvore).

  • Os pequenos diamantes são usados em nós que representam números contínuos. O intervalo dos atributos é mostrado na barra na qual o diamante está. O diamante é centralizado na média do nó e a largura do diamante representa a variação do atributo nesse nó.

Voltar ao topo

(Opcional) Visualizador de Árvore de Conteúdo Genérico

Além do visualizador personalizado para série temporal, o Analysis Services fornece o Visualizador de Árvore de Conteúdo MicrosoftGeneric para uso com todos os modelos de mineração de dados. Esse visualizador oferece algumas vantagens:

  • Visualizador de Séries Temporais da Microsoft: essa exibição mescla os resultados dos dois algoritmos. Embora você possa exibir cada série separadamente, não é possível determinar como os resultados de cada algoritmo foram combinados. Além disso, nesse modo de exibição, as Dicas de Ferramentas e a Legenda de Mineração mostram apenas as estatísticas mais importantes.

  • Visualizador de Árvore de Conteúdo Genérico: permite que você navegue e exiba todas as séries de dados que foram usadas no modelo ao mesmo tempo e, se você tiver criado um modelo misto, as árvores ARIMA e ARTXP serão exibidas no mesmo grafo.

    Você pode usar esse visualizador para obter todas as estatísticas de ambos os algoritmos, bem como distribuições dos valores.

    Recomendado para usuários especialistas em mineração de dados que desejam saber mais sobre as análises ARIMA e ARTXP.

Para exibir detalhes de uma série de dados específica no visualizador de conteúdo genérico

  1. Na guia Visualizador do Modelo de Mineração, selecione Visualizador de Árvore de Conteúdo Genérico da Microsoft na lista suspensa Visualizador.

  2. No painel Legenda do Nó, clique no nó mais acima (Todos).

  3. No painel Detalhes do Nó , exiba o valor de ATTRIBUTE_NAME.

    Este valor indica qual série, ou qual combinação de produto e região, está contida neste nó. No exemplo AdventureWorks, o nó mais alto é para a série M200 Europe.

  4. No painel de Legenda do Nó, localize o primeiro nó que possui nós filhos.

    Se um nó de série tiver filhos, a visão de árvore que aparece na guia Modelo do Microsoft Time Series Viewer também terá uma estrutura de ramificação.

  5. Expanda o nó e clique em um dos nós filho.

    A coluna NODE_DESCRIPTION do esquema contém a condição que causou a divisão da árvore.

  6. No painel Legenda do Nó, clique no nó ARIMA superior e expanda-o até que todos os nós filhos fiquem visíveis.

  7. No painel Detalhes do Nó, exiba o valor de ATTRIBUTE_NAME.

    Esse valor informa quais séries temporais estão contidas neste nó. O nó superior na seção ARIMA deve corresponder ao nó superior na seção (Todos). No exemplo AdventureWorks, este nó contém a análise ARIMA da série M200 Europe.

Para obter mais informações, consulte Conteúdo do Modelo de Mineração para Modelos de Série Temporal (Analysis Services – Mineração de Dados).

Voltar ao topo

Próxima tarefa da lição

Criando previsões de série temporal (Tutorial de mineração de dados intermediário)

Consulte Também

Exemplos de consulta de modelo de série temporal
Referência técnica do algoritmo de série temporal da Microsoft