Mineração de Conteúdo de Modelos para Séries Temporais (Serviços de Análise - Mineração de Dados)

Aplica-se a: SQL Server 2019 e anteriores Analysis Services Azure Analysis Services Fabric/Power BI Premium

Importante

A mineração de dados foi preterida no SQL Server 2017 Analysis Services e agora descontinuada no SQL Server 2022 Analysis Services. A documentação não é atualizada para recursos preteridos e descontinuados. Para saber mais, consulte Compatibilidade com versões anteriores do Analysis Services.

Todos os modelos de mineração usam a mesma estrutura para armazenar o seu conteúdo. Esta estrutura é definida de acordo com o conjunto de linhas do esquema de conteúdo de mineração de dados. No entanto, dentro dessa estrutura padrão, os nós que contêm informação estão organizados de formas diferentes para representar vários tipos de árvores. Este tópico descreve como os nós estão organizados e o que cada nó significa, para a mineração de modelos baseados no algoritmo Microsoft Time Series.

Para uma explicação do conteúdo geral dos modelos de mineração que se aplica a todos os tipos de modelos, veja Conteúdo do Modelo de Mineração (Serviços de Análise - Mineração de Dados).

Ao rever este tema, pode achar útil acompanhar o conteúdo de um modelo de séries temporais. Pode criar um modelo de séries temporais completando o tutorial de Mineração Básica de Dados. O modelo que crias no tutorial é um modelo misto que treina dados usando tanto os algoritmos ARIMA como ARTXP. Para informações sobre como visualizar o conteúdo de um modelo de mineração, consulte Visualizadores de Modelos de Mineração de Dados.

Compreender a Estrutura de um Modelo de Séries Temporais

Um modelo de série temporal tem um único nó parental que representa o modelo e os seus metadados. Por baixo desse nó pai, existem uma ou duas árvores de séries temporais, dependendo do algoritmo que utilizaste para criar o modelo.

Se criares um modelo misto, são adicionadas duas árvores separadas ao modelo, uma para ARIMA e outra para ARTXP. Se optar por usar apenas o algoritmo ARTXP ou apenas o algoritmo ARIMA, terá uma única árvore que corresponde a esse algoritmo. Especifica qual o algoritmo a usar definindo o parâmetro FORECAST_METHOD. Para mais informações sobre se deve usar ARTXP, ARIMA ou um modelo misto, consulte Microsoft Time Series Algorithm.

O diagrama seguinte mostra um exemplo de um modelo de mineração de dados de séries temporais criado com as definições padrão, para criar um modelo misto. Para que possa comparar mais facilmente as diferenças entre os dois modelos, aqui o modelo ARTXP é mostrado no lado esquerdo do diagrama e o modelo ARIMA está mostrado no lado direito do diagrama. Enquanto o ARTXP é uma estrutura semelhante a uma árvore que se divide em ramos cada vez menores, a estrutura criada pelo algoritmo ARIMA é mais parecida com uma pirâmide construída para cima a partir de componentes menores.

Estrutura do conteúdo do modelo para modelos de séries temporais

O ponto importante a lembrar é que a informação está organizada dentro das árvores ARIMA e ARTXP de formas completamente diferentes, e deve considerar as duas árvores como relacionadas apenas no nó raiz. Embora as duas representações sejam apresentadas num único modelo por conveniência, devem ser tratadas como dois modelos independentes. O ARTXP representa uma estrutura em árvore real, mas o ARIMA não.

Quando utiliza o Microsoft Generic Model Content Tree Viewer para visualizar um modelo que utiliza tanto ARIMA como ARTXP, os nós dos modelos ARTXP e ARIMA são todos apresentados como nós filhos do modelo de série temporal parental. No entanto, é fácil distingui-los pelas etiquetas aplicadas aos nós.

  • O primeiro conjunto de nós é rotulado (Todos) e representa os resultados da análise pelo algoritmo ARTSP.

  • O segundo conjunto de nós é rotulado como ARIMA e representa os resultados da análise pelo algoritmo ARIMA.

Advertência

O nome (All) na árvore ARTXP é mantido apenas para compatibilidade retroativa. Antes do SQL Server 2008, o algoritmo Time Series utilizava um único algoritmo para análise, o algoritmo ARTXP.

As secções seguintes explicam como os nós estão organizados dentro de cada um destes tipos de modelo.

Estrutura de um Modelo ARTXP

O algoritmo ARTXP cria um modelo semelhante a um modelo de árvores de decisão. Agrupa atributos previsíveis e divide-os sempre que são encontradas diferenças significativas. Portanto, cada modelo ARTXP contém um ramo separado para cada atributo previsível. Por exemplo, o tutorial de Mineração Básica de Dados cria um modelo que prevê o montante de vendas para várias regiões. Neste caso, [Quantidade] é o atributo previsível e é criado um ramo separado para cada região. Se tivesses dois atributos previsíveis, [Quantidade] e [Quantidade], seria criado um ramo separado para cada combinação de um atributo e uma região.

O nó superior para o ramo ARTXP contém a mesma informação que está num nó raiz da árvore de decisão. Isto inclui o número de filhos deste nó (CHILDREN_CARDINALITY), o número de casos que cumprem as condições deste nó (NODE_SUPPORT) e uma variedade de estatísticas descritivas (NODE_DISTRIBUTION).

Se o nó não tiver filhos, isso significa que não foram encontradas condições significativas que justificassem a divisão dos casos em subgrupos adicionais. O ramo termina neste ponto e o nó é denominado nó folha. O nó folha contém os atributos, coeficientes e valores que são os blocos de construção da fórmula ARTXP.

Alguns ramos podem ter divisões adicionais, semelhantes a um modelo de árvores de decisão. Por exemplo, o ramo da árvore que representa as vendas para a região da Europa divide-se em dois ramos. Ocorre uma divisão quando se encontra uma condição que causa uma diferença significativa entre os dois grupos. O nó pai indica-lhe o nome do atributo que causou a divisão, como [Quantidade], e quantos casos existem no nó pai. Os nós folha fornecem mais detalhes: o valor do atributo, como [Vendas] >10.000 vs. [Vendas] < 10.000), o número de casos que suportam cada condição e a fórmula ARTXP.

Observação

Se quiser ver as fórmulas, pode encontrar a fórmula de regressão completa ao nível do nó folha, mas não num nó intermédio ou raiz.

Estrutura de um Modelo ARIMA

O algoritmo ARIMA cria uma única peça de informação para cada combinação de uma série de dados (como [Região]) e um atributo previsível (como [Montante das Vendas]) — a equação que descreve a mudança do atributo previsível ao longo do tempo.

A equação para cada série é derivada de múltiplos componentes, um para cada estrutura periódica encontrada nos dados. Por exemplo, se tiver dados de vendas recolhidos mensalmente, o algoritmo pode detetar estruturas periódicas mensais, trimestrais ou anuais.

O algoritmo gera um conjunto distinto de nós parentais e nós filhos para cada periodicidade que identifica. A periodicidade padrão é 1, para uma única fatia de tempo, e é automaticamente adicionada a todos os modelos. Pode especificar estruturas periódicas possíveis introduzindo múltiplos valores no parâmetro PERIODICITY_HINT. No entanto, se o algoritmo não detetar uma estrutura periódica, não gerará resultados para essa sugestão.

Cada estrutura periódica que é produzida pelo modelo contém os seguintes nós componentes:

  • Um nó para o parâmetro de ordem autorregressiva (AR)

  • Um nó para a média móvel (MA)

Para informações sobre o significado destes termos, consulte Microsoft Time Series Algorithm.

A ordem das diferenças é uma parte importante da fórmula e é representada na equação. Para mais informações sobre como a ordem de diferença é utilizada, consulte a Referência Técnica do Algoritmo de Séries Temporais da Microsoft.

Conteúdo de Modelos para Séries Temporais

Esta secção fornece detalhes e exemplos apenas para as colunas no conteúdo do modelo de mineração que têm relevância particular para modelos de séries temporais.

Para informações sobre colunas de uso geral no conjunto de linhas do esquema, como MODEL_CATALOG e MODEL_NAME, ou para explicações da terminologia dos modelos de mineração, consulte Mining Model Content (Serviços de Análise - Data Mining).

CATÁLOGO_DE_MODELOS
Nome da base de dados onde o modelo está armazenado.

MODEL_NAME
Nome do modelo.

ATTRIBUTE_NAME
O atributo previsível para a série de dados representada no nó. (O mesmo valor que para MSOLAP_MODEL_COLUMN.)

NODE_NAME
O nome do nó.

Atualmente, esta coluna contém o mesmo valor que NODE_UNIQUE_NAME, embora isso possa mudar em futuras versões.

NODE_UNIQUE_NAME
O nome exclusivo do nó. O nó pai modelo é sempre chamado TS.

ARTXP: Cada nó é representado por TS seguido de um valor numérico hexadecimal. A ordem dos nós é irrelevante.

Por exemplo, os nós ARTXP diretamente sob a árvore TS podem ser numerados TS00000001-TS0000000b.

ARIMA: Cada nó numa árvore ARIMA é representado por TA seguido de um valor numérico hexadecimal. Os nós filhos contêm o nome único do nó pai, seguido de outro número hexadecimal que indica a posição na sequência de nós.

Todas as árvores ARIMA estão estruturadas exatamente da mesma forma. Cada raiz contém os nós e a convenção de nomenclatura exemplificados na tabela seguinte:

ID e tipo de nó ARIMA Exemplo de nome de nó
ARIMA Root (27) TA0000000b
Estrutura Periódica ARIMA (28) TA0000000b00000000
ARIMA Auto Regressivo (29) TA00000000b00000000
Média Móvel ARIMA (30) TA0000000b000000001

NODE_TYPE
Um modelo de série temporal produz os seguintes tipos de nós, dependendo do algoritmo.

ARTXP:

ID de Tipo de Nó Description
1 (Modelo) Séries cronológicas
3 (Interior) Representa um ramo interior dentro de uma árvore de séries temporais ARTXP.
16 (Árvore da série temporal) Raiz da árvore ARTXP que corresponde a um atributo e série previsíveis.
15 (série temporal) Folha do nó na árvore ARTXP.

ARIMA:

ID de Tipo de Nó Description
27 (Raiz ARIMA) O nó superior de uma árvore ARIMA.
28 (Estrutura Periódica ARIMA) Componente de uma árvore ARIMA que descreve uma única estrutura periódica.
29 (ARIMA Autoregressivo) Contém um coeficiente para uma única estrutura periódica.
30 (Média Móvel ARIMA) Contém um coeficiente para uma única estrutura periódica.

NODE_CAPTION
Um rótulo ou uma legenda associados ao nó.

Esta propriedade é principalmente para fins de exibição.

ARTXP: Contém a condição de divisão do nó, apresentada como uma combinação de um atributo e um intervalo de valores.

ARIMA: Contém a forma abreviada da equação ARIMA.

Para informações sobre o formato da equação ARIMA, veja Mining Legend for ARIMA.

CARDINALIDADE_FILHOS
O número de filhos diretos que o nó tem.

PARENT_UNIQUE_NAME
O nome único do progenitor do nó. NULL é devolvido para quaisquer nós ao nível de raiz.

NODE_DESCRIPTION
Uma descrição em texto das regras, divisões ou fórmulas no nó atual.

ARTXP: Para mais informações, consulte Compreender a Árvore ARTXP.

ARIMA: Para mais informações, consulte Compreender a Árvore ARIMA.

NODE_RULE
Descrição em formato XML das regras, divisões ou fórmulas no nó atual.

ARTXP: A NODE_RULE corresponde geralmente à NODE_CAPTION.

ARIMA: Para mais informações, consulte Compreender a Árvore ARIMA.

MARGINAL_RULE
Uma descrição XML da divisão ou conteúdo específico desse nó.

ARTXP: O MARGINAL_RULE corresponde geralmente ao NODE_DESCRIPTION.

ARIMA: Sempre em branco; Usa NODE_RULE em vez disso.

NODE_PROBABILITY
ARTXP: Para os nós de árvore, é sempre 1. Para nós folha, a probabilidade de alcançar o nó a partir do nó raiz do modelo.

ARIMA: Sempre 0.

PROBABILIDADE_MARGINAL
ARTXP: Para nós de árvore, sempre 1. Para nós folha, a probabilidade de chegar ao nó a partir do nó pai imediato.

ARIMA: Sempre 0.

NODE_DISTRIBUTION
Uma tabela que contém o histograma de probabilidade do nó. Num modelo de séries temporais, esta tabela aninhada contém todos os componentes necessários para montar a fórmula real de regressão.

Para mais informações sobre a tabela de distribuição de nós numa árvore ARTXP, consulte Compreender a Árvore ARTXP.

Para mais informações sobre a tabela de distribuição de nós numa árvore ARIMA, veja Compreender a Árvore ARIMA.

Se quiser ver todas as constantes e outros componentes compostos num formato legível, utilize o Visualizador de Séries Temporais, clique no nó e abra a Lenda da Mineração.

NODE_SUPPORT
O número de casos que dão suporte a este nó.

ARTXP: Para o nó (Todos ), indica o número total de fatias temporais incluídas no ramo.

Para nodos terminais, indica o número de intervalos de tempo incluídos no intervalo descrito por NODE_CAPTION. O número de fatias temporais nos nós terminais é sempre igual ao valor NODE_SUPPORT do nó ramo (Todos).

ARIMA: Uma contagem de casos que suportam a estrutura periódica atual. O valor de suporte é repetido em todos os nós da estrutura periódica atual.

MSOLAP_MODEL_COLUMN
O atributo previsível para a série de dados representada no nó. (O mesmo valor que para ATTRIBUTE_NAME.)

MSOLAP_NODE_SCORE
Um valor numérico que caracteriza o valor de informação da árvore ou divisão.

ARTXP: O valor é sempre 0,0 para nós sem divisão. Para nós que possuem uma divisão, o valor representa a pontuação de interessante da divisão.

Para mais informações sobre métodos de pontuação, consulte Seleção de Características (Mineração de Dados).

ARIMA: A pontuação do Critério de Informação Bayesiano (BIC) do modelo ARIMA. A mesma pontuação é atribuída a todos os nós ARIMA relacionados com a equação.

MSOLAP_NODE_SHORT_CAPTION
ARTXP: A mesma informação do NODE_DESCRIPTION.

ARIMA: Mesma informação que a NODE_CAPTION: ou seja, a forma curta da equação ARIMA.

Compreensão da Árvore ARTXP

O modelo ARTXP separa claramente as áreas dos dados que são lineares das áreas dos dados que se dividiram por algum outro fator. Sempre que as alterações no atributo previsível podem ser representadas diretamente como função das variáveis independentes, calcula-se uma fórmula de regressão para representar essa relação

Por exemplo, se houver uma correlação direta entre tempo e vendas para a maioria das séries de dados, cada série estaria contida numa árvore de séries temporais (NODE_TYPE =16) que não tem nós filhos para cada série de dados, apenas uma equação de regressão. No entanto, se a relação não for linear, uma árvore de séries temporais ARTXP pode dividir as condições em nós filhos, tal como um modelo de árvore de decisão. Ao visualizar o conteúdo do modelo no Microsoft Generic Content Tree Viewer , pode ver onde ocorrem as divisões e como isso afeta a linha de tendência.

Para compreender melhor este comportamento, pode consultar o modelo de séries temporais criado no Tutorial Básico de Mineração de Dados. Este modelo, baseado no armazém de dados AdventureWorks, não utiliza dados particularmente complexos. Portanto, não existem muitas divisões na árvore ARTXP. No entanto, mesmo este modelo relativamente simples ilustra três tipos diferentes de divisão:

  • A linha de tendência [Quantidade] para a região do Pacífico divide-se na chave temporal. Uma divisão na chave de tempo significa que há uma mudança na tendência num determinado momento. A linha de tendência era linear apenas até certo ponto, e depois a curva assumia uma forma diferente. Por exemplo, uma série temporal pode continuar até 6 de agosto de 2002, e outra série temporal começa após essa data.

  • A linha de tendência [Quantidade] para a região da América do Norte divide-se em função de outra variável. Neste caso, a tendência para a América do Norte divide-se com base no valor do mesmo modelo na região europeia. Por outras palavras, o algoritmo detetou que, quando o valor da Europa muda, o valor da América do Norte A também muda.

  • A linha de tendência para a região da Europa divide-se sobre si mesma.

O que significa cada divisão? Interpretar a informação transmitida pelo conteúdo do modelo é uma arte que exige uma compreensão profunda dos dados e do seu significado no contexto empresarial.

  • A aparente ligação entre as tendências das regiões da América do Norte e da Europa pode significar apenas que a série de dados para a Europa tem mais entropia, o que faz com que a tendência da América do Norte pareça mais fraca. Ou pode não haver diferença significativa na pontuação entre os dois, e a correlação pode ser acidental, baseada simplesmente no cálculo da Europa antes do cálculo da América do Norte. No entanto, pode querer rever os dados e garantir se a correlação é falsa, ou investigar se algum outro fator pode estar envolvido.

  • A divisão na chave de tempo significa que há uma alteração estatisticamente significativa no gradiente da linha. Isto pode ter sido causado por fatores matemáticos como o suporte para cada intervalo, ou os cálculos de entropia necessários para a divisão. Assim, esta divisão pode não ser interessante em termos do significado do modelo no mundo real. No entanto, ao rever o período de tempo indicado na divisão, pode encontrar correlações interessantes que não estão representadas nos dados, como uma promoção de vendas ou outro evento que começou nessa altura e que pode ter afetado os dados.

Se os dados contivessem outros atributos, muito provavelmente verias exemplos mais interessantes de ramificação na árvore. Por exemplo, se acompanhasse informação meteorológica e usasse isso como atributo para análise, poderia ver múltiplas divisões na árvore que representam a complexa interação entre vendas e meteorologia.

Em suma, a mineração de dados é útil para fornecer pistas sobre onde ocorrem fenómenos potencialmente interessantes, mas é necessária uma investigação mais aprofundada e a experiência dos utilizadores empresariais para interpretar com precisão o valor da informação no contexto.

Elementos da Fórmula da Série Temporal ARTXP

Para ver a fórmula completa de uma árvore ou ramo ARTXP, recomendamos que utilize a Lenda de Mineração do Microsoft Time Series Viewer, que apresenta todas as constantes num formato legível.

A secção seguinte apresenta uma equação de exemplo e explica os termos básicos.

Lenda da Mineração para uma Fórmula ARTXP

O exemplo seguinte mostra a fórmula ARTXP para uma parte do modelo, conforme apresentado na Lenda da Mineração. Para visualizar esta fórmula, abra o modelo [Previsão] que criou no Tutorial Básico de Mineração de Dados no visualizador Microsoft Time Series, clique no separador Modelo e selecione a árvore da série de dados R250: Europa.

Para ver a equação usada neste exemplo, clique no nó que representa a série de datas em ou após 7/5/2003.

Exemplo de uma equação de nó de árvore:

Quantity = 21.322 -0.293 * Quantity(R250 North America,-7) + 0.069 * Quantity(R250 Europe,-1) + 0.023 * Quantity(R250 Europe,-3) -0.142 * Quantity(R750 Europe,-8)

Neste caso, o valor 21,322 representa o valor previsto para a Quantidade em função dos seguintes elementos da equação.

Por exemplo, um elemento é Quantity(R250 North America,-7). Esta notação representa a quantidade para a região da América do Norte em t-7, ou sete divisões de tempo antes da divisão de tempo atual. O valor desta série de dados é multiplicado pelo coeficiente -0,293. O coeficiente para cada elemento é derivado durante o processo de treino e baseia-se em tendências dos dados.

Existem múltiplos elementos nesta equação porque o modelo calculou que a quantidade do modelo R250 na região da Europa depende dos valores de várias outras séries de dados.

Modelo de Conteúdo para uma Fórmula ARTXP

A tabela seguinte mostra a mesma informação para a fórmula, utilizando o conteúdo do nó relevante tal como apresentado no Microsoft Generic Content Tree Viewer (Data Mining).

ATTRIBUTE_NAME ATTRIBUTE_VALUE SUPORTE PROBABILIDADE VARIÂNCIA VALUETYPE
Quantidade (R250 Europa, interceção em Y) 21.3223433563772 11 0 1.65508795539661 11 (Interceção)
Quantidade (R250 Europa,-1) 0.0691694140876526 0 0 0 7 (Coeficiente)
Quantidade (R250 Europa,-1) 20.6363635858123 0 0 182.380682874818 9 (Estatísticas)
Quantidade (R750 Europa,-8) -0.1421203048299 0 0 0 7 (Coeficiente)
Quantidade (R750 Europa,-8) 22.5454545333019 0 0 104.362130048408 9 (Estatísticas)
Quantidade (R250 Europa,-3) 0.0234095979448281 0 0 0 7 (Coeficiente)
Quantidade (R250 Europa,-3) 24.8181818883176 0 0 176.475304989169 9 (Estatísticas)
Quantidade (R250 América do Norte,-7) -0.292914186039869 0 0 0 7 (Coeficiente)
Quantidade (R250 América do Norte,-7) 10.36363640433 0 0 701.882534898676 9 (Estatísticas)

Como se pode ver ao comparar estes exemplos, o conteúdo do modelo de mineração contém a mesma informação disponível na Lenda de Mineração, mas com colunas adicionais para variação e suporte. O valor de suporte indica a contagem de casos que suportam a tendência descrita por esta equação.

Usando a Fórmula da Série Temporal ARTXP

Para a maioria dos utilizadores empresariais, o valor do conteúdo do modelo ARTXP é que combina tanto uma vista em árvore como uma representação linear dos dados.

  • Se as alterações no atributo previsível puderem ser representadas como uma função linear das variáveis independentes, o algoritmo calculará automaticamente a equação de regressão e gerará essa série num nó separado

  • Sempre que a relação não pode ser expressa como uma correlação linear, a série temporal ramifica-se como uma árvore de decisão.

Ao navegar pelo conteúdo dos modelos no Microsoft Time Series Viewer , pode ver onde ocorre a divisão e como afeta a linha de tendência.

Se existir uma correlação direta entre o tempo e as vendas para qualquer parte da série de dados, a forma mais fácil de obter a fórmula é copiá-la da Lenda da Mineração e depois colá-la num documento ou apresentação para ajudar a explicar o modelo. Em alternativa, pode extrair a média, o coeficiente e outras informações da tabela NODE_DISTRIBUTION dessa árvore e usá-las para calcular extensões da tendência. Se toda a série apresentar uma relação linear consistente, a equação está contida no nó (All). Se houver alguma ramificação na árvore, a equação está contida no nó folha.

A consulta seguinte devolve todos os nós folha ARTXP de um modelo de mineração, juntamente com a tabela aninhada, NODE_DISTRIBUTION, que contém a equação.

SELECT MODEL_NAME, ATTRIBUTE_NAME, NODE_NAME,  
NODE_CAPTION,   
(SELECT ATTRIBUTE_NAME, ATTRIBUTE_VALUE, [VARIANCE], VALUETYPE  
FROM NODE_DISTRIBUTION) as t  
FROM Forecasting.CONTENT  
WHERE NODE_TYPE = 15  

Compreender a Árvore ARIMA

Cada estrutura num modelo ARIMA corresponde a uma estrutura de periodicidade ou periódica. Uma estrutura periódica é um padrão de dados que se repete ao longo da série de dados. É permitida alguma pequena variação no padrão, dentro de limites estatísticos. A periodicidade é medida de acordo com as unidades de tempo padrão utilizadas nos dados de treino. Por exemplo, se os dados de treino fornecem dados de vendas para cada dia, a unidade de tempo padrão é um dia, e todas as estruturas periódicas são definidas como um número especificado de dias.

Cada período detetado pelo algoritmo recebe o seu próprio nó estrutural. Por exemplo, se estiver a analisar dados diários de vendas, o modelo pode detetar estruturas periódicas que representam semanas. Neste caso, o algoritmo criará duas estruturas periódicas no modelo finalizado: uma para o período diário padrão, denotada como {1}, e outra para semanas, indicada por {7}.

Por exemplo, a consulta seguinte devolve todas as estruturas ARIMA de um modelo de mineração.

SELECT MODEL_NAME, ATTRIBUTE_NAME, NODE_NAME, NODE_CAPTION  
FROM Forecasting.CONTENT  
WHERE NODE_TYPE = 27  

Exemplos de resultados:

MODEL_NAME ATTRIBUTE_NAME NODE_NAME NODE_TYPE NODE_CAPTION
Forecasting M200 Europa: Quantidade TA00000000 27 ARIMA (1,0,1)
Forecasting M200 América do Norte: Quantidade TA00000001 27 ARIMA (1,0,4) X (1,1,4)(6)
Forecasting M200 Pacific: Quantidade TA00000002 27 ARIMA (2,0,8) X (1,0,0)(4)
Forecasting M200 Pacific: Quantidade TA00000002 27 ARIMA (2,0,8) X (1,0,0)(4)
Forecasting R250 Europa: Quantidade TA00000003 27 ARIMA (1,0,7)
Forecasting R250 América do Norte: Quantidade TA00000004 27 ARIMA (1,0,2)
Forecasting R250 Pacific: Quantidade TA00000005 27 ARIMA (2,0,2) X (1,1,2)(12)
Forecasting R750 Europa: Quantidade TA00000006 27 ARIMA (2,1,1) X (1,1,5)(6)
Forecasting T1000 Europa: Quantidade TA00000009 27 ARIMA (1,0,1)
Forecasting T1000 América do Norte: Quantidade TA00000000a 27 ARIMA (1,1,1)
Forecasting T1`000 Pacífico: Quantidade TA0000000b 27 ARIMA (1,0,3)

A partir destes resultados, que também pode consultar usando o Microsoft Generic Content Tree Viewer (Data Mining), pode perceber rapidamente quais as séries que são completamente lineares, quais têm múltiplas estruturas periódicas e quais são as periodicidades descobertas.

Por exemplo, a forma curta da Equação ARIMA para a série M200 Europe indica que apenas o ciclo padrão, ou diário, foi detetado. A forma abreviada da equação é fornecida na coluna NODE_CAPTION.

No entanto, para a série M200 América do Norte, foi encontrada uma estrutura periódica adicional. O nó TA00000001 tem dois nós filhos, um com a equação (1,0,4) e outro com a equação (1,1,4)(6). Estas equações são concatenadas e apresentadas no nó pai.

Para cada estrutura periódica, o conteúdo do modelo também fornece a ordem e a média móvel como nós filhos. Por exemplo, a consulta seguinte recupera os nós filhos de um dos nós listados no exemplo anterior. Note que a coluna, PARENT_UNIQUE_NAME, deve estar entre parênteses para a distinguir da palavra-chave reservada com o mesmo nome.

SELECT *   
FROM Forecasting.CONTENT  
WHERE [PARENT_UNIQUE_NAME] = ' TA00000001'  

Como esta é uma árvore ARIMA, e não uma árvore ARTXP, não pode usar a função IsDescendant (DMX) para devolver os nós filhos desta estrutura periódica. Em vez disso, pode usar os tipos de atributos e nós para filtrar os resultados e devolver os nós filhos que fornecem mais detalhes sobre como a equação foi construída, incluindo as médias móveis e a ordem das diferenças.

SELECT MODEL_NAME, ATTRIBUTE_NAME, NODE_UNIQUE_NAME,  
NODE_TYPE,  NODE_CAPTION  
FROM Forecasting.CONTENT  
WHERE [MSOLAP_MODEL_COLUMN] ='M200 North America:Quantity'  
AND (NODE_TYPE = 29 or NODE_TYPE = 30)  

Exemplos de resultados:

MODEL_NAME ATTRIBUTE_NAME NODE_UNIQUE_NAME NODE_TYPE NODE_CAPTION
Forecasting M200 América do Norte: Quantidade TA00000001000000010 29 ARIMA {1,0.961832044807041}
Forecasting M200 América do Norte: Quantidade TA00000001000000011 30 ARIMA {1,-3,51073103693271E-02,2,2,15731642954099,-0,22031433327742,-1,33151478258758}
Forecasting M200 América do Norte: Quantidade TA00000001000000000 29 ARIMA {1,0.643565911081657}
Forecasting M200 América do Norte: Quantidade TA00000001000000001 30 ARIMA {1,1,1,45035399809581E-02,-4,40489283927752E-02,-0,19203901352577,0,242202497643993}

Estes exemplos ilustram que quanto mais se aprofunda a árvore ARIMA, mais detalhes são revelados, mas a informação importante é combinada e apresentada também no nó pai.

Fórmula de Séries Temporais para ARIMA

Para visualizar a fórmula completa de qualquer nó ARIMA, recomendamos que utilize a Lenda de Mineração do Microsoft Time Series Viewer, que apresenta a ordem autorregressiva, médias móveis e outros elementos da equação já compostos num formato consistente.

Esta secção apresenta uma equação de exemplo e explica os termos básicos.

Lenda da Mineração para a Fórmula ARIMA

O exemplo seguinte mostra a fórmula ARIMA para uma parte do modelo, conforme mostrada na Lenda da Mineração. Para visualizar esta fórmula, abra o modelo de Previsão usando o visor Microsoft Time Series, clique no separador Modelo , selecione a árvore da série de dados R250: Europa e, em seguida, clique no nó que representa a série de datas a partir de ou após 7/5/2003. A legenda de mineração compõe todas as constantes num formato legível, mostrado neste exemplo:

Equação ARIMA:

ARIMA ({1,1},0,{1,1.49791920964142,1.10640053499397,0.888873034670339,-5.05429403071953E-02,-0.905265316720334,-0.961908900643379,-0.649991020901922}) Intercept:56.8888888888889

Esta equação é o formato ARIMA longo, que inclui os valores dos coeficientes e do intercepto. O formato abreviado para esta equação seria {1,0,7}, onde 1 indica o período como contagem de fatias de tempo, 0 indica a ordem das diferenças de termos, e 7 indica o número de coeficientes.

Observação

Uma constante é calculada pelos Serviços de Análise para calcular a variância, mas a constante em si não é exibida em lado nenhum na interface do utilizador. No entanto, pode ver a variância para qualquer ponto da série em função desta constante se selecionar Mostrar Desvios, na vista de Gráfico . O tooltip de cada uma das séries de dados apresenta a variância para um ponto previsto específico.

Conteúdo de Modelo para Fórmula ARIMA

Um modelo ARIMA segue uma estrutura padrão, com diferentes informações contidas em nós de diferentes tipos. Para visualizar o conteúdo do modelo ARIMA, altere o visualizador para o Microsoft Generic Content Tree Viewer e depois expanda o nó que tem o nome do atributo, R250 Europe: Quantity.

Um modelo ARIMA para uma série de dados contém a equação periódica básica em quatro formatos diferentes, que pode escolher consoante a aplicação.

NODE_CAPTION: Mostra o formato curto da equação. O formato curto indica-lhe quantas estruturas periódicas estão representadas e quantos coeficientes têm. Por exemplo, se o formato curto da equação for {4,0,6}, o nó representa uma estrutura periódica com 6 coeficientes. Se o formato curto for algo como {2,0,8} x {1,0,0}(4), o nó contém duas estruturas periódicas.

DESCRIÇÃO DO NÓ: Exibe o formato longo da equação, que é também a forma usada na Lenda da Mineração. A forma longa da equação é semelhante à forma curta, exceto que os valores reais dos coeficientes são exibidos em vez de serem contados.

NODE_RULE: Apresenta uma representação XML da equação. Dependendo do tipo de nó, a representação XML pode incluir estruturas periódicas simples ou múltiplas. A tabela seguinte ilustra como os nós XML são agrupados para níveis superiores do modelo ARIMA.

Tipo de nó Conteúdo XML
27 (Raiz ARIMA) Inclui todas as estruturas periódicas da série de dados, bem como o conteúdo de todos os nós filhos de cada estrutura periódica.
28 (Estrutura Periódica ARIMA) Define uma única estrutura periódica, incluindo o seu nó termo autorregressivo e os seus coeficientes de média móvel.
29 (ARIMA Autoregressivo) Lista os termos para uma única estrutura periódica.
30 (Média Móvel ARIMA) Lista os coeficientes para uma única estrutura periódica.

NODE_DISTRIBUTION: Apresenta os termos da equação numa tabela aninhada, que pode consultar para obter termos específicos. A tabela de distribuição de nós segue a mesma estrutura hierárquica das regras XML. Ou seja, o nó raiz da série ARIMA (NODE_TYPE = 27) contém o valor de interceção e as periodicidades para a equação completa, que podem incluir múltiplas periodicidades, enquanto os nós filhos contêm apenas informação específica de uma certa estrutura periódica ou dos nós filhos dessa estrutura periódica.

Tipo de nó Attribute Tipo de valor
27 (Raiz ARIMA) Intercetação

Periodicidade
11
28 (Estrutura Periódica ARIMA) Periodicidade

Ordem auto-regressiva

Ordem das diferenças

Ordem da média móvel
12

13

15

14
29 (ARIMA Autoregressivo) Coeficiente

(complemento de coeficientes)
7
30 (Média Móvel ARIMA) Valor no instante t

Valor em t-1

...

Valor em t-n
7

O valor da ordem da média móvel indica o número de médias móveis numa série. Geralmente, a média móvel é calculada n-1 vezes se existirem n termos numa série, mas o número pode ser reduzido para facilitar o cálculo.

O valor da ordem autorregressiva indica o número de séries autoregressivas.

O valor para a ordem de diferença indica quantas vezes as séries são comparadas ou diferenciadas.

Para uma enumeração dos possíveis tipos de valor, consulte Microsoft.AnalysisServices.AdomdServer.MiningValueType.

Utilização da Informação da Árvore ARIMA

Se usar previsões baseadas no algoritmo ARIMA numa solução empresarial, poderá querer colar a equação num relatório para demonstrar o método usado para criar a previsão. Pode usar a legenda para apresentar as fórmulas em formato curto, ou a descrição para apresentar as fórmulas em formato longo.

Se está a desenvolver uma aplicação que utiliza previsões de séries temporais, pode achar útil obter a equação ARIMA a partir do conteúdo do modelo e depois fazer as suas próprias previsões. Para obter a equação ARIMA para qualquer resultado específico, pode consultar diretamente a raiz ARIMA para esse atributo em particular, como mostrado nos exemplos anteriores.

Se souber o ID do nó que contém a série que pretende, tem duas opções para recuperar os componentes da equação:

  • Formato de tabela aninhada: Use uma consulta DMX ou consulta via cliente OLEDB.

  • Representação XML: Use uma consulta XML.

Observações

Pode ser difícil recuperar informação de uma árvore ARTXP, porque a informação de cada divisão está num local diferente dentro da árvore. Portanto, com um modelo ARTXP, deves obter todas as peças e depois fazer um processamento adicional para reconstituir a fórmula completa. Recuperar uma equação de um modelo ARIMA é mais fácil porque a fórmula está disponível em toda a árvore. Para informações sobre como criar uma consulta para recuperar esta informação, consulte Exemplos de Consultas para Modelos de Séries Temporais.

Ver também

Conteúdo de Modelos de Mineração (Serviços de Análise - Mineração de Dados)
Algoritmo de Séries Temporais da Microsoft
Exemplos de Consultas de Modelos de Séries Temporais
Referência Técnica do Algoritmo de Séries Temporais da Microsoft