Compartilhar via


Consultando um modelo de regressão linear (Analysis Services – Mineração de Dados)

Ao criar uma consulta para um modelo de mineração de dados, você pode criar uma consulta de conteúdo que fornece detalhes de padrões encontrados em análises ou uma consulta de previsão que usa os padrões no modelo para fazer previsões para novos dados. Por exemplo, uma consulta de conteúdo pode fornecer mais detalhes sobre a fórmula de regressão, enquanto uma consulta de previsão pode informar se um novo ponto de dados se ajusta ao modelo. Você também pode recuperar metadados sobre o modelo usando uma consulta.

Esta seção explica como criar consultas para modelos baseados no algoritmo Regressão Linear da Microsoft. Para obter mais informações sobre a estrutura de um modelo de regressão linear, consulte Conteúdo do modelo de mineração para modelos de regressão linear (Analysis Services – Mineração de Dados).

ObservaçãoObservação

Como a regressão linear se baseia em um caso especial do algoritmo Árvores de Decisão da Microsoft, alguns modelos de árvore de decisão que usam atributos previsíveis contínuos podem conter fórmulas de regressão. Para obter mais informações, consulte Referência técnica do algoritmo Árvores de Decisão da Microsoft.

  • Consultas de conteúdo

    Retornando parâmetros do modelo usando o conjunto de linhas do esquema de mineração de dados

    Retornando a fórmula de regressão do modelo usando DMX

    Retornando o coeficiente do modelo

  • Consultas de previsão

    Fazendo previsões usando uma consulta singleton

    Retornando estatísticas descritivas de um modelo de regressão

Voltar ao início

Para reproduzir os resultados dos exemplos de consultas, você poderá criar um modelo de regressão linear conforme descrito no tópico a seguir. O modelo é muito simples, mas demonstra conceitos básicos de como usar o Designer de Mineração de Dados para personalizar um modelo de regressão linear.

Como forçar o uso de regressores em um modelo

Localizando informações sobre o modelo de regressão linear

A estrutura de um modelo de regressão linear é extremamente simples: o modelo de mineração representa os dados como um único nó, que define a fórmula de regressão.

Esta seção fornece exemplos de como obter mais informações sobre o modelo, inclusive a fórmula de regressão e estatísticas descritivas sobre os dados.

Exemplo de consulta 1: Retornando parâmetros do modelo usando o conjunto de linhas do esquema de mineração de dados

Ao consultar o conjunto de linhas do esquema de mineração de dados, é possível encontrar metadados sobre o modelo. Isso pode incluir quando o modelo foi criado, quando o modelo foi processado pela última vez, o nome da estrutura de mineração na qual o modelo se baseia e o nome da coluna designada como o atributo previsível. Você também pode retornar os parâmetros usados quando o modelo foi criado.

SELECT MINING_PARAMETERS 
FROM $system.DMSCHEMA_MINING_MODELS
WHERE MODEL_NAME = 'Call Center Regression'

Resultados do exemplo:

MINING_PARAMETERS

MINING_PARAMETERS

MAXIMUM_INPUT_ATTRIBUTES=255, MAXIMUM_OUTPUT_ATTRIBUTES=255, FORCE_REGRESSOR=[Average Time Per Issue],[Total Operators]

ObservaçãoObservação

Se você não tiver especificado regressores, o parâmetro FORCE_REGRESSOR terá o valor "FORCE_REGRESSOR =".

Voltar ao início

Exemplo de consulta 2: Retornando a fórmula de regressão do modelo usando DMX

A consulta a seguir retorna o conteúdo do modelo de mineração para o modelo de regressão linear. Ela retorna o conteúdo do nó que contém a fórmula de regressão. Você também poderá usar essa consulta em um modelo de árvore de decisão, caso um dos nós contenha uma fórmula de regressão.

Cada variável e coeficiente são armazenados em uma linha separada da tabela aninhada NODE_DISTRIBUTION. Para exibir a fórmula de regressão completa, use o Visualizador de Árvore da Microsoft, clique no nó (Tudo) e abra a Legenda de Mineração.

SELECT FLATTENED NODE_DISTRIBUTION as t
FROM [Call Center Regression].CONTENT
ObservaçãoObservação

Se você referenciar colunas individuais da tabela aninhada usando uma consulta como SELECT <column name> from NODE_DISTRIBUTION, algumas colunas, como SUPPORT ou PROBABILITY, devem ser colocadas entre colchetes para distingui-las das palavras-chave reservadas de mesmo nome.

Resultados esperados:

t.ATTRIBUTE_NAME

t.ATTRIBUTE_VALUE

t.SUPPORT

t.PROBABILITY

t.VARIANCE

t.VALUETYPE

Service Grade

Missing

0

0

0

1

Service Grade

0.09875

120

1

0.00157927083333334

3

Average Time Per Issue

0.00136989326310586

0

0

187.866597222222

7

Average Time Per Issue

12.0822151449249

0

0

0

8

Average Time Per Issue

79.8416666666667

0

0

187.866597222222

9

Total Operators

-0.000426156789860463

0

0

24.0799305555556

7

Total Operators

-3.19762422385219

0

0

0

8

Total Operators

10.6916666666667

0

0

24.0799305555556

9

-0.00606823493688524

0

0

0.00121526993847281

11

Em comparação, na Legenda de Mineração, a fórmula de regressão aparece da seguinte forma:

Service Grade = 0.070+0.001*(Average Time Per Issue-79.842)-0.0004*(Total Operators-10.692)

Na Legenda de Mineração, alguns números podem estar arredondados; no entanto, a tabela NODE_DISTRIBUTION e a Legenda de Mineração contêm basicamente os mesmos valores.

Os valores na coluna VALUETYPE informa que tipo de informações estão em cada linha, o que será útil se você estiver processando os resultados programaticamente. A tabela a seguir mostra os tipos de valores produzidos para uma fórmula de regressão linear.

VALUETYPE

1 (Ausente)

3 (Contínuo)

7 (Coeficiente)

8 (Ganho de pontos)

9 (Estatísticas)

7 (Coeficiente)

8 (Ganho de pontos)

9 (Estatísticas)

11 (Interceptação)

Para obter mais informações sobre o significado de cada tipo de valor para modelos de regressão, consulte Conteúdo do modelo de mineração para modelos de regressão linear (Analysis Services – Mineração de Dados).

Voltar ao início

Exemplo de consulta 3: Retornando o coeficiente do modelo

Ao usar a enumeração VALUETYPE, você só pode retornar o coeficiente da equação de regressão, conforme mostrado na seguinte consulta:

SELECT FLATTENED MODEL_NAME,
    (SELECT ATTRIBUTE_VALUE, VALUETYPE
     FROM NODE_DISTRIBUTION
     WHERE VALUETYPE = 11) 
AS t
FROM [Call Center Regression].CONTENT

Essa consulta retorna duas linhas, um a do conteúdo do modelo de mineração e a outra da tabela aninhada que contém o coeficiente. A coluna ATTRIBUTE_NAME não é incluída aqui porque sempre fica em branco para o coeficiente.

MODEL_NAME

t.ATTRIBUTE_VALUE

t.VALUETYPE

Call Center Regressors2

-0.00606823493688524

11

Fazendo previsões usando o modelo

Você pode criar consultas de previsão em modelos de regressão linear usando a guia Previsão do Modelo de Mineração no Designer de Mineração de Dados. O construtor de consultas de previsão está disponível no SQL Server Management Studio e no Business Intelligence Development Studio.

ObservaçãoObservação

Também é possível criar consultas em modelos de regressão usando os Suplementos de Mineração de Dados para Excel do SQL Server 2005 ou do SQL Server 2008. Mesmo que os Suplementos de Mineração de Dados para Excel não criem modelos de regressão, você pode procurar e consultar qualquer modelo de mineração armazenado em uma instância do Analysis Services.

Voltar ao início

Exemplo de consulta 4: Criando previsões usando uma consulta singleton

A maneira mais fácil de criar uma consulta singleton em um modelo de regressão é usando a caixa de diálogo Entrada de Consulta Singleton. Por exemplo, você pode criar a consulta DMX a seguir selecionando o modelo de regressão apropriado, escolhendo Consulta Singleton e digitando 10 como o valor de Total Operators.

SELECT
  Predict([Call Center Regression].[Service Grade])
FROM
  [Call Center Regression]
NATURAL PREDICTION JOIN
(SELECT 10 AS [Total Operators]) AS t

Resultados do exemplo:

Yearly Income

0.0992841946529471

Voltar ao início

Exemplo de consulta 5: Retornando estatísticas descritivas de um modelo de regressão

Você pode usar muitas das funções de previsão padrão com modelos de regressão linear. O exemplo a seguir demonstra como adicionar algumas estatísticas descritivas aos resultados da consulta de previsão.

SELECT
  Predict([Call Center Regression].[Service Grade]) as [Predicted Service],
  PredictStdev([Call Center Regression].[Service Grade]) as [Standard Deviation]
FROM
  [Call Center Regression]
NATURAL PREDICTION JOIN
(SELECT 10 AS [Total Operators]) AS t

Resultados do exemplo:

Predicted Service

Standard Deviation

0.0990447584463201

0.0348607220015996

Voltar ao início

Lista de funções de previsão

Todos os algoritmos Microsoft fornecem suporte a um conjunto comum de funções. Entretanto, o algoritmo Regressão Linear da Microsoft oferece suporte às funções adicionais relacionadas na tabela a seguir.

Para obter uma lista das funções comuns a todos os algoritmos Microsoft, consulte Algoritmos de mineração de dados (Analysis Services – Mineração de Dados). Para obter mais informações sobre como usar essas funções, consulte Referência de função de DMX (Data Mining Extensions).

Histórico de alterações

Conteúdo atualizado

Adicionados links no tópico para facilitar a revisão de exemplos de consultas.

Alterado o exemplo para usar um modelo com um melhor ajuste. Adicionado um link para o novo tópico que descreve como criar um modelo de regressão linear de exemplo.