Partilhar via


Exemplos de consulta de modelo de regressão linear

Ao criar uma consulta em relação a um modelo de mineração de dados, você pode criar uma consulta de conteúdo, que fornece detalhes sobre os padrões descobertos na análise ou você pode criar uma consulta de previsão, que usa os padrões no modelo para fazer previsões para novos dados. Por exemplo, uma consulta de conteúdo pode fornecer detalhes adicionais sobre a fórmula de regressão, enquanto uma consulta de previsão pode informar se um novo ponto de dados se encaixa no modelo. Você também pode recuperar metadados sobre o modelo usando uma consulta.

Esta seção explica como criar consultas para modelos baseados no algoritmo regressão linear da Microsoft.

Observação

Como a regressão linear é baseada em um caso especial do algoritmo Árvores de Decisão da Microsoft, há muitas semelhanças e alguns modelos de árvore de decisão que usam atributos previsíveis contínuos podem conter fórmulas de regressão. Para obter mais informações, consulte Referência técnica do algoritmo Árvores de Decisão da Microsoft.

Consultas de conteúdo

Usando o conjunto de linhas de esquema de mineração de dados para determinar os parâmetros usados para um modelo

Usando DMX para retornar a fórmula de regressão para o modelo

Retornando apenas o coeficiente para o modelo

Consultas de previsão

Prever a renda usando uma consulta singleton

Usando funções de previsão com um modelo de regressão

Localizando informações sobre o modelo de regressão linear

A estrutura de um modelo de regressão linear é extremamente simples: o modelo de mineração representa os dados como um único nó, que define a fórmula de regressão. Para obter mais informações, consulte o Conteúdo do Modelo de Mineração para Modelos de Regressão Logística (Analysis Services – Mineração de Dados).

Retornar à parte superior

Consulta de exemplo 1: usando o conjunto de linhas de esquema de mineração de dados para determinar parâmetros usados para um modelo

Consultando o conjunto de linhas do esquema de mineração de dados, você pode encontrar metadados sobre o modelo. Isso pode incluir quando o modelo foi criado, quando o modelo foi processado pela última vez, o nome da estrutura de mineração na qual o modelo se baseia e o nome da coluna designada como o atributo previsível. Você também pode retornar os parâmetros que foram usados quando o modelo foi criado pela primeira vez.

SELECT MINING_PARAMETERS   
FROM $system.DMSCHEMA_MINING_MODELS  
WHERE MODEL_NAME = 'TM_PredictIncome'  

Resultados de exemplo:

PARÂMETROS_DE_MINERAÇÃO
COMPLEXITY_PENALTY=0,9,

ATRIBUTOS_DE_ENTRADA_MÁXIMOS=255

MAXIMUM_OUTPUT_ATTRIBUTES=255,

MINIMUM_SUPPORT=10,

SCORE_METHOD=4,

SPLIT_METHOD=3,

FORCE_REGRESSOR=

Observação

A configuração do parâmetro",FORCE_REGRESSOR = indica que o valor atual do parâmetro FORCE_REGRESSOR é nulo.

Retornar à parte superior

Consulta de exemplo 2: recuperando a fórmula de regressão para o modelo

A consulta SQL a seguir retorna o conteúdo do modelo de mineração para um modelo de regressão linear que foi criado usando a mesma fonte de dados Targeted Mailing que foi utilizada no Tutorial básico de mineração de dados. Esse modelo prevê a renda do cliente com base na idade.

A consulta retorna o conteúdo do nó que contém a fórmula de regressão. Cada variável e coeficiente são armazenados em linhas separadas da tabela NODE_DISTRIBUTION aninhada. Se você quiser exibir a fórmula de regressão completa, use o Visualizador de Árvore da Microsoft, clique no nó (Todos) e abra a Legenda de Mineração.

SELECT FLATTENED NODE_DISTRIBUTION as t  
FROM LR_PredictIncome.CONTENT  

Observação

Se você fizer referência a colunas individuais da tabela aninhada usando uma consulta como SELECT <column name> from NODE_DISTRIBUTION, algumas colunas, como SUPPORT ou PROBABILITY, deverão ser colocadas entre colchetes para distingui-las das palavras-chave reservadas de mesmo nome.

Resultados esperados:

t.ATTRIBUTE_NAME t.ATTRIBUTE_VALUE t.SUPPORT t.PROBABILIDADE t.VARIÂNCIA t.VALUETYPE
Renda Anual Em falta 0 0.000457142857142857 0 1
Renda Anual 57220.8876687257 17484 0,999542857142857 1041275619.52776 3
Idade 471.687717702463 0 0 126.969442359327 7
Idade 234,680904692439 0 0 0 8
Idade 45.4269617936399 0 0 126.969442359327 9
35793.5477381267 0 0 1012968919.28372 11

Em comparação, na Legenda de Mineração, a fórmula de regressão aparece da seguinte maneira:

Renda Anual = 57.220.919 + 471.688 * (Idade - 45.427)

Você pode ver que, na Legenda de Mineração, alguns números são arredondados; no entanto, a tabela NODE_DISTRIBUTION e a Legenda de Mineração contêm essencialmente os mesmos valores.

Os valores na coluna VALUETYPE informam que tipo de informação está contida em cada linha, o que é útil se você estiver processando os resultados programaticamente. A tabela a seguir mostra os tipos de valores que resultam de uma fórmula de regressão linear.

TIPODEVALOR
1 (Ausente)
3 (Contínuo)
7 (Coeficiente)
8 (Ganho de Pontuação)
9 (Estatísticas)
7 (Coeficiente)
8 (Ganho de Pontuação)
9 (Estatísticas)
11 (Intercepto)

Para obter mais informações sobre o significado de cada tipo de valor para modelos de regressão, consulte o Conteúdo do Modelo de Mineração para Modelos de Regressão Linear (Analysis Services – Mineração de Dados).

Retornar à parte superior

Consulta de exemplo 3: retornando apenas o coeficiente para o modelo

Usando a enumeração VALUETYPE, você pode retornar apenas o coeficiente para a equação de regressão, conforme mostrado na seguinte consulta:

SELECT FLATTENED MODEL_NAME,  
    (SELECT ATTRIBUTE_VALUE, VALUETYPE  
     FROM NODE_DISTRIBUTION  
     WHERE VALUETYPE = 11)   
AS t  
FROM LR_PredictIncome.CONTENT  

Essa consulta retorna duas linhas, uma do conteúdo do modelo de mineração e a linha da tabela aninhada que contém o coeficiente. A coluna ATTRIBUTE_NAME não está incluída aqui porque está sempre em branco para o coeficiente.

MODEL_NAME t.ATTRIBUTE_VALUE t.TIPOVALOR
LR_PredictIncome
LR_PrevêRenda 35793.5477381267 11

Retornar à parte superior

Fazendo previsões de um modelo de regressão linear

Você pode criar consultas de previsão em modelos de regressão linear usando a guia Previsão de Modelo de Mineração no Designer de Mineração de Dados. O construtor de consultas de previsão está disponível no SQL Server Management Studio e no SQL Server Data Tools (SSDT).

Observação

Você também pode criar consultas em modelos de regressão usando os Suplementos de Mineração de Dados do SQL Server 2005 para Excel ou os Suplementos de Mineração de Dados do SQL Server 2008 para Excel. Embora os Suplementos de Mineração de Dados para Excel não criem modelos de regressão, você pode procurar e consultar qualquer modelo de mineração armazenado em uma instância do Analysis Services.

Retornar à parte superior

Consulta de exemplo 4: Prever a renda usando uma consulta Singleton

A maneira mais fácil de criar uma única consulta em um modelo de regressão é usando a caixa de diálogo Entrada de Consulta Singleton . Por exemplo, você pode criar a consulta DMX a seguir selecionando o modelo de regressão apropriado, escolhendo a Consulta Singleton e digitando 20 como o valor de Idade.

SELECT [LR_PredictIncome].[Yearly Income]  
From   [LR_PredictIncome]  
NATURAL PREDICTION JOIN  
(SELECT 20 AS [Age]) AS t  

Resultados de exemplo:

Renda Anual
45227.302092176

Retornar à parte superior

Consulta de exemplo 5: usando funções de previsão com um modelo de regressão

Você pode usar muitas das funções de previsão padrão com modelos de regressão linear. O exemplo a seguir ilustra como adicionar algumas estatísticas descritivas aos resultados da consulta de previsão. Nesses resultados, você pode ver que há um desvio considerável da média para esse modelo.

SELECT  
  ([LR_PredictIncome].[Yearly Income]) as [PredIncome],  
  (PredictStdev([LR_PredictIncome].[Yearly Income])) as [StDev1]  
From  
  [LR_PredictIncome]  
NATURAL PREDICTION JOIN  
(SELECT 20 AS [Age]) AS t  

Resultados de exemplo:

Renda Anual StDev1
45.227,302092176 31827.1726561396

Retornar à parte superior

Lista de funções de previsão

Todos os algoritmos da Microsoft dão suporte a um conjunto comum de funções. No entanto, o algoritmo regressão linear da Microsoft dá suporte às funções adicionais listadas na tabela a seguir.

Função de previsão Uso
IsDescendant (DMX) Determina se um nó é filho de outro nó no modelo.
IsInNode (DMX) Indica se o nó especificado contém o caso atual.
PredictHistogram (DMX) Retorna um valor previsto ou um conjunto de valores para uma coluna especificada.
PredictNodeId (DMX) Retorna o Node_ID para cada caso.
PredictStdev (DMX) Retorna o desvio padrão para o valor previsto.
PredictSupport (DMX) Retorna o valor de suporte para um estado especificado.
PredictVariance (DMX) Retorna a variação de uma coluna especificada.

Para obter uma lista das funções que são comuns a todos os algoritmos da Microsoft, consulte Algoritmos de Mineração de Dados (Analysis Services – Mineração de Dados). Para obter mais informações sobre como usar essas funções, consulte Referência de função DMX (Extensões de Mineração de Dados).

Consulte Também

Algoritmo de regressão linear da Microsoft
Consultas de mineração de dados
Referência técnica do algoritmo de regressão linear da Microsoft
Conteúdo do modelo de mineração para modelos de regressão linear (Analysis Services – Mineração de dados)