Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
Ao criar uma consulta em relação a um modelo de mineração de dados, você pode criar uma consulta de conteúdo, que fornece detalhes sobre os padrões descobertos na análise ou você pode criar uma consulta de previsão, que usa os padrões no modelo para fazer previsões para novos dados. Por exemplo, uma consulta de conteúdo pode fornecer detalhes adicionais sobre a fórmula de regressão, enquanto uma consulta de previsão pode informar se um novo ponto de dados se encaixa no modelo. Você também pode recuperar metadados sobre o modelo usando uma consulta.
Esta seção explica como criar consultas para modelos baseados no algoritmo regressão linear da Microsoft.
Observação
Como a regressão linear é baseada em um caso especial do algoritmo Árvores de Decisão da Microsoft, há muitas semelhanças e alguns modelos de árvore de decisão que usam atributos previsíveis contínuos podem conter fórmulas de regressão. Para obter mais informações, consulte Referência técnica do algoritmo Árvores de Decisão da Microsoft.
Consultas de conteúdo
Usando DMX para retornar a fórmula de regressão para o modelo
Retornando apenas o coeficiente para o modelo
Consultas de previsão
Prever a renda usando uma consulta singleton
Usando funções de previsão com um modelo de regressão
Localizando informações sobre o modelo de regressão linear
A estrutura de um modelo de regressão linear é extremamente simples: o modelo de mineração representa os dados como um único nó, que define a fórmula de regressão. Para obter mais informações, consulte o Conteúdo do Modelo de Mineração para Modelos de Regressão Logística (Analysis Services – Mineração de Dados).
Consulta de exemplo 1: usando o conjunto de linhas de esquema de mineração de dados para determinar parâmetros usados para um modelo
Consultando o conjunto de linhas do esquema de mineração de dados, você pode encontrar metadados sobre o modelo. Isso pode incluir quando o modelo foi criado, quando o modelo foi processado pela última vez, o nome da estrutura de mineração na qual o modelo se baseia e o nome da coluna designada como o atributo previsível. Você também pode retornar os parâmetros que foram usados quando o modelo foi criado pela primeira vez.
SELECT MINING_PARAMETERS
FROM $system.DMSCHEMA_MINING_MODELS
WHERE MODEL_NAME = 'TM_PredictIncome'
Resultados de exemplo:
| PARÂMETROS_DE_MINERAÇÃO |
|---|
| COMPLEXITY_PENALTY=0,9, ATRIBUTOS_DE_ENTRADA_MÁXIMOS=255 MAXIMUM_OUTPUT_ATTRIBUTES=255, MINIMUM_SUPPORT=10, SCORE_METHOD=4, SPLIT_METHOD=3, FORCE_REGRESSOR= |
Observação
A configuração do parâmetro",FORCE_REGRESSOR = indica que o valor atual do parâmetro FORCE_REGRESSOR é nulo.
Consulta de exemplo 2: recuperando a fórmula de regressão para o modelo
A consulta SQL a seguir retorna o conteúdo do modelo de mineração para um modelo de regressão linear que foi criado usando a mesma fonte de dados Targeted Mailing que foi utilizada no Tutorial básico de mineração de dados. Esse modelo prevê a renda do cliente com base na idade.
A consulta retorna o conteúdo do nó que contém a fórmula de regressão. Cada variável e coeficiente são armazenados em linhas separadas da tabela NODE_DISTRIBUTION aninhada. Se você quiser exibir a fórmula de regressão completa, use o Visualizador de Árvore da Microsoft, clique no nó (Todos) e abra a Legenda de Mineração.
SELECT FLATTENED NODE_DISTRIBUTION as t
FROM LR_PredictIncome.CONTENT
Observação
Se você fizer referência a colunas individuais da tabela aninhada usando uma consulta como SELECT <column name> from NODE_DISTRIBUTION, algumas colunas, como SUPPORT ou PROBABILITY, deverão ser colocadas entre colchetes para distingui-las das palavras-chave reservadas de mesmo nome.
Resultados esperados:
| t.ATTRIBUTE_NAME | t.ATTRIBUTE_VALUE | t.SUPPORT | t.PROBABILIDADE | t.VARIÂNCIA | t.VALUETYPE |
|---|---|---|---|---|---|
| Renda Anual | Em falta | 0 | 0.000457142857142857 | 0 | 1 |
| Renda Anual | 57220.8876687257 | 17484 | 0,999542857142857 | 1041275619.52776 | 3 |
| Idade | 471.687717702463 | 0 | 0 | 126.969442359327 | 7 |
| Idade | 234,680904692439 | 0 | 0 | 0 | 8 |
| Idade | 45.4269617936399 | 0 | 0 | 126.969442359327 | 9 |
| 35793.5477381267 | 0 | 0 | 1012968919.28372 | 11 |
Em comparação, na Legenda de Mineração, a fórmula de regressão aparece da seguinte maneira:
Renda Anual = 57.220.919 + 471.688 * (Idade - 45.427)
Você pode ver que, na Legenda de Mineração, alguns números são arredondados; no entanto, a tabela NODE_DISTRIBUTION e a Legenda de Mineração contêm essencialmente os mesmos valores.
Os valores na coluna VALUETYPE informam que tipo de informação está contida em cada linha, o que é útil se você estiver processando os resultados programaticamente. A tabela a seguir mostra os tipos de valores que resultam de uma fórmula de regressão linear.
| TIPODEVALOR |
|---|
| 1 (Ausente) |
| 3 (Contínuo) |
| 7 (Coeficiente) |
| 8 (Ganho de Pontuação) |
| 9 (Estatísticas) |
| 7 (Coeficiente) |
| 8 (Ganho de Pontuação) |
| 9 (Estatísticas) |
| 11 (Intercepto) |
Para obter mais informações sobre o significado de cada tipo de valor para modelos de regressão, consulte o Conteúdo do Modelo de Mineração para Modelos de Regressão Linear (Analysis Services – Mineração de Dados).
Consulta de exemplo 3: retornando apenas o coeficiente para o modelo
Usando a enumeração VALUETYPE, você pode retornar apenas o coeficiente para a equação de regressão, conforme mostrado na seguinte consulta:
SELECT FLATTENED MODEL_NAME,
(SELECT ATTRIBUTE_VALUE, VALUETYPE
FROM NODE_DISTRIBUTION
WHERE VALUETYPE = 11)
AS t
FROM LR_PredictIncome.CONTENT
Essa consulta retorna duas linhas, uma do conteúdo do modelo de mineração e a linha da tabela aninhada que contém o coeficiente. A coluna ATTRIBUTE_NAME não está incluída aqui porque está sempre em branco para o coeficiente.
| MODEL_NAME | t.ATTRIBUTE_VALUE | t.TIPOVALOR |
|---|---|---|
| LR_PredictIncome | ||
| LR_PrevêRenda | 35793.5477381267 | 11 |
Fazendo previsões de um modelo de regressão linear
Você pode criar consultas de previsão em modelos de regressão linear usando a guia Previsão de Modelo de Mineração no Designer de Mineração de Dados. O construtor de consultas de previsão está disponível no SQL Server Management Studio e no SQL Server Data Tools (SSDT).
Observação
Você também pode criar consultas em modelos de regressão usando os Suplementos de Mineração de Dados do SQL Server 2005 para Excel ou os Suplementos de Mineração de Dados do SQL Server 2008 para Excel. Embora os Suplementos de Mineração de Dados para Excel não criem modelos de regressão, você pode procurar e consultar qualquer modelo de mineração armazenado em uma instância do Analysis Services.
Consulta de exemplo 4: Prever a renda usando uma consulta Singleton
A maneira mais fácil de criar uma única consulta em um modelo de regressão é usando a caixa de diálogo Entrada de Consulta Singleton . Por exemplo, você pode criar a consulta DMX a seguir selecionando o modelo de regressão apropriado, escolhendo a Consulta Singleton e digitando 20 como o valor de Idade.
SELECT [LR_PredictIncome].[Yearly Income]
From [LR_PredictIncome]
NATURAL PREDICTION JOIN
(SELECT 20 AS [Age]) AS t
Resultados de exemplo:
| Renda Anual |
|---|
| 45227.302092176 |
Consulta de exemplo 5: usando funções de previsão com um modelo de regressão
Você pode usar muitas das funções de previsão padrão com modelos de regressão linear. O exemplo a seguir ilustra como adicionar algumas estatísticas descritivas aos resultados da consulta de previsão. Nesses resultados, você pode ver que há um desvio considerável da média para esse modelo.
SELECT
([LR_PredictIncome].[Yearly Income]) as [PredIncome],
(PredictStdev([LR_PredictIncome].[Yearly Income])) as [StDev1]
From
[LR_PredictIncome]
NATURAL PREDICTION JOIN
(SELECT 20 AS [Age]) AS t
Resultados de exemplo:
| Renda Anual | StDev1 |
|---|---|
| 45.227,302092176 | 31827.1726561396 |
Lista de funções de previsão
Todos os algoritmos da Microsoft dão suporte a um conjunto comum de funções. No entanto, o algoritmo regressão linear da Microsoft dá suporte às funções adicionais listadas na tabela a seguir.
| Função de previsão | Uso |
| IsDescendant (DMX) | Determina se um nó é filho de outro nó no modelo. |
| IsInNode (DMX) | Indica se o nó especificado contém o caso atual. |
| PredictHistogram (DMX) | Retorna um valor previsto ou um conjunto de valores para uma coluna especificada. |
| PredictNodeId (DMX) | Retorna o Node_ID para cada caso. |
| PredictStdev (DMX) | Retorna o desvio padrão para o valor previsto. |
| PredictSupport (DMX) | Retorna o valor de suporte para um estado especificado. |
| PredictVariance (DMX) | Retorna a variação de uma coluna especificada. |
Para obter uma lista das funções que são comuns a todos os algoritmos da Microsoft, consulte Algoritmos de Mineração de Dados (Analysis Services – Mineração de Dados). Para obter mais informações sobre como usar essas funções, consulte Referência de função DMX (Extensões de Mineração de Dados).
Consulte Também
Algoritmo de regressão linear da Microsoft
Consultas de mineração de dados
Referência técnica do algoritmo de regressão linear da Microsoft
Conteúdo do modelo de mineração para modelos de regressão linear (Analysis Services – Mineração de dados)