Consultando um modelo de regressão linear (Analysis Services – Mineração de Dados)
Ao criar uma consulta para um modelo de mineração de dados, você pode criar uma consulta de conteúdo que fornece detalhes de padrões encontrados em análises ou uma consulta de previsão que usa os padrões no modelo para fazer previsões para novos dados. Por exemplo, uma consulta de conteúdo pode fornecer mais detalhes sobre a fórmula de regressão, enquanto uma consulta de previsão pode informar se um novo ponto de dados se ajusta ao modelo. Você também pode recuperar metadados sobre o modelo usando uma consulta.
Esta seção explica como criar consultas para modelos baseados no algoritmo Regressão Linear da Microsoft. Para obter mais informações sobre a estrutura de um modelo de regressão linear, consulte Conteúdo do modelo de mineração para modelos de regressão linear (Analysis Services – Mineração de Dados).
Observação |
---|
Como a regressão linear se baseia em um caso especial do algoritmo Árvores de Decisão da Microsoft, alguns modelos de árvore de decisão que usam atributos previsíveis contínuos podem conter fórmulas de regressão. Para obter mais informações, consulte Referência técnica do algoritmo Árvores de Decisão da Microsoft. |
Consultas de conteúdo
Retornando parâmetros do modelo usando o conjunto de linhas do esquema de mineração de dados
Retornando a fórmula de regressão do modelo usando DMX
Retornando o coeficiente do modelo
Consultas de previsão
Fazendo previsões usando uma consulta singleton
Retornando estatísticas descritivas de um modelo de regressão
Voltar ao início
Para reproduzir os resultados dos exemplos de consultas, você poderá criar um modelo de regressão linear conforme descrito no tópico a seguir. O modelo é muito simples, mas demonstra conceitos básicos de como usar o Designer de Mineração de Dados para personalizar um modelo de regressão linear.
Localizando informações sobre o modelo de regressão linear
A estrutura de um modelo de regressão linear é extremamente simples: o modelo de mineração representa os dados como um único nó, que define a fórmula de regressão.
Esta seção fornece exemplos de como obter mais informações sobre o modelo, inclusive a fórmula de regressão e estatísticas descritivas sobre os dados.
Exemplo de consulta 1: Retornando parâmetros do modelo usando o conjunto de linhas do esquema de mineração de dados
Ao consultar o conjunto de linhas do esquema de mineração de dados, é possível encontrar metadados sobre o modelo. Isso pode incluir quando o modelo foi criado, quando o modelo foi processado pela última vez, o nome da estrutura de mineração na qual o modelo se baseia e o nome da coluna designada como o atributo previsível. Você também pode retornar os parâmetros usados quando o modelo foi criado.
SELECT MINING_PARAMETERS
FROM $system.DMSCHEMA_MINING_MODELS
WHERE MODEL_NAME = 'Call Center Regression'
Resultados do exemplo:
MINING_PARAMETERS |
---|
MINING_PARAMETERS MAXIMUM_INPUT_ATTRIBUTES=255, MAXIMUM_OUTPUT_ATTRIBUTES=255, FORCE_REGRESSOR=[Average Time Per Issue],[Total Operators] |
Observação |
---|
Se você não tiver especificado regressores, o parâmetro FORCE_REGRESSOR terá o valor "FORCE_REGRESSOR =". |
Voltar ao início
Exemplo de consulta 2: Retornando a fórmula de regressão do modelo usando DMX
A consulta a seguir retorna o conteúdo do modelo de mineração para o modelo de regressão linear. Ela retorna o conteúdo do nó que contém a fórmula de regressão. Você também poderá usar essa consulta em um modelo de árvore de decisão, caso um dos nós contenha uma fórmula de regressão.
Cada variável e coeficiente são armazenados em uma linha separada da tabela aninhada NODE_DISTRIBUTION. Para exibir a fórmula de regressão completa, use o Visualizador de Árvore da Microsoft, clique no nó (Tudo) e abra a Legenda de Mineração.
SELECT FLATTENED NODE_DISTRIBUTION as t
FROM [Call Center Regression].CONTENT
Observação |
---|
Se você referenciar colunas individuais da tabela aninhada usando uma consulta como SELECT <column name> from NODE_DISTRIBUTION, algumas colunas, como SUPPORT ou PROBABILITY, devem ser colocadas entre colchetes para distingui-las das palavras-chave reservadas de mesmo nome. |
Resultados esperados:
t.ATTRIBUTE_NAME |
t.ATTRIBUTE_VALUE |
t.SUPPORT |
t.PROBABILITY |
t.VARIANCE |
t.VALUETYPE |
---|---|---|---|---|---|
Service Grade |
Missing |
0 |
0 |
0 |
1 |
Service Grade |
0.09875 |
120 |
1 |
0.00157927083333334 |
3 |
Average Time Per Issue |
0.00136989326310586 |
0 |
0 |
187.866597222222 |
7 |
Average Time Per Issue |
12.0822151449249 |
0 |
0 |
0 |
8 |
Average Time Per Issue |
79.8416666666667 |
0 |
0 |
187.866597222222 |
9 |
Total Operators |
-0.000426156789860463 |
0 |
0 |
24.0799305555556 |
7 |
Total Operators |
-3.19762422385219 |
0 |
0 |
0 |
8 |
Total Operators |
10.6916666666667 |
0 |
0 |
24.0799305555556 |
9 |
-0.00606823493688524 |
0 |
0 |
0.00121526993847281 |
11 |
Em comparação, na Legenda de Mineração, a fórmula de regressão aparece da seguinte forma:
Service Grade = 0.070+0.001*(Average Time Per Issue-79.842)-0.0004*(Total Operators-10.692)
Na Legenda de Mineração, alguns números podem estar arredondados; no entanto, a tabela NODE_DISTRIBUTION e a Legenda de Mineração contêm basicamente os mesmos valores.
Os valores na coluna VALUETYPE informa que tipo de informações estão em cada linha, o que será útil se você estiver processando os resultados programaticamente. A tabela a seguir mostra os tipos de valores produzidos para uma fórmula de regressão linear.
VALUETYPE |
---|
1 (Ausente) |
3 (Contínuo) |
7 (Coeficiente) |
8 (Ganho de pontos) |
9 (Estatísticas) |
7 (Coeficiente) |
8 (Ganho de pontos) |
9 (Estatísticas) |
11 (Interceptação) |
Para obter mais informações sobre o significado de cada tipo de valor para modelos de regressão, consulte Conteúdo do modelo de mineração para modelos de regressão linear (Analysis Services – Mineração de Dados).
Voltar ao início
Exemplo de consulta 3: Retornando o coeficiente do modelo
Ao usar a enumeração VALUETYPE, você só pode retornar o coeficiente da equação de regressão, conforme mostrado na seguinte consulta:
SELECT FLATTENED MODEL_NAME,
(SELECT ATTRIBUTE_VALUE, VALUETYPE
FROM NODE_DISTRIBUTION
WHERE VALUETYPE = 11)
AS t
FROM [Call Center Regression].CONTENT
Essa consulta retorna duas linhas, um a do conteúdo do modelo de mineração e a outra da tabela aninhada que contém o coeficiente. A coluna ATTRIBUTE_NAME não é incluída aqui porque sempre fica em branco para o coeficiente.
MODEL_NAME |
t.ATTRIBUTE_VALUE |
t.VALUETYPE |
---|---|---|
Call Center Regressors2 |
-0.00606823493688524 |
11 |
Fazendo previsões usando o modelo
Você pode criar consultas de previsão em modelos de regressão linear usando a guia Previsão do Modelo de Mineração no Designer de Mineração de Dados. O construtor de consultas de previsão está disponível no SQL Server Management Studio e no Business Intelligence Development Studio.
Observação |
---|
Também é possível criar consultas em modelos de regressão usando os Suplementos de Mineração de Dados para Excel do SQL Server 2005 ou do SQL Server 2008. Mesmo que os Suplementos de Mineração de Dados para Excel não criem modelos de regressão, você pode procurar e consultar qualquer modelo de mineração armazenado em uma instância do Analysis Services. |
Voltar ao início
Exemplo de consulta 4: Criando previsões usando uma consulta singleton
A maneira mais fácil de criar uma consulta singleton em um modelo de regressão é usando a caixa de diálogo Entrada de Consulta Singleton. Por exemplo, você pode criar a consulta DMX a seguir selecionando o modelo de regressão apropriado, escolhendo Consulta Singleton e digitando 10 como o valor de Total Operators.
SELECT
Predict([Call Center Regression].[Service Grade])
FROM
[Call Center Regression]
NATURAL PREDICTION JOIN
(SELECT 10 AS [Total Operators]) AS t
Resultados do exemplo:
Yearly Income |
---|
0.0992841946529471 |
Voltar ao início
Exemplo de consulta 5: Retornando estatísticas descritivas de um modelo de regressão
Você pode usar muitas das funções de previsão padrão com modelos de regressão linear. O exemplo a seguir demonstra como adicionar algumas estatísticas descritivas aos resultados da consulta de previsão.
SELECT
Predict([Call Center Regression].[Service Grade]) as [Predicted Service],
PredictStdev([Call Center Regression].[Service Grade]) as [Standard Deviation]
FROM
[Call Center Regression]
NATURAL PREDICTION JOIN
(SELECT 10 AS [Total Operators]) AS t
Resultados do exemplo:
Predicted Service |
Standard Deviation |
---|---|
0.0990447584463201 |
0.0348607220015996 |
Voltar ao início
Lista de funções de previsão
Todos os algoritmos Microsoft fornecem suporte a um conjunto comum de funções. Entretanto, o algoritmo Regressão Linear da Microsoft oferece suporte às funções adicionais relacionadas na tabela a seguir.
|
Para obter uma lista das funções comuns a todos os algoritmos Microsoft, consulte Algoritmos de mineração de dados (Analysis Services – Mineração de Dados). Para obter mais informações sobre como usar essas funções, consulte Referência de função de DMX (Data Mining Extensions).
Histórico de alterações
Conteúdo atualizado |
---|
Adicionados links no tópico para facilitar a revisão de exemplos de consultas. |
Alterado o exemplo para usar um modelo com um melhor ajuste. Adicionado um link para o novo tópico que descreve como criar um modelo de regressão linear de exemplo. |
Consulte também