Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
O algoritmo Regressão Linear da Microsoft é uma variação do algoritmo Árvores de Decisão da Microsoft que ajuda você a calcular uma relação linear entre uma variável dependente e independente e, em seguida, usar essa relação para previsão.
A relação assume a forma de uma equação para uma linha que melhor representa uma série de dados. Por exemplo, a linha no diagrama a seguir é a melhor representação linear possível dos dados.
Cada ponto de dados no diagrama tem um erro associado à distância da linha de regressão. Os coeficientes a e b na equação de regressão ajustam o ângulo e o local da linha de regressão. Você pode obter a equação de regressão ajustando a e b até que a soma dos erros associados a todos os pontos atinja seu mínimo.
Há outros tipos de regressão que usam várias variáveis e também métodos não lineares de regressão. No entanto, a regressão linear é um método útil e conhecido para modelar uma resposta a uma alteração em algum fator subjacente.
Exemplo
Você pode usar a regressão linear para determinar uma relação entre duas colunas contínuas. Por exemplo, você pode usar a regressão linear para calcular uma linha de tendência de dados de fabricação ou vendas. Você também pode usar a regressão linear como um precursor para o desenvolvimento de modelos de mineração de dados mais complexos, para avaliar as relações entre colunas de dados.
Embora haja muitas maneiras de calcular a regressão linear que não exigem ferramentas de mineração de dados, a vantagem de usar o algoritmo regressão linear da Microsoft para essa tarefa é que todas as relações possíveis entre as variáveis são calculadas e testadas automaticamente. Você não precisa selecionar um método de computação, como resolver para quadrados mínimos. No entanto, a regressão linear pode simplificar demais as relações em cenários em que vários fatores afetam o resultado.
Como o algoritmo funciona
O algoritmo Regressão Linear da Microsoft é uma variação do algoritmo Árvores de Decisão da Microsoft. Quando você seleciona o algoritmo regressão linear da Microsoft, um caso especial do algoritmo Árvores de Decisão da Microsoft é invocado, com parâmetros que restringem o comportamento do algoritmo e exigem determinados tipos de dados de entrada. Além disso, em um modelo de regressão linear, todo o conjunto de dados é usado para relações de computação na passagem inicial, enquanto um modelo de árvores de decisão padrão divide os dados repetidamente em subconjuntos ou árvores menores.
Dados necessários para modelos de regressão linear
Ao preparar dados para uso em um modelo de regressão linear, você deve entender os requisitos para o algoritmo específico. Isso inclui a quantidade de dados necessária e como os dados são usados. Os requisitos para esse tipo de modelo são os seguintes:
Uma única coluna de chave Cada modelo deve conter uma coluna numérica ou de texto que identifique exclusivamente cada registro. Chaves compostas não são permitidas.
Uma coluna previsível Requer pelo menos uma coluna previsível. Você pode incluir vários atributos previsíveis em um modelo, mas os atributos previsíveis devem ser tipos de dados numéricos contínuos. Você não pode usar um tipo de dados datetime como um atributo previsível, mesmo que o armazenamento nativo para os dados seja numérico.
Colunas de entrada As colunas de entrada devem conter dados numéricos contínuos e receber o tipo de dados apropriado.
Para obter mais informações, consulte a seção Requisitos da Referência Técnica do Algoritmo de Regressão Linear da Microsoft.
Exibindo um modelo de regressão linear
Para explorar o modelo, use o Microsoft Tree Viewer. A estrutura de árvore para um modelo de regressão linear é muito simples, com todas as informações sobre a equação de regressão contidas em um único nó. Para obter mais informações, consulte Procurar um modelo usando o Microsoft Tree Viewer.
Se você quiser saber mais detalhes sobre a equação, também poderá exibir os coeficientes e outros detalhes usando o Visualizador de Árvore de Conteúdo Genérico da Microsoft.
Para um modelo de regressão linear, o conteúdo do modelo inclui metadados, a fórmula de regressão e estatísticas sobre a distribuição de valores de entrada. Para obter mais informações, consulte Conteúdo do Modelo de Mineração para Modelos de Regressão Linear (Analysis Services – Mineração de Dados).
Criando previsões
Depois que o modelo for processado, os resultados serão armazenados como um conjunto de estatísticas junto com a fórmula de regressão linear, que você pode usar para calcular tendências futuras. Para obter exemplos de consultas a serem usadas com um modelo de regressão linear, consulte exemplos de consulta de modelo de regressão linear.
Para obter informações gerais sobre como criar consultas em modelos de mineração, consulte Consultas de mineração de dados.
Além de criar um modelo de regressão linear selecionando o algoritmo regressão linear da Microsoft, se o atributo previsível for um tipo de dados numérico contínuo, você poderá criar um modelo de árvore de decisão que contenha regressões. Nesse caso, o algoritmo dividirá os dados quando encontrar pontos de separação apropriados, mas para algumas regiões de dados, criará uma fórmula de regressão. Para obter mais informações sobre árvores de regressão em um modelo de árvores de decisão, consulte Conteúdo do Modelo de Mineração para Modelos de Árvores de Decisão (Analysis Services – Mineração de Dados).
Observações
Não dá suporte ao uso da PMML (Predictive Model Markup Language) para criar modelos de mineração.
Não dá suporte à criação de dimensões de mineração de dados.
Permite detalhamento por meio de drill-through.
Dá suporte ao uso de modelos de mineração OLAP.
Consulte Também
Algoritmos de Mineração de Dados (Analysis Services – Mineração de Dados)Referência Técnica do Algoritmo de Regressão Linear da MicrosoftExemplos de Consultas de Modelo de Regressão LinearConteúdo do Modelo de Mineração para Modelos de Regressão Linear (Analysis Services – Mineração de Dados)