Partilhar via


Algoritmos de mineração de dados (Analysis Services – Mineração de dados)

Um algoritmo de mineração de dados é um conjunto de heurísticas e cálculos que cria um modelo de mineração de dados a partir de dados. Para criar um modelo, o algoritmo primeiro analisa os dados fornecidos, procurando tipos específicos de padrões ou tendências. O algoritmo usa os resultados dessa análise para definir os parâmetros ideais para criar o modelo de mineração. Esses parâmetros são aplicados em todo o conjunto de dados para extrair padrões acionáveis e estatísticas detalhadas.

O modelo de mineração que um algoritmo cria de seus dados pode assumir várias formas, incluindo:

  • Um conjunto de clusters que descrevem como os casos em um conjunto de dados estão relacionados.

  • Uma árvore de decisão que prevê um resultado e descreve como diferentes critérios afetam esse resultado.

  • Um modelo matemático que prevê vendas.

  • Um conjunto de regras que descrevem como os produtos são agrupados em uma transação e as probabilidades de que os produtos sejam comprados juntos.

O Microsoft SQL Server Analysis Services fornece vários algoritmos para uso em suas soluções de mineração de dados. Esses algoritmos são implementações de algumas das metodologias mais populares usadas na mineração de dados. Todos os algoritmos de mineração de dados da Microsoft podem ser personalizados e totalmente programáveis usando as APIs fornecidas ou usando os componentes de mineração de dados no SQL Server Integration Services.

Você também pode usar algoritmos de terceiros que estejam em conformidade com a especificação OLE DB para Mineração de Dados ou desenvolver algoritmos personalizados que podem ser registrados como serviços e, em seguida, usados na estrutura de Mineração de Dados do SQL Server.

Escolhendo o algoritmo certo

Escolher o melhor algoritmo a ser usado para uma tarefa analítica específica pode ser um desafio. Embora você possa usar algoritmos diferentes para executar a mesma tarefa de negócios, cada algoritmo produz um resultado diferente e alguns algoritmos podem produzir mais de um tipo de resultado. Por exemplo, você pode usar o algoritmo Árvores de Decisão da Microsoft não apenas para previsão, mas também como uma maneira de reduzir o número de colunas em um conjunto de dados, pois a árvore de decisão pode identificar colunas que não afetam o modelo de mineração final.

Escolhendo um algoritmo por tipo

O Analysis Services inclui os seguintes tipos de algoritmo:

  • Algoritmos de classificação prevêem uma ou mais variáveis discretas, com base nos outros atributos no conjunto de dados.

  • Algoritmos de regressão prevêem uma ou mais variáveis contínuas, como lucro ou perda, com base em outros atributos no conjunto de dados.

  • Algoritmos de segmentação dividem dados em grupos ou clusters de itens que têm propriedades semelhantes.

  • Os algoritmos de associação encontram correlações entre atributos diferentes em um conjunto de dados. A aplicação mais comum desse tipo de algoritmo é a criação de regras de associação, que podem ser usadas em uma análise de cesta de mercado.

  • Algoritmos de análise de sequência resumem sequências ou episódios frequentes em dados, como um fluxo de navegação na Web.

No entanto, não há razão para que você esteja limitado a um algoritmo em suas soluções. Analistas experientes às vezes usam um algoritmo para determinar as entradas mais eficazes (ou seja, variáveis) e, em seguida, aplicam um algoritmo diferente para prever um resultado específico com base nesses dados. A mineração de dados do SQL Server permite que você crie vários modelos em uma única estrutura de mineração, portanto, em uma única solução de mineração de dados, você pode usar um algoritmo de clustering, um modelo de árvores de decisão e um modelo ingênuo do Bayes para obter exibições diferentes sobre seus dados. Você também pode usar vários algoritmos em uma única solução para executar tarefas separadas: por exemplo, você pode usar a regressão para obter previsões financeiras e usar um algoritmo de rede neural para executar uma análise de fatores que influenciam as vendas.

Escolhendo um algoritmo por tarefa

Para ajudá-lo a selecionar um algoritmo para uso com uma tarefa específica, a tabela a seguir fornece sugestões para os tipos de tarefas para as quais cada algoritmo é tradicionalmente usado.

Exemplos de tarefas Algoritmos da Microsoft a serem usados
Prever um atributo discreto

Sinalizar os clientes em uma lista de potenciais compradores como bons ou maus prospectos.

Calcule a probabilidade de um servidor falhar nos próximos 6 meses.

Categorize os resultados dos pacientes e explore os fatores relacionados.
O Algoritmo de Árvores de Decisão da Microsoft

Algoritmo Microsoft Naive Bayes

Algoritmo de clustering da Microsoft

Algoritmo de rede neural da Microsoft
Prever um atributo contínuo

Previsão das vendas do próximo ano.

Prever visitantes do site dadas tendências históricas e sazonais passadas.

Gere uma pontuação de risco dada a demografia.
Algoritmo de Árvores de Decisão da Microsoft

Algoritmo de Série Temporal da Microsoft

Algoritmo de regressão linear da Microsoft
Prever uma sequência

Execute a análise de clickstream do site de uma empresa.

Analise os fatores que levam à falha do servidor.

Capture e analise sequências de atividades durante visitas ambulatoriais para formular práticas recomendadas em torno de atividades comuns.
Algoritmo de Clustering de Sequência da Microsoft
Localizando grupos de itens comuns em transações

Use a análise de cesta de mercado para determinar o posicionamento do produto.

Sugira produtos adicionais para um cliente para compra.

Analise os dados da pesquisa de visitantes de um evento para identificar quais atividades ou estandes estavam correlacionados, a fim de planejar atividades futuras.
Algoritmo de Associação da Microsoft

Algoritmo de Árvores de Decisão da Microsoft
Localizando grupos de itens semelhantes

Crie grupos de perfis de risco de pacientes com base em atributos como dados demográficos e comportamentos.

Analise os padrões de navegação e compra dos usuários.

Identifique servidores com características de uso semelhantes.
Algoritmo de clustering da Microsoft

Algoritmo de Agrupamento de Sequência da Microsoft

A tabela a seguir fornece links para recursos de aprendizagem para cada um dos algoritmos de mineração de dados fornecidos no Analysis Services:

Descrição básica do algoritmo Explica o que o algoritmo faz e como ele funciona e descreve possíveis cenários de negócios em que o algoritmo pode ser útil.
Algoritmo de Associação da Microsoft

Algoritmo de clustering da Microsoft

Algoritmo de Árvores de Decisão da Microsoft

Algoritmo de regressão linear da Microsoft

Algoritmo de regressão logística da Microsoft

Algoritmo Microsoft Naive Bayes

Algoritmo de rede neural da Microsoft

Algoritmo de Clustering de Sequência da Microsoft

Algoritmo de Série Temporal da Microsoft
Referência técnica Fornece detalhes técnicos sobre a implementação do algoritmo, com referências acadêmicas conforme necessário. Lista os parâmetros que você pode definir para controlar o comportamento do algoritmo e personalizar os resultados no modelo. Descreve os requisitos de dados e fornece dicas de desempenho, se possível.
Referência técnica do algoritmo de associação da Microsoft

Referência técnica do algoritmo de clustering da Microsoft

Referência técnica do algoritmo Árvores de Decisão da Microsoft

Referência técnica do algoritmo de regressão linear da Microsoft

Referência técnica do algoritmo de regressão logística da Microsoft

Referência técnica do algoritmo Microsoft Naive Bayes

Referência técnica do algoritmo de rede neural da Microsoft

Referência técnica do algoritmo de agrupamento sequencial da Microsoft

Referência técnica do algoritmo de série temporal da Microsoft
Conteúdo do modelo Explica como as informações são estruturadas em cada tipo de modelo de mineração de dados e explica como interpretar as informações armazenadas em cada um dos nós.
Conteúdo do modelo de mineração para modelos de associação (Analysis Services – Mineração de dados)

Conteúdo do modelo de mineração para modelos de agrupamento (Analysis Services – Mineração de dados)

Conteúdo do modelo de mineração para modelos de árvore de decisão (Analysis Services – Mineração de dados)

Conteúdo do modelo de mineração para modelos de regressão linear (Analysis Services – Mineração de dados)

Conteúdo do modelo de mineração para modelos de regressão logística (Analysis Services – Mineração de dados)

Conteúdo do modelo de mineração para Modelos Bayesianos Ingênuos (Serviços de Análise – Mineração de Dados)

Conteúdo do modelo de mineração para modelos de rede neural (Analysis Services – Mineração de dados)

Conteúdo do modelo de mineração para modelos de agrupamento de sequências (Analysis Services – Mineração de dados)

Conteúdo do modelo de mineração para modelos de série temporal (Analysis Services – Mineração de dados)
Consultas de mineração de dados Fornece várias consultas que você pode usar com cada tipo de modelo. Exemplos incluem consultas de conteúdo que permitem saber mais sobre os padrões no modelo e consultas de previsão para ajudá-lo a criar previsões com base nesses padrões.
Exemplos de consulta de modelo de associação

Exemplos de consulta de modelo de clustering

Exemplos de consulta de modelo de árvores de decisão

Exemplos de consulta de modelo de regressão linear

Exemplos de consulta de modelo de regressão logística

Exemplos de consulta de modelo naive Bayes

Exemplos de consulta de modelo de rede neural

Exemplos de consulta de modelo de agrupamento de sequência

Exemplos de consulta de modelo de série temporal
Tópico Descrição
Determinar o algoritmo usado por um modelo de mineração de dados Consultar os parâmetros usados para criar um modelo de mineração
Criar um algoritmo de Plug-In personalizado Algoritmos de plug-in
Explorar um modelo usando um visualizador específico do algoritmo Visualizadores do modelo de Mineração de dados
Exibir o conteúdo de um modelo usando um formato de tabela genérico Procurar um modelo usando o Visualizador de Árvore de Conteúdo Genérico da Microsoft
Saiba mais sobre como configurar seus dados e usar algoritmos para criar modelos Estruturas de mineração (Analysis Services – Mineração de dados)

Modelos de mineração (Analysis Services – Mineração de dados)

Consulte Também

Ferramentas de Mineração de Dados