Algoritmos de mineração de dados (Analysis Services – Mineração de Dados)
O algoritmo de mineração de dados é o mecanismo que cria um modelo de mineração de dados. Para criar um modelo, um algoritmo primeiro analisa um conjunto de dados e procura padrões e tendências específicos. O algoritmo usa os resultados dessa análise para definir os parâmetros do modelo de mineração. Esses parâmetros são aplicados pelo conjunto de dados inteiro para extrair padrões acionáveis e estatísticas detalhadas.
O modelo de mineração que um algoritmo cria pode assumir vários formatos, incluindo:
Um conjunto de regras que descreve como são agrupados produtos em uma transação.
Uma árvore de decisão que prevê se um determinado cliente comprará um produto.
Um modelo matemático que prevê as vendas.
Um conjunto de clusters que descreve como os casos em um conjunto de dados estão relacionados.
Microsoft SQL Server Analysis Services fornece vários algoritmos para serem usados nas soluções de mineração de dados. Esses algoritmos são um subconjunto de todos os algoritmos que podem ser usados para mineração de dados. Você também pode usar algoritmos de terceiros compatíveis com a especificação OLE DB para Data Mining. Para obter mais informações sobre esses algoritmos de terceiros, consulte Algoritmos de plug-in.
Tipos de algoritmos de mineração de dados
O Analysis Services inclui os seguintes tipos de algoritmos:
Algoritmos de classificação prevêem uma ou mais variáveis discretas, com base nos outros atributos do conjunto de dados. Um exemplo de um algoritmo de classificação é Algoritmo Árvores de Decisão da Microsoft.
Algoritmos de regressão prevêem uma ou mais variáveis contínuas, como lucro ou perda, com base nos outros atributos do conjunto de dados. Um exemplo de um algoritmo de regressão é Algoritmo MTS.
Algoritmos de segmentação dividem dados em grupos ou clusters de itens que têm propriedades semelhantes. Um exemplo de um algoritmo de segmentação é Algoritmo Microsoft Clustering.
Algoritmos de associação encontram correlações entre atributos diferentes em um conjunto de dados. A aplicação mais comum desse tipo de algoritmo é para criar regras de associação, que podem ser usadas em uma análise de cesta básica. Um exemplo de um algoritmo de associação é Algoritmo Associação da Microsoft.
Algoritmos de análise de seqüência resumem seqüências freqüentes ou episódios em dados, como um fluxo de caminho da Web. Um exemplo de um algoritmo de seqüência é Algoritmo MSC.
Aplicando os algoritmos
A escolha do melhor algoritmo para uma tarefa empresarial específica pode ser um desafio. Embora você possa usar algoritmos diferentes para executar a mesma tarefa empresarial, cada algoritmo produz um resultado diferente e alguns podem produzir mais de um tipo de resultado. Por exemplo, você pode usar o algoritmo Árvores de Decisão da Microsoft não apenas para previsão, mas também como uma maneira de reduzir o número de colunas em um conjunto dados uma vez que a árvore de decisão pode identificar colunas que não afetam o modelo de mineração final.
Você também não tem que usar algoritmos independentemente. Em uma solução de mineração de dados, é possível usar alguns algoritmos para explorar dados e, em seguida, usar outros algoritmos para prever um resultado específico com base nesses dados. Por exemplo, você pode usar um algoritmo de cluster, que reconhece padrões, para dividir dados em grupos que são mais ou menos homogêneos e, em seguida, usar os resultados para criar um modelo de árvore de decisão melhor. Você pode usar vários algoritmos em uma solução para executar tarefas separadas, por exemplo, usando um algoritmo de árvore de regressão para obter informações de previsão financeira e um algoritmo com base em regras para executar uma melhor análise de cesta básica.
Os modelos de mineração podem prever valores, produzir resumos de dados e localizar correlações ocultas. Para ajudar você a selecionar algoritmos para a solução de mineração de dados, a tabela a seguir fornece sugestões para quais algoritmos devem ser usados para tarefas específicas.
Tarefa |
Algoritmos da Microsoft a serem usados |
---|---|
Prevendo um atributo discreto. Por exemplo, prever se o destinatário da campanha de mala-direta comprará um produto. |
Algoritmo Árvores de Decisão da Microsoft Algoritmo Naïve Bayes da Microsoft Algoritmo Microsoft Clustering Algoritmo Rede Neural da Microsoft, (Analysis Services – Mineração de Dados) |
Prevendo um atributo contínuo. Por exemplo, prever as vendas do próximo ano. |
|
Prevendo uma seqüência. Por exemplo, executar uma análise de seqüência de cliques no site da empresa. |
|
Localizando grupos de itens comuns em transações. Por exemplo, usar a análise de cesta básica para sugerir produtos adicionais a um cliente para compra. |
|
Localizando grupos de itens semelhantes. Por exemplo, segmentar dados demográficos em grupos para entender melhor as relações entre atributos. |
Uma vez que cada modelo retorna um tipo diferente de resultado, o Analysis Services fornece um visualizador separado para cada algoritmo. Quando você procura um modelo de mineração no Analysis Services, o modelo é exibido na guia Visualizador do Modelo de Mineração do Designer de Mineração de Dados, que usa o visualizador adequado ao modelo. Para obter mais informações, consulte Exibindo um modelo de mineração de dados.
Detalhes do algoritmo
A tabela a seguir fornece links para os tipos de informações disponíveis para cada algoritmo:
Descrição do algoritmo básico Fornece uma explicação básica do que o algoritmo faz e como funciona, junto com um cenário comercial no qual esse algoritmo pode ser útil.
Referência técnica Lista os parâmetros que podem ser definidos para controlar o comportamento do algoritmo e personalizar os resultados no modelo. Fornece detalhes técnicos adicionais sobre a implementação do algoritmo, dicas de desempenho e requisitos de dados.
Consultando um modelo Fornece exemplos de consultas que você pode usar com cada tipo modelo.É possível consultar um modelo para obter mais informações sobre seus padrões ou fazer previsões com base nesses padrões.
Conteúdo do modelo de mineração Descreve o modo como as informações são armazenadas em uma estrutura comum para todos os tipos de modelo e explica como interpretar essas informações. Após criar um modelo, você poderá explorá-lo usando os visualizadores fornecidos no BI Development Studio ou escrever consultas para retornar informações diretamente do conteúdo do modelo utilizando DMX.