Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
Um algoritmo de mineração de dados é um conjunto de heurísticas e cálculos que cria um modelo de mineração de dados a partir de dados. Para criar um modelo, o algoritmo primeiro analisa os dados fornecidos, procurando tipos específicos de padrões ou tendências. O algoritmo usa os resultados dessa análise para definir os parâmetros ideais para criar o modelo de mineração. Esses parâmetros são aplicados em todo o conjunto de dados para extrair padrões acionáveis e estatísticas detalhadas.
O modelo de mineração que um algoritmo cria de seus dados pode assumir várias formas, incluindo:
Um conjunto de clusters que descrevem como os casos em um conjunto de dados estão relacionados.
Uma árvore de decisão que prevê um resultado e descreve como diferentes critérios afetam esse resultado.
Um modelo matemático que prevê vendas.
Um conjunto de regras que descrevem como os produtos são agrupados em uma transação e as probabilidades de que os produtos sejam comprados juntos.
O Microsoft SQL Server Analysis Services fornece vários algoritmos para uso em suas soluções de mineração de dados. Esses algoritmos são implementações de algumas das metodologias mais populares usadas na mineração de dados. Todos os algoritmos de mineração de dados da Microsoft podem ser personalizados e totalmente programáveis usando as APIs fornecidas ou usando os componentes de mineração de dados no SQL Server Integration Services.
Você também pode usar algoritmos de terceiros que estejam em conformidade com a especificação OLE DB para Mineração de Dados ou desenvolver algoritmos personalizados que podem ser registrados como serviços e, em seguida, usados na estrutura de Mineração de Dados do SQL Server.
Escolhendo o algoritmo certo
Escolher o melhor algoritmo a ser usado para uma tarefa analítica específica pode ser um desafio. Embora você possa usar algoritmos diferentes para executar a mesma tarefa de negócios, cada algoritmo produz um resultado diferente e alguns algoritmos podem produzir mais de um tipo de resultado. Por exemplo, você pode usar o algoritmo Árvores de Decisão da Microsoft não apenas para previsão, mas também como uma maneira de reduzir o número de colunas em um conjunto de dados, pois a árvore de decisão pode identificar colunas que não afetam o modelo de mineração final.
Escolhendo um algoritmo por tipo
O Analysis Services inclui os seguintes tipos de algoritmo:
Algoritmos de classificação prevêem uma ou mais variáveis discretas, com base nos outros atributos no conjunto de dados.
Algoritmos de regressão prevêem uma ou mais variáveis contínuas, como lucro ou perda, com base em outros atributos no conjunto de dados.
Algoritmos de segmentação dividem dados em grupos ou clusters de itens que têm propriedades semelhantes.
Os algoritmos de associação encontram correlações entre atributos diferentes em um conjunto de dados. A aplicação mais comum desse tipo de algoritmo é a criação de regras de associação, que podem ser usadas em uma análise de cesta de mercado.
Algoritmos de análise de sequência resumem sequências ou episódios frequentes em dados, como um fluxo de navegação na Web.
No entanto, não há razão para que você esteja limitado a um algoritmo em suas soluções. Analistas experientes às vezes usam um algoritmo para determinar as entradas mais eficazes (ou seja, variáveis) e, em seguida, aplicam um algoritmo diferente para prever um resultado específico com base nesses dados. A mineração de dados do SQL Server permite que você crie vários modelos em uma única estrutura de mineração, portanto, em uma única solução de mineração de dados, você pode usar um algoritmo de clustering, um modelo de árvores de decisão e um modelo ingênuo do Bayes para obter exibições diferentes sobre seus dados. Você também pode usar vários algoritmos em uma única solução para executar tarefas separadas: por exemplo, você pode usar a regressão para obter previsões financeiras e usar um algoritmo de rede neural para executar uma análise de fatores que influenciam as vendas.
Escolhendo um algoritmo por tarefa
Para ajudá-lo a selecionar um algoritmo para uso com uma tarefa específica, a tabela a seguir fornece sugestões para os tipos de tarefas para as quais cada algoritmo é tradicionalmente usado.
| Exemplos de tarefas | Algoritmos da Microsoft a serem usados |
|---|---|
|
Prever um atributo discreto Sinalizar os clientes em uma lista de potenciais compradores como bons ou maus prospectos. Calcule a probabilidade de um servidor falhar nos próximos 6 meses. Categorize os resultados dos pacientes e explore os fatores relacionados. |
O Algoritmo de Árvores de Decisão da Microsoft Algoritmo Microsoft Naive Bayes Algoritmo de clustering da Microsoft Algoritmo de rede neural da Microsoft |
|
Prever um atributo contínuo Previsão das vendas do próximo ano. Prever visitantes do site dadas tendências históricas e sazonais passadas. Gere uma pontuação de risco dada a demografia. |
Algoritmo de Árvores de Decisão da Microsoft Algoritmo de Série Temporal da Microsoft Algoritmo de regressão linear da Microsoft |
|
Prever uma sequência Execute a análise de clickstream do site de uma empresa. Analise os fatores que levam à falha do servidor. Capture e analise sequências de atividades durante visitas ambulatoriais para formular práticas recomendadas em torno de atividades comuns. |
Algoritmo de Clustering de Sequência da Microsoft |
|
Localizando grupos de itens comuns em transações Use a análise de cesta de mercado para determinar o posicionamento do produto. Sugira produtos adicionais para um cliente para compra. Analise os dados da pesquisa de visitantes de um evento para identificar quais atividades ou estandes estavam correlacionados, a fim de planejar atividades futuras. |
Algoritmo de Associação da Microsoft Algoritmo de Árvores de Decisão da Microsoft |
|
Localizando grupos de itens semelhantes Crie grupos de perfis de risco de pacientes com base em atributos como dados demográficos e comportamentos. Analise os padrões de navegação e compra dos usuários. Identifique servidores com características de uso semelhantes. |
Algoritmo de clustering da Microsoft Algoritmo de Agrupamento de Sequência da Microsoft |
Conteúdo relacionado
A tabela a seguir fornece links para recursos de aprendizagem para cada um dos algoritmos de mineração de dados fornecidos no Analysis Services:
Tarefas Relacionadas
| Tópico | Descrição |
|---|---|
| Determinar o algoritmo usado por um modelo de mineração de dados | Consultar os parâmetros usados para criar um modelo de mineração |
| Criar um algoritmo de Plug-In personalizado | Algoritmos de plug-in |
| Explorar um modelo usando um visualizador específico do algoritmo | Visualizadores do modelo de Mineração de dados |
| Exibir o conteúdo de um modelo usando um formato de tabela genérico | Procurar um modelo usando o Visualizador de Árvore de Conteúdo Genérico da Microsoft |
| Saiba mais sobre como configurar seus dados e usar algoritmos para criar modelos |
Estruturas de mineração (Analysis Services – Mineração de dados) Modelos de mineração (Analysis Services – Mineração de dados) |