Compartilhar via


Modelos de mineração (Analysis Services – Mineração de Dados)

Esta seção explica a arquitetura básica de um modelo de mineração de dados, apresenta uma visão geral das propriedades de um modelo de mineração de dados e descreve as maneiras pelas quais é possível criar e trabalhar com um modelo de mineração.

Arquitetura do modelo de mineração

Definindo modelos de mineração

Propriedades do modelo de mineração

Colunas do modelo de mineração

Processando os modelos de mineração

Exibindo e consultando modelos de mineração

Arquitetura do modelo de mineração

Um modelo de mineração obtém dados de uma estrutura de mineração e analisa esses dados usando um algoritmo de mineração de dados. A estrutura e o modelo de mineração são objetos separados. A estrutura de mineração armazena informações que definem a fonte de dados. Um modelo de mineração armazena informações derivadas do processamento estatístico de dados, como os padrões encontrados em decorrência da análise.

Um modelo de mineração fica vazio até que os dados fornecidos pela estrutura de mineração sejam processados e analisados. Depois de processado, o modelo contém metadados, resultados e associações à estrutura de mineração.

modelo contém metadados, padrões e associações

Os metadados especificam o nome do modelo e o servidor em que ele está armazenado, bem como uma definição do modelo, incluindo uma lista das colunas da estrutura de mineração usadas na criação do modelo, as definições de filtros opcionais aplicados durante o processamento do modelo e o algoritmo usado para analisar os dados. A escolha de colunas, filtros e algoritmo influencia bastante os resultados da análise. Por exemplo, se você criar um modelo de clustering e um modelo de árvores de decisão usando os mesmos dados, o conteúdo dos modelos talvez seja muito diferente, já que eles utilizam algoritmos e filtros diferentes. Para obter mais informações, consulte Conteúdo do modelo de mineração (Analysis Services – Mineração de dados).

Os resultados armazenados no modelo variam de acordo com o algoritmo, mas podem incluir padrões, conjuntos de itens, regras e fórmulas. Esses resultados podem ser usados para fazer previsões.

As associações armazenadas no modelo apontam para os dados armazenados em cache na estrutura de mineração. Se os dados tiverem sido armazenados em cache na estrutura e não forem limpos após o processamento, essas associações lhe permitirão detalhar dos resultados para os casos com suporte para os resultados. No entanto, os dados reais são armazenados no cache de estrutura, não no modelo.

[Início]

Definindo modelos de mineração de dados

Você pode criar um modelo de mineração de dados nas seguintes etapas:

  • Crie a estrutura de mineração subjacente.

  • Selecione um algoritmo.

  • Especifique as colunas e o uso do modelo.

  • Se desejar, defina parâmetros para ajustar o processamento pelo algoritmo.

  • Processe o modelo.

O Analysis Services fornece as seguintes ferramentas para ajudá-lo a gerenciar seus modelos de mineração:

  • O Assistente de Mineração de Dados o ajuda a criar uma estrutura e o modelo de mineração relacionado. Esse é o método mais fácil de usar. O assistente cria automaticamente a estrutura de mineração necessária e o ajuda com a definição de configurações importantes.

  • Uma instrução DMX CREATE MODEL pode ser usada para definir um modelo. A estrutura necessária é criada automaticamente como parte do processo; assim, não é possível reutilizar uma estrutura existente com esse método. Use esse método se você já souber exatamente qual modelo deseja criar.

  • É possível usar uma instrução DMX ALTER STRUCTURE ADD MODEL para adicionar um novo modelo de mineração a uma estrutura existente. Use esse método se quiser fazer experiências com modelos diferentes que se baseiam no mesmo conjunto de dados.

Também é possível criar modelos de mineração programaticamente, com o uso de AMO ou XML/A, ou outros clientes, como o Cliente de Mineração de Dados para Excel. Para obter mais informações, consulte os seguintes tópicos:

Objetos de Gerenciamento de Análise (AMO)

Introdução à Analysis Services Scripting Language

Referência DMX (Data Mining Extensions)

[Início]

Propriedades do modelo de mineração

Cada modelo de mineração tem propriedades que definem o modelo e seus metadados. Eles podem incluir o nome, a descrição, a data do último processamento do modelo, as permissões no modelo e os filtros nos dados que são usados para treinamento.

Cada modelo de mineração também tem propriedades derivadas da estrutura de mineração que descrevem as colunas de dados usadas pelo modelo. Se a coluna for uma tabela aninhada, ela também poderá ter um filtro separado aplicado.

Além disso, cada modelo de mineração contém duas propriedades especiais: Algorithm e Usage.

  • **Propriedade Algoritmo   **Especifica o algoritmo usado para criar o modelo. Os algoritmos disponíveis dependem do provedor que você está usando. Para obter uma lista dos algoritmos incluídos no SQL Server Analysis Services, consulte Algoritmos de mineração de dados (Analysis Services – Mineração de Dados). A propriedade Algorithm é aplicada ao modelo de mineração e pode ser definida apenas uma vez para cada modelo. É possível alterar o algoritmo posteriormente, mas algumas colunas do modelo de mineração poderão se tornar inválidas, se não tiverem suporte do algoritmo escolhido. Além disso, você deve reprocessar sempre o modelo seguindo as alterações.

  • **Propriedade Usage   ** Define como cada coluna é usada pelo modelo. É possível definir o uso da coluna como Input, Predict, Predict Only ou Key. A propriedade Usage é aplicada às colunas dos modelos de mineração individuais e deve ser definida individualmente para cada coluna que esteja incluída em um modelo. Se a estrutura contiver uma coluna que não é usada no modelo, o uso será definido como Ignore.

Você pode alterar o valor das propriedades do modelo de mineração após criar um modelo de mineração. No entanto, qualquer alteração, até mesmo no nome do modelo de mineração, requer que você o processe novamente. Depois de processar o modelo novamente, talvez você obtenha resultados diferentes.

[Início]

Colunas do modelo de mineração

Assim como a estrutura de mineração, o modelo de mineração contém colunas. É possível escolher quais colunas da estrutura de mineração usar no modelo. Além de usar as colunas na estrutura de mineração subjacente, você pode criar cópias das colunas da estrutura de mineração e renomeá-las ou alterar seu uso.

Dependendo do algoritmo escolhido, algumas colunas na estrutura de mineração talvez sejam incompatíveis com o modelo ou talvez levem a resultados fracos. Você deve examinar os dados na estrutura atentamente e incluir no modelo apenas as colunas que fizerem sentido para análise. Se você achar que uma coluna não deve ser usada, não será necessário excluí-la da estrutura ou modelo de mineração; em vez disso, basta definir um sinalizador na coluna que especifica se ela deve ser ignorada durante a criação do modelo. Isso significa que a coluna permanecerá na estrutura de mineração, mas não será usada no modelo de mineração; no entanto, se o detalhamento estiver habilitado do modelo para a estrutura de mineração, você poderá recuperar as informações da coluna posteriormente.

Após criar o modelo, você poderá fazer alterações, como adicionar ou remover colunas, ou alterar o nome do modelo. No entanto, qualquer alteração, até mesmo apenas aos metadados do modelo, requer que você processe o modelo novamente.

Para obter mais informações, consulte Colunas da estrutura de mineração e Colunas do modelo de mineração.

[Início]

Processando os modelos de mineração

Um modelo de mineração de dados é um objeto vazio até ser processado. Quando você processa um modelo, os dados armazenados em cache pela estrutura são passados por um filtro, caso tenha sido definido no modelo, e analisados pelo algoritmo. O algoritmo identifica as regras e os padrões nos dados e usa essas regras e padrões para preencher o modelo. Para obter mais informações sobre como os algoritmos são utilizados para criar modelos de mineração, consulte Algoritmos de mineração de dados (Analysis Services – Mineração de Dados).

Após o processamento, o modelo de mineração também armazena informações sobre os resultados da análise. Para obter mais informações sobre o tipo de dados armazenado em um modelo de mineração, consulte Conteúdo do modelo de mineração (Analysis Services – Mineração de dados).

[Início]

Exibindo e consultando modelos de mineração

Depois de processar um modelo, você pode explorá-lo usando os visualizadores personalizados fornecidos no Business Intelligence Development Studio e no SQL Server Management Studio. Para obter mais informações sobre os visualizadores personalizados no Analysis Services, consulte Exibindo um modelo de mineração de dados.

Também é possível criar consultas referentes ao modelo de mineração para fazer previsões ou recuperar metadados do modelo ou os padrões criados pelo modelo. Para criar consultas, use DMX. Para obter informações sobre os diferentes tipos de consultas que você pode usar em um modelo de mineração, consulte Consultando modelos de mineração de dados (Analysis Services - Mineração de dados).