Tutorial DMX Comprador de bicicleta
Nesse tutorial, você aprenderá a criar, treinar e explorar modelos de mineração de dados, utilizando a linguagem de consulta DMX (Extensões de Mineração de Dados). Você então utilizará esses modelos de mineração de dados para criar previsões que determinem se um cliente comprará uma bicicleta.
Os modelos de mineração serão criados a partir dos dados contidos no banco de dados de amostra AdventureWorksDW2008R2, que armazena dados da empresa fictícia Ciclos da Adventure Works. Ciclos da Adventure Works é uma grande indústria multinacional. A empresa fabrica e vende bicicletas de metal e compostas para os mercados norte-americano, europeu e asiático. A central de operações está situada em Bothell, Washington, com 290 funcionários, e possui várias equipes regionais de vendas distribuídas por toda a sua base de mercado internacional. Para obter mais informações sobre o banco de dados de amostra AdventureWorksDW2008R2, consulte Data Warehouse de exemplo Adventure Works.
Cenário do tutorial
A Ciclos da Adventure Works decidiu estender a análise de dados, criando um aplicativo personalizado que usa a funcionalidade de data mining. Sua meta para o aplicativo personalizado é ser capaz de:
Usar como entrada as características específicas sobre um cliente potencial e prever se eles comprarão uma bicicleta.
Usar como entrada uma lista de cliente potenciais, assim como características sobre clientes e prever quais comprarão uma bicicleta.
No primeiro caso, os dados de cliente são fornecidos por uma página de registro de cliente e, no segundo caso, uma lista de clientes potenciais é fornecida pelo departamento de marketing da Ciclos da Adventure Works.
Além disso, o departamento de marketing solicitou a capacidade de agrupar clientes existentes em categorias com base em características como onde eles vivem, o número de filhos que possuem e a distância do trabalho. Eles querem consultar se esses agrupamentos podem ser usados para ajudar a estabelecer como meta tipos específicos de clientes. Isso irá requerer um modelo de mineração adicional.
O Microsoft SQL Server Analysis Services fornece várias ferramentas que podem ser usadas para executar essas tarefas:
A linguagem de consulta DMX
O algoritmo Árvores de Decisão da Microsoft e o algoritmo Microsoft Clustering
Editor de Consultas do SQL Server Management Studio
DMX (Extensões de Mineração de Dados) é uma linguagem de consulta fornecida por Analysis Services que pode ser usada para criar e trabalhar com modelos de mineração. O algoritmo Árvores de Decisão da Microsoft cria modelos que podem ser usados para prever se alguém comprará uma bicicleta. O modelo resultante pode usar cliente individual ou uma tabela de clientes como uma entrada. O algoritmo Microsoft Clustering pode criar agrupamentos de clientes com base em características compartilhadas. O objetivo deste tutorial é fornecer os scripts DMX que serão usados no aplicativo personalizado.
Para obter mais informações:, Projetos de mineração de dados (Analysis Services - Mineração de Dados)
Estrutura de mineração e modelos de mineração
Antes de começar a criar instruções DMX, é importante compreender os objetos principais que o Analysis Services usa para criar modelos de mineração. A estrutura de mineração é uma estrutura de dados que define o domínio de dados do qual modelos de mineração são criados. Uma única estrutura de mineração pode conter vários modelos de mineração que compartilham o mesmo domínio. Um modelo de mineração aplica um algoritmo de modelo de mineração aos dados que são representados por uma estrutura de mineração.
Os blocos de construção da estrutura de mineração são as colunas da estrutura de mineração, que descrevem os dados que a fonte de dados contém. Essas colunas contêm informações como tipo de dados, tipo de conteúdo e como os dados são distribuídos.
Os modelos de mineração devem conter a coluna chave descrita na estrutura de mineração, bem como um subconjunto das colunas restantes. O modelo de mineração define o uso para cada coluna e define o algoritmo que é utilizado para criar o modelo de mineração. Por exemplo, em DMX você pode especificar que uma coluna é uma coluna Chave ou uma coluna PREDICT. Se uma coluna não for especificada, será assumido que é uma coluna de entrada.
Em DMX, há dois modos para criar modelos de mineração. Você pode criar a estrutura de mineração e o modelo de mineração associado juntos utilizando a instrução CREATE MINING MODEL, ou pode criar primeiro uma estrutura de mineração utilizando a instrução CREATE MINING STRUCTURE e, em seguida, adicionar um modelo de mineração à estrutura utilizando a instrução ALTER STRUCTURE. Esses métodos são descritos na tabela a seguir.
CREATE MINING MODEL
Use essa instrução para criar juntos uma estrutura de mineração e modelo de mineração associado usando o mesmo nome. O nome de modelo de mineração é acrescentado com "Structure" para diferenciá-lo da estrutura de mineração. Essa instrução será útil se você estiver criando uma estrutura de mineração que contenha um único modelo de mineração.Para obter mais informações, consulte CRIAR UM MODELO DE MINERAÇÃO (DMX).
ALTER MINING STRUCTURE
Use essa instrução para acrescentar um modelo de mineração a uma estrutura de mineração que já existe no servidor. Essa instrução será útil se você quiser criar uma estrutura de mineração que contenha vários modelos de mineração diferentes. Há várias razões pelas quais você pode desejar adicionar mais de um modelo de mineração em uma única estrutura de mineração. Por exemplo, é possível criar vários modelos de mineração que usam algoritmos diferentes para verificar qual algoritmo funciona melhor. Você pode criar vários modelos de mineração que usam o mesmo algoritmo, mas com um parâmetro definido de modo diferente para cada modelo de mineração a fim de encontrar a melhor definição para o parâmetro.Para obter mais informações, consulte ALTER MINING STRUCTURE (DMX).
Como criará uma estrutura que contém vários modelos de mineração, você utilizará o método secundário neste tutorial.
Para obter mais informações
Referência DMX (Data Mining Extensions), Compreendendo a instrução Select (DMX), Consultas de previsão (DMX)
O que você aprenderá
Este tutorial se divide nas lições a seguir:
Lição 1: Criando a estrutura de mineração de Comprador de Bicicleta
Nesta lição, você aprenderá a usar a instrução CREATE para criar estruturas de mineração.Lição 2: Adicionando modelos de mineração à estrutura de mineração de Comprador de Bicicleta
Nesta lição, você aprenderá a usar a instrução ALTER para adicionar modelos de mineração a uma estrutura de mineração.Lição 3: Processando a estrutura de mineração Comprador de Bicicleta
Nesta lição, você aprenderá a usar a instrução INSERT INTO para processar estruturas de mineração e seus modelos de mineração associados.Lição 4: Explorando modelos de mineração Comprador de Bicicleta
Nesta lição, você aprenderá a usar a instrução SELECT para explorar o conteúdo dos modelos de mineração.Lição 5: Executando previsão de consultas
Nesta lição, você aprenderá a usar a instrução PREDICTION JOIN para criar previsões em relação aos modelos de mineração.
Requisitos
Antes de fazer este tutorial, verifique se os seguintes itens estão instalados:
Microsoft SQL Server
Microsoft SQL Server 2005 Analysis Services (SSAS), SQL Server 2008 Analysis Services (SSAS) ou SQL Server Analysis Services
O banco de dados AdventureWorksDW2008R2. Por padrão, e para reforçar a segurança, os bancos de dados de exemplo não são instalados. Para instalar um banco de dados de exemplo no Microsoft SQL Server, visite a página Banco de dados de exemplo Microsoft SQL e selecione os bancos de dados que deseja instalar. Para obter mais informações sobre como instalar o banco de dados de exemplo, consulte Instalação inicial (Analysis Services).
Observação |
---|
Ao examinar os tutoriais, recomendamos que você adicione os botões Próximo Tópico e Tópico Anterior à barra de ferramentas do visualizador de documentos. Para obter mais informações, consulte Adicionando os botões Próximo e Anterior à Ajuda. |
Consulte também