Partilhar via


Criando previsões (Tutorial básico de mineração de dados)

Depois de testar a precisão de seus modelos de mineração e decidir que está satisfeito com os resultados, você pode gerar previsões usando o Construtor de Consultas de Previsão na guia Previsão do Modelo de Mineração no Designer de Mineração de Dados.

O Construtor de Consultas de Previsão tem três exibições. Com os modos de exibição Design e Consulta , você pode criar e examinar sua consulta. Em seguida, você pode executar a consulta e exibir os resultados na exibição Resultado .

Todas as consultas de previsão usam DMX, o que é curto para a linguagem DMX (Extensões de Mineração de Dados). DMX tem sintaxe como a do T-SQL, mas é usada para consultas em objetos de mineração de dados. Embora a sintaxe DMX não seja complicada, usar um construtor de consultas como este ou aquele no Add-Ins de Mineração de Dados do SQL Server para Office torna muito mais fácil selecionar entradas e expressões de build, portanto, é altamente recomendável que você aprenda as noções básicas.

Criando a consulta

A primeira etapa na criação de uma consulta de previsão é selecionar um modelo de mineração e uma tabela de entrada.

Para selecionar um modelo e uma tabela de entrada

  1. Na guia Previsão do Modelo de Mineração do Designer de Mineração de Dados, na caixa Modelo de Mineração , clique em Selecionar Modelo.

  2. Na caixa de diálogo Selecionar Modelo de Mineração , navegue pela árvore até a estrutura de Endereçamento Direcionado , expanda a estrutura, selecione TM_Decision_Treee clique em OK.

  3. Na caixa Selecionar Tabela de Entrada, clique em Selecionar Tabela de Casos.

  4. Na caixa de diálogo Selecionar Tabela , na lista Fonte de Dados , selecione a exibição de fonte de dados Adventure Works DW Multidimensional 2012.

  5. Em Nome da Tabela/Exibição, selecione a tabela ProspectiveBuyer (dbo) e clique em OK.

    A ProspectiveBuyer tabela mais se assemelha à tabela vTargetMail.

Mapeando as colunas

Depois de selecionar a tabela de entrada, o Construtor de Consultas de Previsão cria um mapeamento padrão entre o modelo de mineração e a tabela de entrada, com base nos nomes das colunas. Pelo menos uma coluna da estrutura deve corresponder a uma coluna nos dados externos.

Importante

Os dados que você usa para determinar a precisão dos modelos devem conter uma coluna que pode ser mapeada para a coluna previsível. Se essa coluna não existir, você poderá criar uma com valores vazios, mas ela deverá ter o mesmo tipo de dados que a coluna previsível.

Para mapear as entradas para o modelo

  1. Clique com o botão direito do mouse nas linhas que conectam a janela Modelo de Mineração à janela Selecionar Tabela de Entrada e selecione Modificar Conexões.

    Observe que nem todas as colunas são mapeadas. Adicionaremos mapeamentos para várias Colunas de Tabela. Também geraremos uma nova coluna de data de nascimento com base na coluna de data atual, para que as colunas correspondam melhor.

  2. Em Coluna de Tabela, clique na Bike Buyer célula e selecione ProspectiveBuyer.Unknown na lista suspensa.

    Isso mapeia a coluna predefinida, [Bike Buyer], para uma coluna da tabela de entrada.

  3. Clique em OK.

  4. No Gerenciador de Soluções, clique com o botão direito do mouse na exibição da fonte de dados Endereçamento Direcionado e selecione Exibir Designer.

  5. Clique com o botão direito do mouse na tabela, ProspectiveBuyer e selecione Novo Cálculo Nomeado.

  6. Na caixa de diálogo Criar Cálculo Nomeado , para o nome da coluna, digite calcAge.

  7. Para Descrição, digite Calcular idade com base na data de nascimento.

  8. Na caixa Expressão , digite DATEDIFF(YYYY,[BirthDate],getdate()) e clique em OK.

    Como a tabela de entrada não tem nenhuma coluna Age correspondente à do modelo, você pode usar essa expressão para calcular a idade do cliente da coluna BirthDate na tabela de entrada. Como a Age foi identificada como a coluna mais influente para prever a compra de bicicletas, ela deve existir tanto no modelo quanto na tabela de entrada.

  9. No Designer de Mineração de Dados, selecione a guia Previsão do Modelo de Mineração e abra novamente a janela Modificar Conexões .

  10. Em Coluna da Tabela, clique na célula Idade e selecione ProspectiveBuyer.calcAge na lista suspensa.

    Aviso

    Se você não vir a coluna na lista, talvez seja necessário atualizar a definição da exibição da fonte de dados carregada no designer. Para fazer isso, no menu Arquivo , selecione Salvar tudo e feche e abra novamente o projeto no designer.

  11. Clique em OK.

Criando a consulta de previsão

  1. O primeiro botão na barra de ferramentas da guia Previsão do Modelo de Mineração é a opção Alternar para o modo de exibição de design/Alternar para o modo de exibição de resultado/Alternar para o botão de exibição de consulta . Clique na seta para baixo neste botão e selecione Design.

  2. Na grade na guia Previsão do Modelo de Mineração , clique na célula na primeira linha vazia na coluna Origem e, em seguida, selecione Função de Previsão.

  3. Na linha Função de Previsão , na coluna Campo , selecione PredictProbability.

    Na coluna Alias da mesma linha, digite Probabilidade de resultado.

  4. Na janela Modelo de Mineração acima, selecione e arraste [Comprador de Bicicleta] para a célula Critérios/Argumento .

    Quando você solta, [TM_Decision_Tree].[Bike Buyer] aparece na célula Critérios/Argumento.

    Isso especifica a coluna de destino para a PredictProbability função. Para obter mais informações sobre funções, consulte Referência de função DMX (Extensões de Mineração de Dados).

  5. Clique na próxima linha vazia na coluna Origem e selecione TM_Decision_Tree modelo de mineração.

  6. Na linha TM_Decision_Tree, na coluna Campo, selecione Bike Buyer.

  7. TM_Decision_Tree Na linha, na coluna Critérios/Argumento, digite =1.

  8. Clique na próxima linha vazia na coluna Origem e selecione a tabela ProspectiveBuyer.

  9. Na linha ProspectiveBuyer, na coluna Campo, selecione ProspectiveBuyerKey.

    Isso adiciona o identificador exclusivo à consulta de previsão para identificar quem é e quem não é provável de comprar uma bicicleta.

  10. Adicione cinco linhas mais à grade. Para cada linha, selecione a tabela ProspectiveBuyer como a Origem e, em seguida, adicione as seguintes colunas nas células Field :

    • calcAge

    • Sobrenome

    • Primeiro Nome

    • AddressLine1

    • AddressLine2

Por fim, execute a consulta e navegue pelos resultados.

O Construtor de Consultas de Previsão também inclui estes controles:

  • Mostrar caixa de seleção

    Permite remover cláusulas da consulta sem precisar excluí-las do designer. Isso pode ser útil quando você está trabalhando com consultas complexas e deseja preservar a sintaxe sem precisar copiar e colar o DMX na janela.

  • Grupo

    Insere um parêntese de abertura (à esquerda) no início da linha selecionada ou insere um parêntese de fechamento (à direita) no final da linha atual.

  • E/OU

    Insere o AND operador ou o OR operador imediatamente após a função ou coluna atual.

Para executar a consulta e exibir os resultados

  1. Na guia Previsão do Modelo de Mineração , selecione o botão Resultado .

  2. Depois que a consulta for executada e os resultados forem exibidos, você poderá examinar os resultados.

    A guia Previsão do Modelo de Mineração exibe informações de contato para clientes potenciais que provavelmente serão compradores de bicicletas. A probabilidade da coluna de resultado indica a probabilidade da previsão estar correta. Você pode usar esses resultados para determinar quais clientes potenciais direcionar para o envio.

  3. Neste ponto, você pode salvar os resultados. Você tem três opções:

    • Clique com o botão direito do mouse em uma linha de dados nos resultados exibidos e selecione Copiar para salvar apenas esse valor (e o título da coluna) na Área de Transferência.

    • Clique com o botão direito do mouse em qualquer linha nos resultados e selecione Copiar Tudo para copiar todo o conjunto de resultados, incluindo títulos de coluna, para a Área de Transferência.

    • Clique em Salvar o resultado da consulta para salvar os resultados diretamente em um banco de dados da seguinte maneira:

      1. Na caixa de diálogo Salvar Resultado da Consulta de Mineração de Dados , selecione uma fonte de dados ou defina uma nova fonte de dados.

      2. Digite um nome para a tabela que conterá os resultados da consulta.

      3. Use a opção , Adicionar ao DSV, para criar a tabela e adicioná-la a uma exibição de fonte de dados existente. Isso é útil se você quiser manter todas as tabelas relacionadas para um modelo, como dados de treinamento, dados da fonte de previsão e resultados da consulta, na mesma exibição da fonte de dados.

      4. Use a opção Sobrescrever se existir para atualizar uma tabela existente com os resultados mais recentes.

        Você deve usar a opção para substituir a tabela se tiver adicionado colunas à consulta de previsão, alterado os nomes ou tipos de dados de qualquer coluna na consulta de previsão ou se tiver executado quaisquer instruções ALTER na tabela de destino.

        Além disso, se várias colunas tiverem o mesmo nome (por exemplo, o nome da coluna padrão Expressão), você deverá criar um alias para as colunas com nomes duplicados ou um erro será gerado quando o designer tentar salvar os resultados no SQL Server. O motivo é que o SQL Server não permite que várias colunas tenham o mesmo nome.

        Para obter mais informações, consulte Caixa de diálogo Salvar Resultado da Consulta de Mineração de Dados (Exibição de Previsão do Modelo de Mineração).

Próxima tarefa da lição

Usando análise detalhada em dados estruturais (Tutorial básico de mineração de dados)

Consulte Também

Criar uma consulta de previsão usando o Construtor de Consultas de Previsão