Criando previsões (Tutorial de mineração de dados básico)
Publicado: dezembro de 2016
Aplicável a: SQL Server 2016 Preview
Depois de testar a precisão dos modelos de mineração e decidir que está satisfeito com os resultados, você poderá gerar previsões usando o construtor de consultas de previsão no previsão do modelo de mineração guia no Designer de mineração de dados.
O Construtor de Consultas de Previsão contém três exibições. Com o Design e consulta modos de exibição, você pode construir e examinar sua consulta. Você pode executar a consulta e exibir os resultados no resultado exibição.
Todas as consultas de previsão usam DMX, que é a abreviação da linguagem Data Mining Extensions. O DMX tem sintaxe semelhante à de T-SQL mas é usado para consultas em objetos de mineração de dados. Embora a sintaxe DMX não é complicado, usando um construtor de consultas como esta, ou do SQL Server Data Mining Add-Ins do Office, facilita muito a seleção de entradas e construir expressões, portanto, é altamente recomendável que você aprenda os conceitos básicos.
Criando a consulta
A primeira etapa na criação de uma consulta de previsão é selecionar um modelo de mineração e tabela de entrada.
Para selecionar um modelo e uma tabela de entrada
No previsão do modelo de mineração Guia do Data Mining Designer, no modelo de mineração clique em Selecionar modelo.
No Selecionar modelo de mineração caixa de diálogo caixa, navegue pela árvore até ao mala estrutura, expanda a estrutura, selecione TM_Decision_Tree, e, em seguida, clique em OK.
No Selecionar tabela (s) de entrada clique em Selecionar tabela de casos.
No Selecionar tabela na caixa de fonte de dados selecione o modo de exibição de fonte de dados Adventure Works DW Multidimensional 2012.
Em nome de tabela/exibição, selecione o ProspectiveBuyer (dbo) da tabela e, em seguida, clique em OK.
O ProspectiveBuyer tabela mais parecida com a vTargetMail tabela de casos.
Mapeando as colunas
Depois de selecionar a tabela de entrada, o Construtor de Consultas de Previsão cria um mapeamento padrão entre o modelo de mineração e a tabela de entrada, com base nos nomes das colunas. Pelo menos uma coluna da estrutura deve corresponder a uma coluna nos dados externos.
Importante
Os dados que você usa para determinar a precisão dos modelos devem conter uma coluna que possa ser mapeada para a coluna previsível. Se essa coluna não existir, você poderá criar uma com valores vazios, mas ela precisa ter o mesmo tipo de dados que a coluna previsível.
Para mapear as entradas para o modelo
Clique com botão direito as linhas que conectam o modelo de mineração janela para o Selecionar tabela de entrada janela e selecione modificar conexões.
Observe que nem todas as colunas são mapeadas. Adicionaremos mapeamentos para várias colunas da tabela. Também geraremos uma nova coluna de data de aniversário com base na coluna de data atual, visando melhorar a correspondência das colunas.
Em coluna da tabela, clique o comprador de bicicleta célula e selecione Prospectivebuyer no menu suspenso.
Isso mapeia a coluna previsível, [Comprador de Bicicleta], para uma coluna da tabela de entrada.
Clique em OK.
Em Solution Explorer, com o botão direito do mala exibição da fonte de dados e selecione View Designer.
A tabela, ProspectiveBuyer e selecione novo cálculo nomeado.
No criar cálculo nomeado caixa de diálogo para nome de coluna, tipo calcAge.
Para Descrição, tipo Calcular idade com base na data de nascimento.
No expressão digite DATEDIFF(YYYY,[BirthDate],getdate()) e, em seguida, clique em OK.
Como a tabela de entrada não tem idade coluna correspondente no modelo, você pode usar essa expressão para calcular a idade do cliente da coluna BirthDate da tabela de entrada. Uma vez que idade foi identificada como mais influentes coluna para prever a compra de bicicletas, ele deve existir no modelo e na tabela de entrada.
No Designer de mineração de dados, selecione o previsão do modelo de mineração guia e abra novamente o modificar conexões janela.
Em coluna da tabela, clique o idade célula e selecione Prospectivebuyer no menu suspenso.
Aviso
Se você não encontrar a coluna na lista, poderá ter que atualizar a definição da exibição da fonte de dados que é carregada no designer. Para fazer isso, a partir de arquivo menu, selecione Salvar tudo, e, em seguida, feche e reabra o projeto no designer.Clique em OK.
Criando a consulta de previsão
O primeiro botão na barra de ferramentas do previsão do modelo de mineração guia é o Alternar para criar exibir / alternar para modo de exibição de resultado / alternar para modo de exibição de consulta botão. Clique na seta para baixo no botão e selecione Design.
Na grade de previsão do modelo de mineração clique na célula na primeira linha vazia no fonte coluna e selecione função de previsão.
No função de previsão linha, o campo coluna, selecione PredictProbability.
No Alias coluna da mesma linha, digite probabilidade de resultado.
Do modelo de mineração janela acima, selecione e arraste [comprador de bicicleta] para o critérios/argumento célula.
Ao soltar, [TM_Decision_Tree]. [Bike Buyer] aparece no critérios/argumento célula.
Especifica a coluna de destino para o PredictProbability função. Para obter mais informações sobre funções, consulte DMX ( DMX &41; Referência de função.
Clique na próxima linha vazia no fonte coluna e, em seguida, selecione modelo de mineração TM_Decision_Tree**.**
No TM_Decision_Tree linha, o campo coluna, selecione comprador de bicicleta.
No TM_Decision_Tree linha, o critérios/argumento coluna, digite = 1.
Clique na próxima linha vazia no fonte coluna e selecione tabela ProspectiveBuyer.
No ProspectiveBuyer linha, o campo coluna, selecione ProspectiveBuyerKey.
Essa ação adicionará o identificador exclusivo à consulta de previsão para que você possa identificar a probabilidade de alguém comprar ou não uma bicicleta.
Adicione mais cinco linhas à grade. Para cada linha, selecione tabela ProspectiveBuyer como o fonte e, em seguida, adicione as seguintes colunas de campo células:
calcAge
LastName
FirstName
AddressLine1
AddressLine2
Por fim, execute a consulta e navegue pelos resultados.
O Construtor de consultas de previsão também inclui esses controles:
Mostrar caixa de seleção
Permite remover as cláusulas de consulta sem precisar excluí-las do designer. Essa opção pode ser útil quando você está trabalhando com consultas complexas e deseja preservar a sintaxe sem precisar copiar e colar a linguagem DMX na janela.
Agrupar
insere um parênteses de abertura (à esquerda) no início da linha selecionada, ou insere um parêntese de fechamento (à direita) no final da linha atual.
E/OU
Insere o AND operador ou o OR operador imediatamente após a função atual ou a coluna.
Para executar a consulta e exibir resultados
No previsão do modelo de mineração guia, selecione o resultado botão.
Depois que a consulta for executada e os resultados exibidos, você poderá revisá-los.
O previsão do modelo de mineração guia exibe informações de contato para clientes potenciais que provavelmente serão compradores de bicicleta. O probabilidade de resultado coluna indica a probabilidade da previsão estar correta. Você poderá usar esses resultados para determinar para quais clientes em potencial a mala direta deverá ser direcionada.
Neste momento, você pode salvar os resultados. Você tem três opções:
Uma linha de dados nos resultados e selecione cópia Salvar apenas esse valor (e no cabeçalho da coluna) para a área de transferência.
Clique em qualquer linha nos resultados e selecione Copiar tudo para copiar o conjunto de resultados inteiro, inclusive títulos de coluna, na área de transferência.
Clique em Salvar resultado da consulta para salvar os resultados diretamente em um banco de dados da seguinte maneira:
No Salvar resultado mineração de dados consulta caixa de diálogo, selecione uma fonte de dados ou definir uma nova fonte de dados.
Digite um nome para a tabela que conterá os resultados da consulta.
Use a opção Adicione à DSV, para criar a tabela e adicioná-la a uma exibição de fonte de dados existente. Isto será útil se você quiser manter todas as tabelas relacionadas para um modelo, por exemplo, dados de treinamento, dados de origem de previsão e resultados de consulta, na mesma exibição da fonte de dados.
Use a opção Substituir se existir, para atualizar uma tabela existente com os resultados mais recentes.
Use a opção para substituir a tabela se você adicionou alguma coluna à consulta de previsão, alterou os nomes ou tipos de dados de alguma coluna na consulta de previsão, ou se executou alguma instrução ALTER na tabela de destino.
Além disso, se várias colunas tiverem o mesmo nome (por exemplo, o nome de coluna padrão expressão) você deve criar um alias para as colunas com nomes duplicados ou um erro será gerado quando o designer tentar salvar os resultados no SQL Server. A razão é que o SQL Server não permite que várias colunas tenham o mesmo nome.
Para obter mais informações, consulte dados mineração consulta resultado da caixa de diálogo Salvar & #40. 41; & de exibição do modelo de previsão de mineração.
Próxima tarefa da lição
Usando o detalhamento na estrutura de dados & #40. Tutorial de mineração de dados básicos e 41;
Consulte também
Criar uma consulta de previsão usando o construtor de consultas de previsão