Distribuições de colunas (mineração de dados)
No Microsoft SQL Server Analysis Services, é possível definir as distribuições de colunas em uma estrutura de mineração para simular como os algoritmos processarão os dados na colunas quando você criar modelos de mineração. Com relação a certos algoritmos, é útil definir a distribuição de colunas contínuas antes de processar o modelo, principalmente quando se sabe que as colunas contêm distribuições comuns de valores. Se as distribuições não estiverem definidas, os modelos de mineração resultantes poderão produzir previsões menos precisas do que se as distribuições estiverem definidas, uma vez que os algoritmos terão menos informações com as quais interpretar dados.
Os algoritmos que estão disponíveis em Analysis Services fornecem suporte aos seguintes tipos de distribuição:
Normal
Os valores para a coluna contínua formam um histograma com uma distribuição normal.Log Normal
Os valores para a coluna contínua formam um histograma, onde a curva é alongada na extremidade superior e é inclinada em direção à extremidade inferior.Uniform
Os valores para a coluna contínua formam uma curva plana, na qual todos os valores são igualmente prováveis.
Para obter mais informações sobre os algoritmos que Analysis Services fornece, consulteAlgoritmos de mineração de dados (Analysis Services – Mineração de Dados).
Consulte também
Referência
Conceitos
Tipos de conteúdo (mineração de dados)
Estruturas de mineração (Analysis Services – Mineração de dados)