Distribuições de colunas (mineração de dados)
No Microsoft SQL Server Analysis Services, você pode definir distribuições de coluna em uma estrutura de mineração para afetar como os algoritmos processam os dados nessas colunas ao criar modelos de mineração. Com relação a certos algoritmos, é útil definir a distribuição de colunas contínuas antes de processar o modelo, principalmente quando se sabe que as colunas contêm distribuições comuns de valores. Se as distribuições não estiverem definidas, os modelos de mineração resultantes poderão produzir previsões menos precisas do que se as distribuições estiverem definidas, uma vez que os algoritmos terão menos informações com as quais interpretar dados.
Os algoritmos disponíveis no Analysis Services dão suporte aos seguintes tipos de distribuição:
Normal
Os valores da coluna contínua formam um histograma com uma distribuição normal.
Log Normal
Os valores da coluna contínua formam um histograma, em que a curva é alongada na extremidade superior e é distorcida em direção à extremidade inferior.
Uniform
Os valores da coluna contínua formam uma curva plana, na qual todos os valores são igualmente prováveis.
Para obter mais informações sobre os algoritmos fornecidos pelo Analysis Services, consulte Algoritmos de mineração de dados (Analysis Services – Mineração de Dados).
Consulte Também
Tipos de conteúdo (Mineração de Dados)Estruturas de Mineração (Analysis Services – Mineração de Dados)Métodos de Discretização (Mineração de Dados)Distribuições (DMX)Colunas de Estrutura de Mineração