Compartilhar via


Distribuições de colunas (mineração de dados)

No MicrosoftSQL ServerAnalysis Services, é possível definir as distribuições de colunas em uma estrutura de mineração para simular como os algoritmos processarão os dados na colunas quando você criar modelos de mineração. Para alguns algoritmos, é útil definir a distribuição de colunas contínuas antes de processar o modelo, principalmente se as colunas contêm distribuições comuns de valores. Se não definir as distribuições, os modelos de mineração resultantes poderão produzir previsões menos precisas de que se as distribuições estivessem definidas, pois os algoritmos terão menos informações para interpretar os dados.

Os algoritmos que estão disponíveis em Analysis Services fornecem suporte aos seguintes tipos de distribuição:

  • Normal
    Os valores para a coluna contínua formam um histograma com uma distribuição normal.

    Histograma com distribuição normal

  • Log Normal
    Os valores para a coluna contínua formam um histograma, onde a curva é alongada na extremidade superior e é inclinada em direção à extremidade inferior.

    Histograma com distribuição normal de log

  • Uniform
    Os valores para a coluna contínua formam uma curva plana na qual todos os valores são igualmente prováveis.

    Histograma com distribuição uniforme

Para obter mais informações sobre os algoritmos que Analysis Services fornece, consulteAlgoritmos de mineração de dados (Analysis Services – Mineração de Dados).