Distribuciones de columnas (minería de datos)
En MicrosoftSQL ServerAnalysis Services puede definir distribuciones de columnas en una estructura de minería de datos para modificar la forma en que los algoritmos procesan los datos de estas columnas cuando se crean modelos de minería de datos. Para algunos algoritmos, resulta útil definir la distribución de las columnas continuas antes de procesar el modelo, si se sabe que las columnas contienen distribuciones de valores comunes. Si no define las distribuciones, los modelos resultantes pueden producir predicciones menos precisas que si las distribuciones hubieran sido definidas, ya que los algoritmos tendrán menos información a partir de la cual interpretar los datos.
Los algoritmos que están disponibles en Analysis Services admiten los siguientes tipos de distribución:
Normal
Los valores de la columna continua forman un histograma con una distribución normal.Log Normal
Los valores de la columna continua forman un histograma, donde la curva se alarga en el extremo superior y se desvía hacia el extremo inferior.Uniform
Los valores de la columna continua forman una curva plana, en la que todos los valores son iguales.
Para obtener más información sobre los algoritmos que proporciona Analysis Services, vea Algoritmos de minería de datos (Analysis Services: Minería de datos).