Columnas del modelo de minería de datos
Un modelo de minería de datos aplica un algoritmo de modelo de minería a los datos que se representan en una estructura de minería de datos. Al igual que la estructura, el modelo de minería de datos contiene columnas. La estructura de minería contiene el modelo de minería de datos y éste hereda todos los valores de las propiedades que define la estructura. El modelo puede utilizar todas las columnas que contiene la estructura de minería de datos o un subconjunto de las columnas.
En una columna de minería de datos puede definir dos elementos adicionales de información: uso y marcas de modelado.
El uso es una propiedad que define cómo el modelo va a usar la columna. Las columnas se pueden usar como columnas de entrada, de clave o de predicción.
Las marcas de modelado proporcionan al algoritmo información adicional sobre los datos que se definen en la tabla de casos, de forma que el algoritmo pueda generar un modelo más preciso. Puede definir marcas de modelado mediante programación usando el lenguaje DMX (Extensiones de minería de datos) o en el Diseñador de minería de datos de Business Intelligence Development Studio.
La siguiente lista describe las marcas de modelado que puede definir en una columna de modelo de minería de datos.
MODEL_EXISTENCE_ONLY
Indica que la presencia del atributo es más importante que los valores que están en la columna de atributos. Por ejemplo, considere una tabla de casos que contenga una lista de elementos de pedido asociados con un cliente determinado. Los datos de la tabla incluyen el tipo de producto, el Id. y el costo de cada elemento. Para el modelado, el hecho de que el cliente haya adquirido un elemento de pedido concreto podría ser más importante que el costo del propio elemento. En este caso, la columna de costo debería marcarse como MODEL_EXISTENCE_ONLY.REGRESSOR
Indica que el algoritmo puede usar la columna especificada en la fórmula de regresión de algoritmos de regresión. Esta marca se admite en los algoritmos de árboles de decisión y de serie temporal de Microsoft.
Para obtener más información sobre la configuración de la propiedad de uso y la definición de marcas de modelado mediante programación con DMX, vea CREATE MINING MODEL (DMX). Para obtener más información sobre la configuración de la propiedad de uso y la definición de marcas en Business Intelligence Development Studio, vea Administrar modelos de minería de datos en el Diseñador de minería de datos.
Vea también