Asistente para minería de datos
El Asistente para minería de datos de Microsoft SQL Server 2005 Analysis Services (SSAS) se ejecuta cada vez que se agrega una nueva estructura de minería de datos a un proyecto de minería de datos. El asistente define nuevas estructuras y también define el modelo de minería de datos inicial para cada estructura. La estructura del modelo inicial, incluyendo las tablas y columnas, se deriva de una vista de origen de datos o un cubo existentes.
Puede realizar las siguientes tareas con el Asistente para minería de datos:
- Especificar si se genera la estructura y los modelos de minería de datos desde una base de datos relacional o desde un cubo existente de una base de datos OLAP.
- Especificar el algoritmo que se va a usar en la creación del modelo inicial.
- Especificar la vista de origen de datos o la dimensión del cubo que contiene los datos de aprendizaje con los que se crea el modelo.
- Definir el conjunto de escenarios mediante la especificación de una tabla de escenarios y tablas anidadas desde un origen de datos relacional, o la clave de escenario y las columnas de nivel de escenario desde un origen de datos OLAP.
- Definir el uso de las columnas del conjunto de escenarios.
- Detectar de forma automática y configurar el contenido y los tipos de datos de la columna.
- Segmentar el cubo, si el modelo de minería de datos se basa en un origen de datos OLAP.
- Dar nombre a la nueva estructura de minería de datos y al modelo inicial de minería de datos.
- Crear una nueva dimensión de minería de datos, si el modelo de minería de datos se basa en un origen de datos OLAP.
Después de finalizar el Asistente para minería de datos, utilice el Diseñador de minería de datos para modificar la estructura y los modelos de minería de datos, y para examinar y predecir usando estos modelos.
Para obtener más información:Diseñador de minería de datos
Usar el Asistente para minería de datos
Para iniciar el Asistente para minería de datos, agregue una nueva estructura de minería de datos a un proyecto de Analysis Services usando el Explorador de soluciones o el menú Proyecto de Business Intelligence Development Studio.
El Asistente para minería de datos tiene dos bifurcaciones, una por cada tipo de origen de datos:
- Modelos relacionales de minería de datos
- Modelos OLAP de minería de datos
Modelos relacionales de minería de datos
Cuando se crea un modelo de minería de datos desde un origen de datos relacional de Analysis Services, previamente se especifica en el Asistente para minería de datos que se desea usar una base de datos relacional para definir la estructura del modelo. Después, se especifica la técnica de minería de datos que se va a utilizar, seleccionando el algoritmo más apropiado para el tipo de análisis de minería de datos que se desea.
Para obtener más información:Algoritmos de minería de datos
Especificar la vista de origen de datos y los tipos de tablas
Los siguientes pasos en el asistente consisten en seleccionar la vista de origen de datos específica que se desea usar para definir la estructura de minería de datos y en especificar una tabla de escenarios. La tabla de escenarios incluye los datos de aprendizaje que utilizará para entrenar el modelo de minería de datos. Si sus datos se incluyen en varias tablas, también puede especificar las tablas que se anidarán en la tabla de escenarios.
Para obtener más información:Tablas anidadas
Especificar el uso de columnas
Después de especificar la tabla de escenarios y las tablas anidadas, determina el tipo de uso de cada columna de las tablas que se incluirán en la estructura de minería de datos. Si no define un tipo de uso para una columna, ésta no se incluirá en la estructura de minería de datos. Las columnas de minería de datos pueden ser de cuatro tipos: de clave, de entrada, de predicción o una combinación de entrada y predicción. Las columnas de clave contiene un único identificador para cada fila de una tabla. Algunos modelos de minería de datos, como los modelos de serie temporal y de clústeres de secuencia, pueden contener varias columnas de clave. Las columnas de entrada proporcionan la información desde la cual se crean las predicciones. Las columnas de predicción contienen la información que se intenta predecir en el modelo de minería de datos.
Por ejemplo, una serie de tablas puede contener los Id. de los clientes, información demográfica y la cantidad de dinero que cada cliente gasta en una tienda determinada. El Id. de cliente define de forma única al cliente y también relaciona la tabla de escenarios con las tablas anidadas, por lo que podría utilizarlo como columna de clave. Puede usar una selección de columnas de información demográfica como columnas de entrada, y la columna que describe la cantidad de dinero que gasta cada cliente como columna de predicción. De esta forma, podría crea un modelo de minería de datos que relacione los datos demográficos con la cantidad de dinero que un cliente gasta en una tienda. Puede usar este modelo como base para la comercialización directa.
El Asistente para minería de datos ofrece la característica Sugerir, que se habilita cuando se selecciona una columna de predicción. Los conjuntos de datos contienen, con frecuencia, más columnas de las que puede desear para generar el modelo de minería de datos. La característica Sugerir calcula una puntuación numérica, de 0 a 1, que describe la relación de cada columna del conjunto de datos con la columna de predicción. Basándose en esta puntuación, la característica sugiere las columnas que se pueden usar como entrada para el modelo de minería de datos. Si utiliza la característica Sugerir, puede usar las columnas sugeridas, modificar las selecciones para que se ajusten a sus necesidades o pasar por alto las sugerencias.
Especificar el contenido y los tipos de datos
Después de seleccionar una o más columnas de predicción y de entrada, puede especificar el contenido y los tipos de datos de cada columna.
Para obtener más información:Tipos de datos (minería de datos), Tipos de contenido (minería de datos)
Finalizar el Asistente
El último paso del asistente es dar nombre a la estructura de minería de datos y al modelo asociado. Si selecciona Permitir obtención de detalles, habilitará la funcionalidad de obtención de detalles en el modelo. Esto permite examinar los datos de origen que se usan para generar el modelo.
Volver al principio
Modelos OLAP de minería de datos
Cuando se crea un modelo de minería de datos multidimensional desde un origen de datos OLAP de Analysis Services, previamente se especifica en el Asistente para minería de datos que se desea usar un cubo existente para definir la estructura del modelo. Después, se especifica la técnica de minería de datos que se va a utilizar, seleccionando el algoritmo más apropiado para el tipo de análisis de minería de datos que se desea.
Para obtener más información:Algoritmos de minería de datos
Especificar el origen de datos y la clave de escenario
A continuación, se selecciona la dimensión de cubo que se va a utilizar como origen de datos para definir la estructura de minería de datos. Después, se selecciona un atributo que se va a usar como la clave, o clave de escenario, del modelo de minería de datos.
[!NOTA] El modelo de minería de datos OLAP que se crea y el cubo de origen que se utiliza para crear el modelo deben encontrarse en la misma base de datos de Analysis Services.
Especificar las columnas de nivel de escenario y el uso de columnas
Después de seleccionar una clave de escenario, los atributos y las medidas asociadas con la clave aparecerán en una vista de árbol en la siguiente página del asistente. En esta lista, selecciona los atributos y las medidas que se van a usar como las columnas de la estructura. Estas columnas se conocen como columnas de nivel de escenario. Como en el modelo relacional, también debe especificar cómo se va a utilizar cada columna de la estructura. Esto se puede hacer en la siguiente página del asistente. Las columnas pueden ser de clave, de entrada, de predicción, de entrada y predicción o no seleccionado.
Agregar tablas anidadas
La bifurcación OLAP del Asistente para minería de datos incluye la opción de agregar tablas anidadas a la estructura del modelo de minería de datos. En la página Especificar el uso de las columnas del modelo de minería de datos del asistente, haga clic en Agregar tablas anidadas para abrir un cuadro de diálogo independiente que le guiará por los pasos para agregar tablas anidadas. Sólo aparecen los grupos de medida que se aplican a la dimensión. Seleccione un grupo de medida que contenga la clave externa de la dimensión de escenario. Después, especifique el uso de cada columna del grupo de medida, ya sea de entrada o de predicción. El asistente agregará la tabla anidada a la tabla de escenarios. El nombre predeterminado de la tabla anidada es el nombre de la dimensión anidada, pero puede dar otro nombre a esta tabla y a sus columnas. Para obtener más información:Tablas anidadas
Especificar el contenido y los tipos de datos
Después de seleccionar una o más columnas de predicción y de entrada, puede especificar el contenido y los tipos de datos de cada columna.
Para obtener más información:Tipos de datos (minería de datos), Tipos de contenido (minería de datos)
Segmentar el cubo de origen
En la bifurcación OLAP del asistente, puede limitar el ámbito del modelo de minería de datos mediante la segmentación del cubo de origen antes de entrenar el modelo. Segmentar un cubo es similar a agregar una claúsula WHERE a una instrucción SQL. Por ejemplo, si un cubo contiene información sobre la compra de productos, puede limitar un atributo de edad a mayor que 30, una columna de género a sólo femenino y una fecha de compra a no anterior a marzo de 2000. De esa forma, puede limitar el modelo para que abarque el ámbito de una mujer mayor de 30 años que ha adquirido un producto después de marzo de 2000.
Finalizar el Asistente
El último paso del asistente es dar nombre a la estructura de minería de datos y al modelo asociado. Si selecciona Permitir obtención de detalles, habilitará la funcionalidad de obtención de detalles del modelo. Esto permite examinar los datos de origen que se usan para generar el modelo. También puede especificar, basándose en el modelo de minería de datos, si desea agregar una nueva dimensión al cubo de origen o crear un nuevo cubo desde el modelo de minería de datos.
Volver al principio
Vea también
Conceptos
Crear una nueva estructura de minería de datos
Administrar modelos de minería de datos en el Diseñador de minería de datos
Conceptos de minería de datos
Usar las herramientas de minería de datos
Trabajar con minería de datos
Otros recursos
Temas de procedimientos de la ficha Estructura de minería de datos