Compartir a través de


Crear una nueva estructura de minería de datos

Para generar una solución de minería de datos en MicrosoftSQL ServerAnalysis Services, el primer paso es crear una estructura de minería de datos mediante Asistente para minería de datos (Analysis Services - Minería de datos) en Business Intelligence Development Studio. La estructura de minería de datos define el dominio de los datos desde el que se generan los modelos de minería de datos. Todos los modelos de minería de datos se basan en una estructura.

Las estructuras de minería de datos usan orígenes de datos relacionales o de procesamiento analítico en línea (OLAP). Las estructuras de minería de datos relacionales se basan en los datos almacenados en sistemas de bases de datos relacionales, definidos como una vista de origen de datos. Las estructuras de minería de datos de OLAP se basan en una dimensión y en las medidas relacionadas de un cubo OLAP existentes en la misma base de datos que la estructura de minería de datos.

Para obtener más información:Diseñar bases de datos, Diseñar objetos de base de datos multidimensionales de Analysis Services

El Asistente para minería de datos define automáticamente una estructura de minería de datos y le permite agregar a la misma un modelo de minería de datos inicial. Debido a que la estructura de minería de datos puede contener varios modelos de minería de datos, puede utilizar el Diseñador de minería de datos para agregar más modelos de minería de datos a la estructura.

En las secciones siguientes se proporciona más información sobre cómo crear las nuevas estructuras de minería de datos con el Asistente para minería de datos y cómo establecer opciones en la estructura de minería de datos que le permitirán crear un conjunto de pruebas o ejecutar consultas sobre los datos en la estructura de minería de datos.

  • Crear una estructura de minería de datos relacional

  • Crear una estructura de minería de datos OLAP

  • Habilitar la exclusión y la obtención de detalles

Crear una estructura de minería de datos relacional

Las estructuras de minería de datos relacionales pueden estar basadas en cualquier dato que esté disponible mediante un origen de datos OLE DB. Si los datos de origen están incluidos en varias tablas, puede pasarlos al asistente como una sola tabla de casos utilizando tablas anidadas.

Para obtener más información:Tablas anidadas (Analysis Services - Minería de datos)

El Asistente para minería de datos le guiará por los siguientes pasos para crear la estructura de un nuevo modelo de minería de datos:

  1. Seleccionar un tipo de origen de datos, en este caso una base de datos relacional.

  2. Decidir si generar sólo una estructura o una estructura con un modelo de minería de datos.

  3. Seleccionar un algoritmo para el modelo.

  4. Seleccionar un origen de datos.

  5. Seleccionar una tabla de casos y, de forma opcional, tablas anidadas.

  6. Seleccionar el tipo de cada columna: de predicción, de entrada o de clave.

  7. Especificar los tipos de contenido de columna.

  8. Especificar un conjunto de datos de exclusión opcional.

  9. Habilitar la obtención de detalles en la estructura: denominar y guardar la nueva estructura de minería de datos y el modelo de minería de datos asociado.

Para obtener más información:Algoritmos de minería de datos (Analysis Services: Minería de datos), Columnas del modelo de minería de datos, Columnas de la estructura de minería de datos, Tipos de datos (minería de datos), Tipos de contenido (minería de datos)

Crear una estructura de minería de datos OLAP

Los cubos OLAP suelen contener tantos miembros y dimensiones que puede resultar complicado saber dónde comenzar con la minería de datos. Para ayudar a identificar los patrones que contienen los cubos, normalmente se identifica una única dimensión de interés y, a continuación, se empieza a explorar patrones relacionados con dicha dimensión. En la siguiente tabla se enumeran varias tareas de minería de datos OLAP habituales, se describen casos de ejemplo en los que podría aplicar cada tarea y se identifica el algoritmo de minería de datos que se debe utilizar para cada tarea.

Tarea

Caso de ejemplo

Algoritmo

Agrupar miembros en clústeres

Segmentar una dimensión de cliente en función de las propiedades de miembro del cliente, los productos que éste adquiere cliente y la cantidad de dinero que gastan los clientes.

Algoritmo de agrupación en clústeres de Microsoft

Buscar miembros interesantes o anómalos

Identificar tiendas interesantes o anómalas en una dimensión de tiendas basada en ventas, beneficios, ubicación de la tiendas y tamaño.

Algoritmo de árboles de decisión de Microsoft

Buscar celdas interesantes o anómalas

Identificar ventas en tiendas que no siguen las tendencias habituales en un período de tiempo.

Algoritmo de serie temporal de Microsoft

El Asistente para minería de datos le guiará por el proceso siguiente para crear la estructura de un nuevo modelo de minería de datos:

  1. Seleccionar un tipo de origen de datos, en este caso un cubo.

  2. Seleccionar un algoritmo.

  3. Seleccionar una dimensión del cubo de origen.

  4. Seleccionar una clave de caso.

  5. Seleccionar columnas de caso.

  6. Seleccionar tablas anidadas.

  7. Seleccionar el uso de cada columna: de predicción, de entrada o de clave.

  8. Especificar los tipos de contenido de columna.

  9. Segmentar el cubo de origen.

  10. Crear un conjunto de datos de pruebas opcional.

  11. Asignar nombre y guardar la nueva estructura de minería de datos y el modelo de minería de datos asociado.

Puede establecer las siguientes opciones en la última página del asistente:

  • Permitir la obtención de detalles

  • Crear dimensión de modelo de minería de datos

  • Crear el cubo con la dimensión del modelo de minería de datos

Si elige crear una nueva dimensión del modelo de minería de datos en el cubo de origen, puede incluir la información que encuentre el algoritmo de minería de datos en el origen de datos OLAP. Al crear una dimensión del modelo de minería de datos, puede examinar y consultar el contenido del modelo, en forma de una dimensión. Esta opción está disponible para los modelos generados mediante los algoritmos de clústeres de Microsoft, de árboles de decisión de Microsoft y de reglas de asociación de Microsoft.

Si selecciona la opción para crear un nuevo cubo, éste se define en la base de datos que incluye la dimensión del modelo de minería de datos y, opcionalmente, cualquier dimensión relacionada.

Para obtener más información:Algoritmos de minería de datos (Analysis Services: Minería de datos), Columnas del modelo de minería de datos, Columnas de la estructura de minería de datos, Tipos de datos (minería de datos), Tipos de contenido (minería de datos)

Habilitar la obtención de detalles y la exclusión

Al crear la estructura de minería de datos, también debe establecer dos opciones importantes para trabajar con los datos: exclusión y obtención de detalles. La exclusión es una característica de SQL Server 2008 que le permite crear particiones de los datos en la estructura de minería de datos en un conjunto de entrenamiento y un conjunto de pruebas; puede utilizarse con todos los modelos asociados a dicha estructura. Para obtener más información, vea Crear particiones de los datos en conjuntos de entrenamiento y de pruebas (Analysis Services - Minería de datos).

La obtención de detalles le permite ver los datos de origen en la estructura de minería de datos si consulta el modelo de minería de datos. Esto resulta útil cuando se examinan los resultados de un modelo de minería de datos y se desea ver los detalles adicionales de los casos subyacentes. Por ejemplo, puede que desee buscar información de contacto, los casos usados para entrenar un clúster determinado, etc. Para poder usar la obtención de detalles, debe habilitarla al crear la estructura de minería de datos, ya que no podrá hacerlo posteriormente. Para obtener más información, vea Usar la obtención de detalles en los modelos y estructuras de minería (Analysis Services - Minería de datos).