Compartir a través de


Lección 2: Agregar modelos de minería de datos a la estructura de minería de datos de Bike Buyer

En esta lección se agregarán dos modelos de minería de datos a la estructura de minería de datos Bike Buyer creada en Lección 1: Crear la estructura de minería de datos de Bike Buyer. Estos modelos de minería de datos le permitirán explorar los datos usando un modelo y crear predicciones usando otro modelo.

Para explorar cómo se puede clasificar en categorías a los clientes potenciales según sus características, creará un modelo de minería de datos basado en el Algoritmo de clústeres de Microsoft. En una lección posterior, explorará cómo este algoritmo encuentra clústeres de clientes que comparten características parecidas. Por ejemplo, podría averiguar que ciertos clientes tienden a vivir cerca unos de otros, van al trabajo en bicicleta y tienen una formación parecida. Puede utilizar estos clústeres para comprender mejor cómo están relacionados distintos clientes y para utilizar la información para crear una estrategia de marketing dirigida a clientes concretos.

Para predecir si es probable que un cliente potencial adquiera una bicicleta, creará un modelo de minería de datos basado en el Algoritmo de árboles de decisión de Microsoft. Este algoritmo examina la información asociada a cada cliente potencial y encuentra características útiles para predecir si adquirirá una bicicleta. A continuación, compara los valores de las características de compradores de bicicletas anteriores con los nuevos clientes potenciales para determinar si es probable que éstos adquieran una bicicleta.

Instrucción ALTER MINING STRUCTURE

Para agregar un modelo de minería de datos a la estructura de minería de datos, se utiliza la instrucción ALTER MINING STRUCTURE (DMX). El código de la instrucción se puede dividir en las partes siguientes:

  • Identificación de la estructura de minería de datos

  • Asignación de un nombre al modelo de minería de datos

  • Definición de la columna de clave

  • Definición de las columnas de entrada y de predicción

  • Identificación de los cambios de parámetros y el algoritmo

A continuación, se incluye un ejemplo genérico de la instrucción ALTER MINING MODEL:

ALTER MINING STRUCTURE [<mining structure name>]
ADD MINING MODEL [<mining model name>]
(
    [<key column>],
    <mining model columns>,
) USING <algorithm name>( <algorithm parameters> )
WITH FILTER (<expression>)

La primera línea de código identifica la estructura de minería de datos existente a la que se agregarán los modelos de minería de datos:

ALTER MINING STRUCTURE [<mining structure name>]

La siguiente línea de código asigna un nombre al modelo de minería de datos que se agregará a la estructura de minería de datos:

ADD MINING MODEL [<mining model name>]

Para obtener información acerca de cómo asignar un nombre a un objeto en DMX, vea Identificadores (DMX).

Las líneas siguientes del código definen columnas de la estructura de minería de datos que utilizará el modelo de minería de datos:

[<key column>],
<mining model columns>

Sólo puede utilizar columnas que ya existan en la estructura de minería de datos, y la primera columna de la lista debe ser la columna de clave de la estructura de minería de datos.

La siguiente línea de código define el algoritmo de minería de datos que genera el modelo de minería de datos y los parámetros de algoritmo que pueden establecerse:

) USING <algorithm name>( <algorithm parameters> )

Para obtener más información acerca de los parámetros del algoritmo que puede ajustar, vea Algoritmo de árboles de decisión de Microsoft y Algoritmo de clústeres de Microsoft.

Puede especificar que una columna del modelo de minería de datos se utilice para la predicción mediante la sintaxis siguiente:

<mining model column> PREDICT

La última línea de código, que es opcional, define un filtro que se aplica durante el aprendizaje y prueba del modelo. Para obtener información sobre la forma de aplicar filtros a los modelos de minería de datos, vea Crear filtros para modelos de minería (Analysis Services - Minería de datos).

Tareas de la lección

En esta lección realizará las tareas siguientes:

  • Agregar un modelo de minería de datos del árbol de decisión a la estructura Bike Buyer mediante el algoritmo Árboles de decisión de Microsoft.

  • Agregar un modelo de minería de datos de agrupación en clústeres a la estructura Bike Buyer mediante el algoritmo Agrupación en clústeres de Microsoft.

  • Dado que desean verse los resultados para todos los casos, todavía no se agrega un filtro a ningún modelo.

Agregar un modelo de minería de datos del árbol de decisión a la estructura

El primer paso es agregar un modelo de minería de datos basado en el algoritmo Árboles de decisión de Microsoft.

Para agregar un modelo de minería de datos del árbol de decisión

  1. En el Explorador de objetos, haga clic con el botón secundario en la instancia de Analysis Services, seleccione Nueva consultay, a continuación, haga clic en DMX para abrir el Editor de consultas y una nueva consulta en blanco.

  2. Copie el ejemplo genérico de la instrucción ALTER MINING STRUCTURE en la consulta en blanco.

  3. Reemplace lo siguiente:

    <mining structure name> 
    

    por:

    [Bike Buyer]
    
  4. Reemplace lo siguiente:

    <mining model name> 
    

    por:

    Decision Tree
    
  5. Reemplace lo siguiente:

    <mining model columns>,
    

    por:

    (
       CustomerKey,
       [Age],
       [Bike Buyer] PREDICT,
       [Commute Distance],
       [Education],
       [Gender],
       [House Owner Flag],
       [Marital Status],
       [Number Cars Owned],
       [Number Children At Home],
       [Occupation],
       [Region],
       [Total Children],
       [Yearly Income]
    

    En este caso, la columna [Bike Buyer] se ha designado como columna PREDICT.

  6. Reemplace lo siguiente:

    USING <algorithm name>( <algorithm parameters> ) 
    

    por:

    Using Microsoft_Decision_Trees
    WITH DRILLTHROUGH
    

    La instrucción WITH DRILLTHROUGH permite explorar los casos utilizados para generar el modelo de minería de datos.

    Ahora, la instrucción resultante debería ser como sigue:

    ALTER MINING STRUCTURE [Bike Buyer]
    ADD MINING MODEL [Decision Tree]
    (
       CustomerKey,
       [Age],
       [Bike Buyer] PREDICT,
       [Commute Distance],
       [Education],
       [Gender],
       [House Owner Flag],
       [Marital Status],
       [Number Cars Owned],
       [Number Children At Home],
       [Occupation],
       [Region],
       [Total Children],
       [Yearly Income]
    ) USING Microsoft_Decision_Trees
    WITH DRILLTHROUGH
    
  7. En el menú Archivo, haga clic en Guardar DMXQuery1.dmx como.

  8. En el cuadro de diálogo Guardar como, desplácese a la carpeta correspondiente y asigne el nombre DT_Model.dmx al archivo.

  9. En la barra de herramientas, haga clic en el botón Ejecutar.

Agregar un modelo de minería de datos de agrupación en clústeres a la estructura

A continuación, podrá agregar un modelo de minería de datos a la estructura de minería de datos Bike Buyer basado en el algoritmo Agrupación en clústeres de Microsoft. Puesto que el modelo de minería de datos de agrupación en clústeres utilizará todas las columnas definidas en la estructura de minería de datos, puede utilizar un acceso directo para agregar el modelo a la estructura sin incluir la definición de las columnas de minería de datos.

Para agregar un modelo de minería de datos de agrupación en clústeres

  1. En el Explorador de objetos, haga clic con el botón secundario en la instancia de Analysis Services, seleccione Nueva consulta y, a continuación, haga clic en DMX para abrir el Editor de consultas y una nueva consulta en blanco.

  2. Copie el ejemplo genérico de la instrucción ALTER MINING STRUCTURE en la consulta en blanco.

  3. Reemplace lo siguiente:

    <mining structure name> 
    

    por:

    [Bike Buyer]
    
  4. Reemplace lo siguiente:

    <mining model> 
    

    por:

    Clustering Model
    
  5. Elimine lo siguiente:

    (
        [<key column>],
        <mining model columns>,
    )
    
  6. Reemplace lo siguiente:

    USING <algorithm name>( <algorithm parameters> )
    

    por:

    USING Microsoft_Clustering
    

    Ahora, la instrucción completa debería ser como sigue:

    ALTER MINING STRUCTURE [Bike Buyer]
    ADD MINING MODEL [Clustering]
    USING Microsoft_Clustering 
    
  7. En el menú Archivo, haga clic en Guardar DMXQuery1.dmx como.

  8. En el cuadro de diálogo Guardar como, desplácese a la carpeta correspondiente y asigne el nombre Clustering_Model.dmx al archivo.

  9. En la barra de herramientas, haga clic en el botón Ejecutar.

En la siguiente lección procesará los modelos y la estructura de minería de datos.