Crear una estructura del modelo de minería de datos Targeted Mailing (tutorial de minería de datos)
El primer paso para crear un escenario de correo directo (Targeted Mailing) consiste en utilizar el Asistente para minería de datos de Business Intelligence Development Studio con el fin de crear una estructura de minería de datos y un modelo de minería de datos de árbol de decisión.
Para obtener más información
Asistente para minería de datos, Diseñador de minería de datos, Algoritmo de árboles de decisión de Microsoft
Para crear una estructura de minería de datos para un escenario de correo directo
En el Explorador de soluciones, haga clic con el botón secundario en Estructuras de minería de datos y seleccione Nueva estructura de minería de datos.
Se abrirá el Asistente para minería de datos.
En la página de inicio del Asistente para minería de datos, haga clic en Siguiente.
En la página Seleccionar el método de definición, compruebe que la opción A partir de una base de datos relacional o un almacén de datos se ha seleccionado y, a continuación, haga clic en Siguiente.
En la página Seleccionar la técnica de minería de datos, en ¿Qué técnica de minería de datos desea utilizar?, seleccione Árboles de decisión de Microsoft.
En este tutorial, creará varios modelos basados en esta estructura inicial de minería de datos. El primer modelo se creará junto con la estructura una vez que el asistente finalice y se basará en el algoritmo de árboles de decisión de Microsoft.
Haga clic en Siguiente.
En la página Seleccionar vista de origen de datos, observe que Adventure Works DW se ha seleccionado de forma predeterminada. Haga clic en Explorar para ver las tablas de la vista de origen de datos y, a continuación, haga clic en Cerrar para volver al asistente.
Haga clic en Siguiente.
En la página Especificar tipos de tablas, active la casilla de verificación de la columna Escenario, situada junto a la tabla vTargetMail; a continuación, haga clic en Siguiente.
En la página Especificar los datos de entrenamiento, compruebe que la casilla de verificación de la columna Clave junto a la columna CustomerKey está activada.
Si la tabla de origen de la vista de origen de datos muestra una clave, el Asistente para minería de datos elegirá automáticamente esa columna como clave para el modelo.
Active las casillas de verificación Entrada y De predicción, situadas junto a la columna BikeBuyer.
Al indicar que una columna es de predicción, se habilita el botón Sugerir. Si hace clic en Sugerir, se abrirá el cuadro de diálogo Sugerir columnas relacionadas, que enumera las columnas que están más ligadas a la columna de predicción.
El cuadro de diálogo Sugerir columnas relacionadas ordena los atributos según la relación que tengan con el atributo de predicción. Las columnas cuyo valor es mayor que 0,05 se seleccionan automáticamente para ser incluidas en el modelo. Si las sugerencias le parecen bien, haga clic en Aceptar para que las columnas seleccionadas se marquen como columnas de entrada en el asistente. Para este tutorial, omita las sugerencias haciendo clic en Cancelar.
Active las casillas de verificación Entrada que hay junto a las columnas siguientes:
- Age
- CommuteDistance
- EnglishEducation
- EnglishOccupation
- FirstName
- Gender
- GeographyKey
- HouseOwnerFlag
- LastName
- MaritalStatus
- NumberCarsOwned
- NumberChildrenAtHome
- Region
- TotalChildren
- YearlyIncome
Puede seleccionar varias columnas si mantiene presionada la tecla MAYÚS.
Haga clic en Siguiente.
En la página Especificar el contenido y el tipo de datos de las columnas, haga clic en Detectar.
Un algoritmo ejecutará los datos numéricos de los ejemplos y determinará si las columnas numéricas contienen valores continuos o discretos. Por ejemplo, una columna puede contener información salarial como valores de sueldo actuales, que son continuos, o bien integrales que representan rangos de sueldo codificados, como 1 = < $25.000; 2 = de $25.000 a $50.000, que son discretos.
Después de hacer clic en Detectar, compruebe que las entradas de las columnas Tipo de contenido y Tipo de datos tengan la configuración especificada en la siguiente tabla.
Columna Tipo de contenido Tipo de datos Age
Continuous
Long
BikeBuyer
Discrete
Long
CommuteDistance
Discrete
Text
CustomerKey
Key
Long
EnglishEducation
Discrete
Text
EnglishOccupation
Discrete
Text
FirstName
Discrete
Text
Gender
Discrete
Text
GeographyKey
Discrete
Text
HouseOwnerFlag
Discrete
Text
LastName
Discrete
Text
MaritalStatus
Discrete
Text
NumberCarsOwned
Discrete
Long
NumberChildrenAtHome
Discrete
Long
Region
Discrete
Text
TotalChildren
Discrete
Long
YearlyIncome
Continuous
Double
[!NOTA] Basándose únicamente en los valores numéricos, el algoritmo de minería de datos sugiere que la columna GeographyKey contiene números continuos. Sin embargo, algunos números como los códigos postales deben tratarse normalmente como discretos y no como valores numéricos continuos, ya que las operaciones matemáticas que usan estos números carecen de significado.
- Haga clic en Siguiente.
- En la página Finalización del asistente, en Nombre de la estructura de minería de datos, escriba Targeted Mailing.
- En Nombre del modelo de minería de datos, escriba TM_Decision_Tree.
- Active la casilla de verificación Permitir obtención de detalles.
- Haga clic en Finalizar.
Siguiente tarea de la lección
Modificar el modelo Targeted Mailing (tutorial de minería de datos)