Crear un informe de validación cruzada
Este tema le guía a través del proceso de creación de un informe de validación cruzada utilizando la pestaña Gráfico de precisión del Diseñador de minería de datos. Para obtener información general acerca del aspecto de un informe de validación cruzada, así como de las medidas estadísticas que incluye, vea Validación cruzada (Analysis Services - Minería de datos).
Un informe de validación cruzada es totalmente diferente de un gráfico de precisión, como un gráfico de mejora respecto al modelo predictivo o una matriz de clasificación.
La validación cruzada evalúa la distribución global de los datos utilizados en un modelo o una estructura; por lo tanto, no es necesario especificar un conjunto de datos de pruebas. La validación cruzada utiliza siempre únicamente los datos originales que se utilizaron para entrenar al modelo o a la estructura de minería de datos.
Este tipo de validación solo se puede realizar con respecto a un único resultado de predicción. Si la estructura admite modelos con atributos de predicción diferentes, deberá crear informes independientes para cada resultado de predicción.
Solo los modelos que se relacionan con la estructura seleccionada actualmente están disponibles para la validación cruzada.
Si la estructura que está seleccionada actualmente admite una combinación de modelos de agrupación en clústeres y de no agrupación en clústeres, al hacer clic en Obtener resultados, el procedimiento almacenado de validación cruzada cargará automáticamente los modelos que tengan la misma columna predicha, e ignorará los modelos de agrupación en clústeres que no compartan el mismo atributo de predicción.
Solo podrá crear un informe de validación cruzada en un modelo de agrupación en clústeres que no tenga un atributo de predicción si la estructura de minería de datos no admite ningún otro atributo de predicción.
Seleccionar una estructura de minería de datos
Abra el Diseñador de minería de datos de SQL Server Data Tools (SSDT).
En el Explorador de soluciones, abra la base de datos que contiene la estructura o el modelo para el que desea crear un informe.
Haga doble clic en la estructura de minería de datos para abrir la estructura y sus modelos relacionados en el Diseñador de minería de datos.
Haga clic en la pestaña Gráfico de precisión de minería de datos.
Haga clic en la pestaña Validación cruzada.
Establecer opciones de validación cruzada
En la pestaña Validación cruzada, en Recuento de plegamientos, haga clic en la flecha abajo para seleccionar un número entre 1 y 10. El valor predeterminado es 10.
El Recuento de plegamientos representa el número de particiones que se creará dentro del conjunto de datos original. Si establece Recuento de plegamientos en 1, el conjunto de entrenamiento se utilizará sin particiones.
En Atributo de destino, haga clic en la flecha abajo y seleccione una columna en la lista. Si el modelo es un modelo de agrupación en clústeres, seleccione #Cluster para indicar que el modelo no tiene un atributo de predicción. Tenga en cuenta que el valor #Cluster solo estará disponible si la estructura de minería de datos no admite otros tipos de atributos de predicción.
Puede seleccionar solo un atributo de predicción para cada informe. De forma predeterminada, todos los modelos relacionados que tienen el mismo atributo de predicción se incluyen en el informe.
En Máximo de casos, escriba un número que sea suficientemente grande para proporcionar una muestra representativa de datos cuando los datos se dividen entre el número especificado de plegamientos. Si el número es mayor que el recuento de casos en el conjunto de entrenamiento del modelo, se utilizarán todos los casos.
Si el conjunto de datos de entrenamiento es muy grande, al establecer el valor de Máximo de casos se limita el número total de casos procesados y se permite que el informe finalice más rápidamente. Sin embargo, no debe establecer Máximo de casos en un valor demasiado bajo porque puede que no haya datos suficientes para la validación cruzada.
Si lo desea, en Estado de destino, escriba el valor del atributo de predicción que desea modelar. Por ejemplo, si la columna [Bike Buyer] tiene dos valores posibles, 1 (Sí) y 2 (No), puede especificar el valor 1 para evaluar la exactitud del modelo solo para el resultado deseado.
[!NOTA]
Si no especifica un valor, la opción Umbral de destino no está disponible y el modelo se evalúa para todos los valores posibles del atributo de predicción.
Opcionalmente, en Umbral de destino, escriba un número decimal comprendido entre 0 y 1 para especificar la probabilidad mínima que una predicción debe tener para que se considere que es precisa.
Para obtener sugerencias adicionales sobre cómo establecer umbrales de probabilidad, vea Medidas en el informe de validación cruzada.
Haga clic en Obtener resultados.
Imprimir el informe de validación cruzada
Haga clic con el botón secundario en el informe completado en la pestaña Validación cruzada.
En el menú contextual, seleccione Imprimir o Vista previa de impresión para revisar el informe primero.
Crear una copia del informe en Microsoft Excel
Haga clic con el botón secundario en el informe completado en la pestaña Validación cruzada.
En el menú contextual, seleccione Seleccionar todo.
Haga clic con el botón secundario en el texto seleccionado y, a continuación, haga clic en Copiar.
Pegue la selección en un libro de Excel abierto. Si utiliza la opción Pegar, el informe se pega en Excel como HTML, con lo que se conserva el formato de filas y columnas. Si pega el informe usando las opciones Pegado especial para texto o texto Unicode, el informe se pega en formato delimitado por filas.