Crear conjunto de pruebas (Asistente para minería de datos)
Utilice la página Crear conjunto de pruebas para especificar qué cantidad de datos se va a utilizar para el entrenamiento y cuánta se va a reservar para utilizarla en un conjunto de pruebas. Al separar los datos en un conjunto de aprendizaje y de pruebas cuando se crea una estructura de minería de datos, resulta más fácil evaluar la exactitud de los modelos de minería que se crean después.
Puede especificar la cantidad de datos de prueba como un porcentaje o puede especificar un número para limitar el número de casos que se utilizan para pruebas. Si especifica un porcentaje y un número máximo de casos que puedan utilizarse en pruebas, se utilizan ambas configuraciones y el conjunto de datos de pruebas contiene el número menor de casos. De forma predeterminada, el 30 por ciento de los datos se utiliza para pruebas, el 70 por ciento para aprendizaje y no hay ningún número máximo de casos de prueba.
De manera predeterminada, Analysis Services genera un valor de inicialización numérico que se usa para iniciar las particiones. Este valor de inicialización está basado en el nombre de la estructura de minería de datos. Si desea asegurarse de que la partición se queda igual incluso si se cambia el nombre de la estructura de minería de datos, puede especificar un valor de inicialización si establece la propiedad HoldoutSeed de la estructura de minería de datos. Si cambia el valor de inicialización de la exclusión, debe volver a procesar la estructura.
Si posteriormente desea cambiar la cantidad de datos de prueba o de aprendizaje, puede modificar las propiedades HoldoutMaxCases y HoldoutMaxPercent en la estructura de minería de datos mediante la ventana Propiedades. Sin embargo, después de realizar la modificación debe volver a procesar la estructura de minería de datos y todos los modelos de minería asociados. También se aplican las siguientes limitaciones:
El particionamiento de una estructura de minería de datos sólo se admite cuando la estructura está almacenada en SQL Server 2008. Las versiones anteriores de SQL ServerAnalysis Services no permiten almacenar en memoria caché información de la partición para las estructuras de minería de datos.
No se puede dividir una estructura de minería de datos si ésta contiene una columna de clave temporal, que se requiere para los modelos de minería de datos de serie temporal.
No se pueden dividir los datos si está intentando predecir un valor que está almacenado en una tabla anidada.
Para obtener más información:Validar modelos de minería de datos (Analysis Services - Minería de datos), Crear una nueva estructura de minería de datos, Tutorial básico de minería de datos
Opciones
Porcentaje de datos para pruebas
Haga clic en las flechas arriba y abajo para aumentar o disminuir el porcentaje de datos que se van a utilizar como un conjunto de aprendizaje o escriba un valor entre 0 y 100 en el cuadro de texto.Número máximo de casos para el conjunto de datos de prueba
Escriba un número para limitar el número de casos que se pueden utilizar para realizar las pruebas.Si especifica un número mayor que el número de casos reales en los datos, se utilizarán todos los casos.
El valor predeterminado es NULL. Esto significa que no hay ningún límite.
Vea también