SystemGetClusterCrossValidationResults (Analysis Services - Minería de datos)
Particiona la estructura de minería de datos en el número especificado de secciones transversales, entrena un modelo para cada partición y, a continuación, devuelve métricas de precisión para cada una de las particiones.
Nota: este procedimiento almacenado solamente se puede utilizar con una estructura de minería de datos que contiene al menos un modelo de agrupación en clústeres. Para realizar una validación cruzada de modelos que no sean de agrupación en clústeres, debe utilizar SystemGetCrossValidationResults (Analysis Services - Minería de datos).
Sintaxis
SystemGetClusterCrossValidationResults(
<structure name>,
[,<mining model list>]
,<fold count>}
,<max cases>
<test list>])
Argumentos
mining structure
Nombre de una estructura de minería de datos en la base de datos actual.(Requerido)
mining model list
Lista separada por comas de los modelos de minería de datos que se van a validar.Si no se especifica una lista de modelos de minería de datos, la validación cruzada se realiza en todos los modelos de agrupación en clústeres asociados a la estructura especificada.
Nota
Para realizar una validación cruzada de modelos que no son de agrupación en clústeres, debe utilizar un procedimiento almacenado independiente, SystemGetCrossValidationResults (Analysis Services - Minería de datos).
(Opcional)
fold count
Entero que especifica el número de particiones en que debe separarse el conjunto de datos. El valor mínimo es 2. El número máximo de subconjuntos es maximum integer o el número de casos, el que sea más bajo.Cada partición contendrá aproximadamente este número de casos: max cases/fold count.
No existe ningún valor predeterminado.
Nota
El número de subconjuntos afecta enormemente al tiempo necesario para realizar la validación cruzada. Si selecciona un número demasiado alto, puede que la consulta se ejecute durante mucho tiempo y, en algunos casos, es posible que el servidor deje de responder o que se agote el tiempo de espera.
(Requerido)
max cases
Entero que especifica el número máximo de casos que se pueden probar.Un valor de 0 indica que se utilizarán todos los casos del origen de datos.
Si especifica un número superior al número real de casos del conjunto de datos, se utilizarán todos los casos del origen de datos.
(Requerido)
test list
Cadena que especifica las opciones de prueba.Nota: este parámetro se reserva para uso futuro.
(Opcional)
Tipo devuelto
La tabla Tipo devuelto contiene puntuaciones para cada partición individual y agregados para todos los modelos.
En la tabla siguiente se describen las columnas que devuelve.
Nombre de columna |
Descripción |
---|---|
ModelName |
Nombre del modelo que se probó. |
AttributeName |
Nombre de la columna de predicción. Para los modelos de clústeres, siempre es null. |
AttributeState |
Valor de destino especificado en la columna de predicción. Para los modelos de clústeres, siempre es null. |
PartitionIndex |
Índice basado en 1 que identifica a qué partición se aplican los resultados. |
PartitionSize |
Entero que indica el número de casos incluido en cada partición. |
Test |
Tipo de prueba que se realizó. |
Measure |
Nombre de la medida que devuelve la prueba. Las medidas para cada modelo dependen del tipo del valor de predicción. Para obtener una definición de cada medida, vea Validación cruzada (Analysis Services - Minería de datos). Para obtener una lista de las medidas que se devuelven para cada tipo de predicción, vea Informe de validación cruzada (Analysis Services - Minería de datos). |
Value |
Valor de la medida de prueba especificada. |
Comentarios
Para devolver métricas de precisión para todo el conjunto de datos, utilice SystemGetClusterAccuracyResults (Analysis Services - Minería de datos).
Además, si el modelo de minería de datos ya se ha particionado en subconjuntos, puede omitir el procesamiento y devolver solamente los resultados de la validación cruzada mediante SystemGetClusterAccuracyResults (Analysis Services - Minería de datos).
Ejemplos
En el ejemplo siguiente se muestra cómo particionar una estructura de minería de datos en tres subconjuntos y probar, a continuación, dos modelos de agrupación en clústeres asociados a la estructura de minería de datos.
La línea tres del código muestra los modelos específicos de minería de datos que desea probar. Si no especifica la lista, se utilizan todos los modelos de agrupación en clústeres asociados a la estructura.
La línea cuatro del código especifica el número de subconjuntos y la línea cinco especifica el número máximo de casos que deben utilizarse.
Dado que se trata de modelos de agrupación en clústeres, no es necesario especificar un atributo o valor de predicción.
CALL SystemGetClusterCrossValidationResults(
[v Target Mail],
[Cluster 1], [Cluster 2],
3,
10000
)
Resultados del ejemplo:
ModelName |
AttributeName |
AttributeState |
PartitionIndex |
PartitionSize |
Test |
Measure |
Value |
---|---|---|---|---|---|---|---|
Cluster 1 |
|
|
1 |
3025 |
Agrupación en clústeres |
Probabilidad de casos |
0.930524511864121 |
Cluster 1 |
|
|
2 |
3025 |
Agrupación en clústeres |
Probabilidad de casos |
0.919184178430778 |
Cluster 1 |
|
|
3 |
3024 |
Agrupación en clústeres |
Probabilidad de casos |
0.929651120490248 |
Cluster 2 |
|
|
1 |
1289 |
Agrupación en clústeres |
Probabilidad de casos |
0.922789726933607 |
Cluster 2 |
|
|
2 |
1288 |
Agrupación en clústeres |
Probabilidad de casos |
0.934865535691068 |
Cluster 2 |
|
|
3 |
1288 |
Agrupación en clústeres |
Probabilidad de casos |
0.924724595688798 |
Requisitos
La validación cruzada solo está disponible en SQL Server Enterprise desde SQL Server 2008.
Vea también