Importancia de la característica de permutación
Importante
El soporte técnico de Machine Learning Studio (clásico) finalizará el 31 de agosto de 2024. Se recomienda realizar la transición a Azure Machine Learning antes de esa fecha.
A partir del 1 de diciembre de 2021 no se podrán crear recursos de Machine Learning Studio (clásico). Hasta el 31 de agosto de 2024, puede seguir usando los recursos de Machine Learning Studio (clásico) existentes.
- Consulte la información acerca de traslado de proyectos de aprendizaje automático de ML Studio (clásico) a Azure Machine Learning.
- Más información sobre Azure Machine Learning.
La documentación de ML Studio (clásico) se está retirando y es posible que no se actualice en el futuro.
Calcula las puntuaciones de importancia de la característica de permutación de variables de características dado un modelo entrenado y un conjunto de datos de prueba
Categoría: Módulos de selección de características
Nota:
Solo se aplica a: Machine Learning Studio (clásico)
Hay módulos para arrastrar y colocar similares en el diseñador de Azure Machine Learning.
Información general sobre el módulo
En este artículo se describe cómo usar el módulo Importancia de características de permutación en Machine Learning Studio (clásico) para calcular un conjunto de puntuaciones de importancia de características para el conjunto de datos. Estas puntuaciones se usan para ayudarle a determinar las mejores características que se deben usar en un modelo.
En este módulo, los valores de las características se ordenan aleatoriamente, una columna a la vez y el rendimiento del modelo se mide antes y después. Puede elegir una de las métricas estándar que se proporcionan para medir el rendimiento.
Las puntuaciones que devuelve el módulo representan el cambio en el rendimiento de un modelo formado, después de la permutación. Las características importantes suelen ser más sensibles al proceso orden aleatorio y, por tanto, se obtendrán mayores puntuaciones de importancia.
En este artículo se proporciona una buena introducción general de la importancia de las características de permutación, su base teórica y sus aplicaciones en el aprendizaje automático: importancia de las características de permutación
Cómo usar la Importancia de la característica de permutación
Para generar un conjunto de puntuaciones de características, es necesario tener un modelo ya formado, así como un conjunto de datos de prueba.
Agregue el módulo Permutation Feature Importance (Importancia de la característica de permutación) al experimento. Puede encontrar este módulo en la categoría Selección de características.
Conecte un modelo formado a la entrada izquierda. El modelo debe ser un modelo de clasificación o modelo de regresión.
En la entrada derecha, conecte un conjunto de datos, preferiblemente uno que sea diferente del conjunto de datos usado para formar al modelo. Este conjunto de datos se usa para puntuar según el modelo formado y para evaluar el modelo después de haber cambiado los valores de las características.
Para Inicialización aleatoria, escriba un valor que se usará como valor de inicialización para la selección aleatoria. Si especifica 0 (el valor predeterminado), se genera un número basado en el reloj del sistema.
Un valor de valor de ed es opcional, pero debe proporcionar un valor si desea reproducibilidad entre ejecuciones del mismo experimento.
Para Métrica para medir el rendimiento, seleccione una sola métrica para usar al calcular la calidad del modelo después de la permutación.
Machine Learning Studio (clásico) admite las siguientes métricas, en función de si está evaluando un modelo de clasificación o regresión:
Clasificación
Exactitud, precisión, recuperación, pérdida de registro promedio
Regresión
Precision, Recall, Mean Absolute Error , Root Mean Squared Error, Relative Absolute Error, Relative Squared Error, Coefficient of Determination
Para obtener una descripción más detallada de estas métricas de evaluación y cómo se calculan, vea Evaluar.
Ejecute el experimento.
El módulo genera una lista de columnas de características y las puntuaciones asociadas con ellas, clasificadas en orden de puntuación, descendiendo.
Ejemplos
Consulte estos experimentos de ejemplo en el Azure AI Gallery:
Importancia de la característica de permutación: muestra cómo usar este módulo para clasificar las variables de características de un conjunto de datos en orden de puntuaciones de importancia de permutación.
Uso del módulo Permutation Feature Importance (Importancia de la característica de permutación): muestra el uso de este módulo en un servicio web.
Notas técnicas
Esta sección contiene detalles de implementación, sugerencias y respuestas a las preguntas más frecuentes.
¿Cómo se compara con otros métodos de selección de características?
La importancia de la característica de permutación funciona al cambiar aleatoriamente los valores de cada columna de característica, una columna a la vez y, después, evaluar el modelo.
Las clasificaciones proporcionadas por la importancia de la característica de permutación suelen ser diferentes de las que obtiene de Selección de características basada en filtro, que calcula las puntuaciones antes de que se cree un modelo.
Esto se debe a que la importancia de la característica de permutación no mide la asociación entre una característica y un valor de destino, sino que captura la influencia de cada característica en las predicciones del modelo.
Entradas esperadas
Nombre | Tipo | Descripción |
---|---|---|
Modelo entrenado | Interfaz ILearner | Un modelo de clasificación o de regresión entrenado |
Datos de prueba | Tabla de datos | Conjunto de datos de prueba para puntuar y evaluar un modelo tras la permutación de valores de características |
Parámetros del módulo
Nombre | Tipo | Intervalo | Opcional | Valor predeterminado | Descripción |
---|---|---|---|---|---|
Inicialización aleatoria | Entero | >=0 | Obligatorio | 0 | Valor de inicialización del generador de números aleatorios |
Métrica para medir el rendimiento | EvaluationMetricType | seleccionar de la lista | Obligatorio | Clasificación: precisión | Selección de la métrica que se va a usar al evaluar la variabilidad del modelo después de permutaciones |
Salidas
Nombre | Tipo | Descripción |
---|---|---|
Importancia de característica | Tabla de datos | Un conjunto de datos que contiene los resultados de importancia de las características según la métrica seleccionada. |
Excepciones
Excepción | Descripción |
---|---|
Error 0062 | Se produce una excepción cuando se intenta comparar dos modelos con tipos diferentes de aprendiz. |
Error 0024 | Se produce una excepción si el conjunto de datos no contiene una columna de etiqueta. |
Error 0105 | Se produce cuando un archivo de definición de módulo define un tipo de parámetro no admitido |
Error 0021 | Se produce una excepción si el número de filas en algunos de los conjuntos de datos que se pasan al módulo es demasiado pequeño. |
Consulte también
Selección de características
Selección de características basada en filtros
Análisis de componentes principales