Partager via


Importance de la fonctionnalité de permutation

Important

Le support de Machine Learning Studio (classique) prend fin le 31 août 2024. Nous vous recommandons de passer à Azure Machine Learning avant cette date.

À partir du 1er décembre 2021, vous ne pourrez plus créer de nouvelles ressources Machine Learning Studio (classique). Jusqu’au 31 août 2024, vous pouvez continuer à utiliser les ressources Machine Learning Studio (classique) existantes.

La documentation ML Studio (classique) est en cours de retrait et ne sera probablement plus mise à jour.

Calcule les scores d'importance de fonctionnalité de permutation de variables de fonctionnalité avec un modèle et un jeu de données de test

Catégorie : modules de sélection de fonctionnalités

Notes

s’applique à: Machine Learning Studio (classic) uniquement

Des modules par glisser-déposer similaires sont disponibles dans Concepteur Azure Machine Learning.

Vue d’ensemble du module

cet article explique comment utiliser le module permutation feature importance dans Machine Learning Studio (classic) pour calculer un ensemble de scores d’importance de fonctionnalité pour votre jeu de données. Vous utilisez ces scores pour vous aider à déterminer les meilleures fonctionnalités à utiliser dans un modèle.

Dans ce module, les valeurs des fonctionnalités sont mélangées aléatoirement, une colonne à la fois, et les performances du modèle sont mesurées avant et après. Vous pouvez choisir l’une des métriques standards fournies pour mesurer les performances.

Les scores retournés par le module représentent la modification dans les performances d’un modèle formé, après permutation. Les fonctionnalités importantes sont généralement plus sensibles au processus de mélange et entraînent donc des scores d’importance plus élevés.

Cet article fournit une vue d’ensemble générale de l’importance des fonctionnalités de permutation, de sa base théorique et de ses applications dans Machine Learning : l' importance des fonctionnalités de permutation

Comment utiliser l’importance de la fonctionnalité de permutation

Pour générer un ensemble de scores de fonctionnalités, vous devez disposer d’un modèle déjà formé, ainsi que d’un jeu de données de test.

  1. Ajoutez le module permutation Feature importance à votre expérience. Ce module figure dans la catégorie Sélection des caractéristiques.

  2. Connectez un modèle formé à l’entrée gauche. Le modèle doit être un modèle de régression ou un modèle de classification.

  3. Sur l’entrée droite, connectez un jeu de données, de préférence différent de celui utilisé pour l’apprentissage du modèle. Ce jeu de données est utilisé pour le calcul des scores basés sur le modèle formé et pour l’évaluation du modèle après la modification des valeurs des fonctionnalités.

  4. Pour Valeur de départ aléatoire, saisissez une valeur à utiliser comme valeur de départ pour la répartition aléatoire. Si vous spécifiez 0 (valeur par défaut), un nombre est généré en fonction de l’horloge système.

    Une valeur de départ est facultative, mais vous devez fournir une valeur si vous souhaitez que la reproductibilité s’effectue entre les exécutions de la même expérience.

  5. Pour Métrique pour la mesure des performances, sélectionnez une métrique unique à utiliser lors du calcul de la qualité du modèle après la permutation.

    Machine Learning Studio (classic) prend en charge les mesures suivantes, selon que vous évaluez un modèle de classification ou de régression :

    • Classification

      Exactitude, Précision, Rappel, Perte moyenne de journal

    • Régression

      Précision, rappel, erreur absolue moyenne, erreur quadratique moyenne racine, erreur absolue relative, erreur quadratique relative, coefficient de détermination

    Pour obtenir une description plus détaillée de ces mesures d’évaluation et de la façon dont elles sont calculées, consultez évaluer.

  6. Exécutez l’expérience.

  7. Le module génère une liste de colonnes de fonctionnalités et les scores qui leur sont associés, classés dans l’ordre des scores, décroissant.

Exemples

Consultez les exemples d’expériences suivants dans la Azure ai Gallery:

Notes techniques

Cette section contient des détails, des conseils et des réponses aux questions fréquentes concernant l’implémentation.

En quoi cela peut-il être comparé aux autres méthodes de sélection de fonctionnalités ?

L’importance de la fonctionnalité de permutation consiste à modifier de façon aléatoire les valeurs de chaque colonne de fonctionnalité, une colonne à la fois, puis à évaluer le modèle.

Les classements fournis par l’importance de la fonctionnalité de permutation sont souvent différents de ceux que vous obtenez à partir de la sélection de caractéristiques par filtrage, qui calcule les scores avant la création d’un modèle.

En effet, l’importance de la fonctionnalité de permutation ne mesure pas l’association entre une fonctionnalité et une valeur cible, mais elle capture à la place l’influence de chaque fonctionnalité sur les prédictions du modèle.

Entrées attendues

Nom Type Description
Modèle entraîné Interface ILearner Modèle formé de classification ou de régression
Données de test Table de données Jeu de données de test pour le calcul de scores et l'évaluation d'un modèle après permutation des valeurs de fonctionnalité

Paramètres du module

Nom Type Plage Facultatif Default Description
Valeur initiale aléatoire Entier >=0 Obligatoire 0 Valeur initiale du générateur de nombres aléatoires
Métrique pour la mesure des performances EvaluationMetricType sélectionner dans la liste Obligatoire Classification - Précision Sélectionner la métrique à utiliser lors de l’évaluation de la variabilité du modèle après permutations

Sorties

Nom Type Description
Importance de la fonctionnalité Table de données Jeu de données contenant les résultats d'importance de fonctionnalité, en fonction de la mesure sélectionnée

Exceptions

Exception Description
Erreur 0062 Une exception se produit lorsque l’on tente de comparer deux modèles avec des types d’apprenants différents.
Erreur 0024 Une exception se produit si le jeu de données ne contient pas de colonne d’étiquette.
Erreur 0105 Levée quand un fichier de définition de module définit un type de paramètre non pris en charge
Erreur 0021 Une exception se produit si le nombre de lignes de certains jeux de données transmis au module est trop faible.

Voir aussi

Sélection de caractéristiques
Sélection de caractéristiques par filtrage
Analyse en composantes principales