Transformation de sélection de colonnes
Important
Le support de Machine Learning Studio (classique) prend fin le 31 août 2024. Nous vous recommandons de passer à Azure Machine Learning avant cette date.
À partir du 1er décembre 2021, vous ne pourrez plus créer de nouvelles ressources Machine Learning Studio (classique). Jusqu’au 31 août 2024, vous pouvez continuer à utiliser les ressources Machine Learning Studio (classique) existantes.
- Consultez les informations sur le déplacement des projets de machine learning de ML Studio (classique) à Azure Machine Learning.
- En savoir plus sur Azure Machine Learning.
La documentation ML Studio (classique) est en cours de retrait et ne sera probablement plus mise à jour.
Crée une transformation qui sélectionne le même sous-ensemble de colonnes que dans le jeu de données donné.
Catégorie : transformation/manipulation des données
Notes
s’applique à: Machine Learning Studio (classic) uniquement
Des modules par glisser-déposer similaires sont disponibles dans Concepteur Azure Machine Learning.
cet article explique comment utiliser le module de transformation Select columns dans Machine Learning Studio (classic). L’objectif du module Transformation de sélection de colonnes consiste à s’assurer qu’un ensemble de colonnes prévisible et cohérent est toujours utilisé dans les opérations de machine learning en aval.
Ce module est particulièrement utile pour des tâches telles que le calcul de score, qui nécessitent des colonnes spécifiques. Les modifications apportées aux colonnes disponibles peuvent perturber l’expérience ou modifier les résultats.
Pour créer et enregistrer un ensemble de colonnes, vous utilisez le module Transformation de sélection de colonnes. Ensuite, vous utilisez le module Appliquer une transformation pour appliquer ces sélections aux nouvelles données.
Utilisation du module Transformation de sélection de colonnes
Ce scénario suppose que vous avez l’intention d’utiliser la sélection de caractéristiques pour générer un ensemble dynamique de colonnes qui seront utilisées afin d’entraîner un modèle. Pour vous assurer que les sélections de colonnes sont identiques pour le processus de notation, vous utilisez le module de transformation sélectionner les colonnes pour capturer les sélections de colonnes et les appliquer ailleurs dans l’expérience.
Ajoutez un jeu de données d’entrée à votre expérience dans Studio (Classic).
Ajoutez une instance du module Sélection de caractéristiques par filtrage.
Connectez les modules et configurez le module de sélection de caractéristiques pour rechercher automatiquement un certain nombre de caractéristiques optimales dans le jeu de données d’entrée.
Ajoutez une instance du module Entraîner un modèle et utilisez la sortie du module Sélection de caractéristiques par filtrage comme entrée pour l’entraînement.
Important
Étant donné que l’importance d’une caractéristique est décidée en fonction des valeurs de la colonne, vous ne pouvez pas connaître à l’avance les colonnes éventuellement disponibles pour l’entrée du module Entraîner un modèle.
À présent, attachez une instance du module Transformation de sélection de colonnes.
Cette opération génère une sélection de colonnes sous la forme d’une transformation qui peut être enregistrée ou appliquée à d’autres jeux de données. Cette étape garantit que les colonnes identifiées par la sélection des caractéristiques sont enregistrées en vue de leur réutilisation par d’autres modules.
Ajoutez le module Noter le modèle.
Ne connectez pas le jeu de données d’entrée.
Au lieu de cela, ajoutez le module Appliquer une transformation et connectez la sortie de la transformation de sélection de caractéristiques.
Important
Vous ne pouvez pas escompter les mêmes résultats si vous appliquez le module Sélection de caractéristiques par filtrage au jeu de données de scoring. La sélection des caractéristiques étant basée sur des valeurs, elle peut choisir un autre ensemble de colonnes, ce qui entraînerait l’échec de l’opération de scoring.
Exécutez l’expérience.
Ce processus d’enregistrement, puis d’application d’une sélection de colonnes garantit que le même schéma de données est disponible pour l’entraînement et le scoring.
Exemples
Pour obtenir des exemples d’utilisation de ce module, consultez la Azure ai Gallery:
Sélectionner les colonnes transformer: procédure pas à pas complète qui utilise ce module.
Filtrer les fonctionnalités et les supprimer des entrées de score: Enregistrez cette expérience dans votre espace de travail pour voir comment le module est utilisé dans un workflow expérimental complet.
Entrées attendues
Nom | Type | Description |
---|---|---|
Jeu de données avec les colonnes souhaitées | Table de données | Jeu de données contenant l’ensemble de colonnes souhaité |
Sorties
Nom | Type | Description |
---|---|---|
Transformation de sélection des colonnes | Interface ITransform | Transformation qui sélectionne le même sous-ensemble de colonnes que dans le jeu de données donné. |
Exceptions
Exception | Description |
---|---|
Erreur 0003 | Cette exception se produit si une ou plusieurs entrées sont null ou vide. |
Voir aussi
Manipulation
Sélectionner des colonnes dans le jeu de données