Ajouter un composant de colonnes

Cet article décrit un composant dans le concepteur Azure Machine Learning.

Utilisez ce composant pour concaténer deux jeux de données. Vous combinez toutes les colonnes à partir de 2 jeux de données que vous spécifiez en tant qu’entrées pour créer un jeu de données unique. Si vous devez concaténer plus de 2 jeux de données, utilisez plusieurs instances du module Ajouter des colonnes.

Comment configurer Ajouter des colonnes

  1. Ajoutez le composant Ajouter des colonnes à votre pipeline.

  2. Connectez les 2 jeux de données à concaténer. Si vous souhaitez combiner plus de 2 jeux de données, vous pouvez chaîner plusieurs combinaisons du module Ajouter des colonnes.

    • Vous pouvez combiner deux colonnes qui ont un nombre différent de lignes. Le jeu de données de sortie est complété avec les valeurs manquantes pour chaque ligne de la plus petite colonne source.

    • Vous ne pouvez pas choisir des colonnes individuelles à ajouter. Toutes les colonnes de chaque jeu de données sont concaténées lorsque vous utilisez le module Ajouter des colonnes. Par conséquent, si vous souhaitez ajouter uniquement un sous-ensemble de colonnes, utilisez Sélectionner des colonnes dans le jeu de données pour créer un jeu de données contenant les colonnes de votre choix.

  3. Envoyez le pipeline.

Résultats

Une fois le pipeline exécuté :

  • Pour afficher les premières lignes du nouveau jeu de données, cliquez avec le bouton droit sur le composant Ajouter des colonnes, puis sélectionnez Visualiser. Vous pouvez aussi sélectionner le composant et basculer vers l’onglet Sorties dans le panneau droit, cliquer sur l’icône d’histogramme dans Sorties de port pour visualiser le résultat.

Le nombre de colonnes du nouveau jeu de données est égal à la somme des colonnes des 2 jeux de données d’entrée.

Si 2 colonnes portent le même nom dans les jeux de données d’entrée, le module ajoute un suffixe numérique au nom de ces colonnes. Par exemple, s’il existe deux instances d’une colonne nommée RésultatCible, la colonne de gauche est renommée RésultatCible_1, tandis que la colonne de droite est renommée RésultatCible_2.

Étapes suivantes

Consultez les composants disponibles pour Azure Machine Learning.