Ajouter des colonnes

Important

Le support de Machine Learning Studio (classique) prend fin le 31 août 2024. Nous vous recommandons de passer à Azure Machine Learning avant cette date.

À partir du 1er décembre 2021, vous ne pourrez plus créer de nouvelles ressources Machine Learning Studio (classique). Jusqu’au 31 août 2024, vous pouvez continuer à utiliser les ressources Machine Learning Studio (classique) existantes.

La documentation ML Studio (classique) est en cours de retrait et ne sera probablement plus mise à jour.

Ajoute un ensemble de colonnes d'un jeu de données vers un autre

Catégorie : transformation/manipulation des données

Notes

s’applique à: Machine Learning Studio (classic) uniquement

Des modules par glisser-déposer similaires sont disponibles dans Concepteur Azure Machine Learning.

Vue d’ensemble du module

cet article explique comment utiliser le module ajouter des colonnes dans Machine Learning Studio (classic) pour concaténer deux jeux de données.

Vous combinez toutes les colonnes à partir de 2 jeux de données que vous spécifiez en tant qu’entrées pour créer un jeu de données unique. Si vous devez concaténer plus de 2 jeux de données, utilisez plusieurs instances du module Ajouter des colonnes.

Lors de la combinaison de deux datasets contenant un nombre différent de lignes, nous vous recommandons d’utiliser le module joindre les données , qui prend en charge les jointures externes sur une colonne clé commune.

Comment configurer Ajouter des colonnes

  1. Ajoutez le module Ajouter des colonnes à votre expérience.

  2. Connectez les 2 jeux de données à concaténer. Si vous souhaitez combiner plus de 2 jeux de données, vous pouvez chaîner plusieurs combinaisons du module Ajouter des colonnes.

    • Vous pouvez combiner deux colonnes qui ont un nombre différent de lignes. Le jeu de données de sortie est complété avec les valeurs manquantes pour chaque ligne de la plus petite colonne source.

    • Vous ne pouvez pas choisir des colonnes individuelles à ajouter. Toutes les colonnes de chaque jeu de données sont concaténées lorsque vous utilisez le module Ajouter des colonnes. Par conséquent, si vous souhaitez ajouter uniquement un sous-ensemble des colonnes, utilisez l' option Sélectionner des colonnes dans le jeu de données pour créer un jeu de données avec les colonnes de votre choix.

  3. Exécutez l’expérience.

Résultats

Après l’exécution de l’expérience :

  • Pour afficher les premières lignes du nouveau jeu de données, cliquez avec le bouton droit sur la sortie de Ajouter des colonnes , puis sélectionnez visualiser.
  • Pour enregistrer et nommer le DataSet concaténé, cliquez avec le bouton droit sur la sortie et sélectionnez enregistrer en tant que jeu de données .

Le nombre de colonnes du nouveau jeu de données est égal à la somme des colonnes des 2 jeux de données d’entrée.

Si deux colonnes portent le même nom dans les jeux de données en entrée, un suffixe numérique est ajouté au nom de la colonne du jeu de données utilisé dans la colonne d'entrée de droite. Par exemple, s'il existe deux instances d'une colonne nommée TargetOutcome, la colonne de droite est renommée TargetOutcome (1).

Exemples

Pour obtenir des exemples d’utilisation de l' Ajout de colonnes dans une expérience, consultez la Azure ai Gallery:

  • Prédiction de la relation client: une colonne qui contient des étiquettes est associée à un jeu de données de caractéristiques.

  • Détection du cancer du sein: les jeux de données qui contiennent des fonctionnalités sont nettoyés, puis combinés à l’aide de l' Ajout de lignes, de l' Ajout de colonneset de la jointure de données.

Entrées attendues

Nom Type Description
Jeu de données sur la gauche Table de données Jeu de données sur la gauche
Jeu de données sur la droite Table de données Jeu de données sur la droite

Output

Nom Type Description
Jeu de données combiné Table de données Jeu de données combiné

Exceptions

Exception Description
Erreur 0003 Une exception se produit si un ou plusieurs jeux de données d'entrée ont la valeur Null ou sont vides.
Erreur 0017 Une exception se produit si une ou plusieurs colonnes spécifiées ont un type qui n'est pas pris en charge par le module en cours.

pour obtenir la liste des erreurs spécifiques aux modules Studio (classiques), consultez Machine Learning codes d’erreur.

pour obtenir la liste des exceptions d’api, consultez Machine Learning les Codes d’erreur de l' api REST.

Voir aussi

Manipulation
Transformation des données
Liste alphabétique des modules