Combiner des fichiers CSV
Dans Power Query, vous pouvez combiner plusieurs fichiers à partir d’une source de données spécifiée. Cet article décrit le fonctionnement de l’expérience lorsque les fichiers que vous souhaitez combiner sont des fichiers CSV. Informations supplémentaires : Vue d’ensemble de la combinaison de fichiers
Conseil
Vous pouvez suivre cet exemple en téléchargeant les exemples de fichiers utilisés dans cet article à partir de ce lien de téléchargement. Vous pouvez placer ces fichiers dans la source de données de votre choix, comme un dossier local, un dossier SharePoint, un stockage Blob Azure, Azure Data Lake Storage ou une autre source de données qui fournit la vue du système de fichiers.
Par souci de simplicité, l’exemple de cet article utilise le connecteur Dossier. Informations supplémentaires : Dossier
À propos des exemples de fichiers utilisés
Pour combiner des fichiers, il est impératif qu’ils aient toutes la même structure et la même extension. Tous les fichiers utilisés dans cet exemple ont la même structure et la même extension (.csv).
Il existe 12 fichiers CSV, un pour chaque mois de l’année civile 2019. L’image suivante montre les 15 premières lignes du fichier pour le mois de janvier.
Le nombre de lignes varie d’un fichier à l’autre, mais tous les fichiers comportent une section d’en-tête dans les quatre premières lignes. Il y a des-têtes de colonne dans la cinquième ligne, et les données de la table commencent dans la sixième ligne et continuent dans les lignes suivantes.
L’objectif est de combiner les 12 fichiers dans une seule table. Cette table combinée contient la ligne d’en-tête en haut de la table et inclut le nom de la source, la date, le pays, les unités et les données de revenus pour l’année entière dans des colonnes distinctes après la ligne d’en-tête.
Aperçu de la table
Lorsque vous vous connectez au dossier qui héberge les fichiers que vous souhaitez combiner (dans cet exemple, le nom de ce dossier est Fichiers CSV), vous voyez la boîte de dialogue d’aperçu de la table, qui affiche le chemin d’accès de votre dossier dans le coin supérieur gauche. L’aperçu des données affiche la vue du système de fichiers.
Pour cet exemple, sélectionnez Combiner.
Remarque
Dans une autre situation, vous pouvez sélectionner Transformer des données pour filtrer et transformer vos données avant de combiner les fichiers. Nous vous recommandons de ne sélectionner Combiner que lorsque vous êtes certain que le dossier contient uniquement les fichiers que vous souhaitez combiner.
Boîte de dialogue Combiner des fichiers
Une fois que vous avez sélectionné Combiner dans l’aperçu du tableau, la boîte de dialogue Combiner des fichiers s’affiche.
Remarque
Power Query détecte automatiquement le connecteur à utiliser en fonction du premier fichier trouvé dans la liste. Pour en savoir plus sur le connecteur CSV, accédez à Texte/CSV.
Pour cet exemple, conservez tous les paramètres par défaut (Exemple de fichier défini sur Premier fichier et les valeurs par défaut pour Origine du fichier, Délimiteur et Détection du type de données).
À présent, sélectionnez Transformer des données dans le coin inférieur droit pour accéder à la requête de sortie.
Requête de sortie
Après avoir sélectionné Transformer des données dans la boîte de dialogue Combiner des fichiers, vous êtes redirigé vers l’Éditeur Power Query dans la requête que vous avez initialement créée à partir de la connexion au dossier local. La requête de sortie contient désormais le nom du fichier source dans la colonne la plus à gauche, ainsi que les données de chacun des fichiers sources dans les colonnes restantes.
Toutefois, les données n’ont pas la forme appropriée. Vous devez supprimer les quatre premières lignes de chaque fichier avant de les combiner. Pour apporter cette modification à chaque fichier avant de les combiner, sélectionnez la requête Transformer un exemple de fichier dans le volet Requêtes sur le côté gauche de votre écran.
Modifier la requête Transformer un exemple de fichier
Dans cette requête Transformer un exemple de fichier, les valeurs de la colonne Date indiquent que les données correspondent au mois d’avril, qui a le format année-mois-jour (AAAA-MM-DD). April 2019.csv est le premier fichier affiché dans l’aperçu de la table.
Vous devez maintenant appliquer un nouvel ensemble de transformations pour nettoyer les données. Chaque transformation est automatiquement convertie en fonction à l’intérieur du groupe Requêtes d’assistance qui sera appliquée à chaque fichier du dossier avant de combiner les données de chaque fichier.
Les transformations qui doivent être ajoutées à la requête Transformer un exemple de fichier sont les suivantes :
Supprimer les lignes supérieures : pour effectuer cette opération, sélectionnez le menu de l’icône de table dans le coin supérieur gauche de la table, puis sélectionnez Supprimer les lignes supérieures.
Dans la boîte de dialogue Supprimer les lignes supérieures, entrez 4, puis sélectionnez OK.
Après avoir sélectionné OK, votre table n’aura plus les quatre premières lignes.
Utilisez la première ligne comme en-têtes : sélectionnez à nouveau l’icône de table, puis sélectionnez Utiliser la première ligne comme en-têtes.
Le résultat de cette opération va promouvoir la première ligne de la table en nouveaux en-têtes de colonne.
Une fois cette opération terminée, Power Query tente par défaut de détecter automatiquement les types de données des colonnes et d’ajouter une nouvelle étape Type de colonne changé.
Révision de la requête de sortie
En revenant à la requête Fichiers CSV, vous remarquerez que la dernière étape vous donne une erreur qui indique « La colonne « Column1 » de la table est introuvable ». La raison de cette erreur est que l’état précédent de la requête effectuait une opération sur une colonne nommée Column1. En raison des modifications apportées à la requête Transformer un exemple de fichier, cette colonne n’existe plus. Informations supplémentaires : Traitement des erreurs dans Power Query
Vous pouvez supprimer cette dernière étape de la requête dans le volet Étapes appliquées en sélectionnant l’icône de suppression X sur le côté gauche du nom de l’étape. Après avoir supprimé cette étape, votre requête affichera les résultats corrects.
Toutefois, notez qu’aucune des colonnes dérivées des fichiers (Date, Pays, Unités, Revenus) n’a un type de données spécifique qui leur est attribué. Attribuez le type de données approprié à chaque colonne à l’aide du tableau suivant.
Nom de la colonne | Type de données |
---|---|
Date | Date |
Pays ou région | Détails |
Unités | Nombre entier |
Chiffre d’affaires | Devise |
Après avoir défini les types de données pour chaque colonne, vous serez prêt à charger la table.
Remarque
Pour savoir comment définir ou modifier des types de données des colonnes, accédez Types de données.
Vérification
Pour vérifier que tous les fichiers ont été combinés, vous pouvez sélectionner l’icône de filtre sur l’en-tête de colonne Source.Name, qui affiche tous les noms des fichiers qui ont été combinés. Si vous recevez l’avertissement « La liste peut être incomplète », sélectionnez Charger plus en bas du menu pour afficher plus de valeurs disponibles dans la colonne.
Une fois que vous avez sélectionné Charger plus, tous les noms de fichiers disponibles s’affichent.