CSV-bestanden combineren
In Power Query kunt u meerdere bestanden uit een bepaalde gegevensbron combineren. In dit artikel wordt beschreven hoe de ervaring werkt wanneer de bestanden die u wilt combineren CSV-bestanden zijn. Meer informatie: Overzicht van bestanden combineren
Tip
U kunt dit voorbeeld volgen door de voorbeeldbestanden te downloaden die in dit artikel worden gebruikt via deze downloadkoppeling. U kunt deze bestanden in de gewenste gegevensbron plaatsen, zoals een lokale map, SharePoint-map, Azure Blob-opslag, Azure Data Lake Storage of een andere gegevensbron die de bestandssysteemweergave biedt.
Voor het gemak gebruikt het voorbeeld in dit artikel de mapconnector. Meer informatie: Map
Als u bestanden wilt combineren, is het belangrijk dat ze allemaal dezelfde structuur en dezelfde extensie hebben. Alle bestanden die in dit voorbeeld worden gebruikt, hebben dezelfde structuur en extensie (.csv).
Er zijn 12 CSV-bestanden, één voor elke maand van het kalenderjaar 2019. In de volgende afbeelding ziet u de eerste 15 rijen van het bestand voor de maand januari.
Het aantal rijen varieert van bestand tot bestand, maar alle bestanden hebben een koptekstsectie in de eerste vier rijen. Ze hebben kolomkoppen in de vijfde rij en de gegevens voor de tabel beginnen in de zesde rij en worden door alle volgende rijen doorlopen.
Het doel is om alle 12 bestanden in één tabel te combineren. Deze gecombineerde tabel bevat de veldnamenrij boven aan de tabel en bevat de bronnaam, datum, land, eenheden en omzetgegevens voor het hele jaar in afzonderlijke kolommen na de veldnamenrij.
Wanneer u verbinding maakt met de map die als host fungeert voor de bestanden die u wilt combineren( in dit voorbeeld is de naam van die map CSV-bestanden), ziet u het dialoogvenster Voorbeeld van de tabel, waarin het mappad in de linkerbovenhoek wordt weergegeven. In het voorbeeld van de gegevens ziet u de weergave van het bestandssysteem.
Voor dit voorbeeld selecteert u Combineren.
Notitie
In een andere situatie kunt u Gegevens transformeren selecteren om uw gegevens verder te filteren en transformeren voordat u de bestanden combineert. Het selecteren van Combineren wordt alleen aanbevolen wanneer u zeker weet dat de map alleen de bestanden bevat die u wilt combineren.
Nadat u Combineren hebt geselecteerd in het voorbeeld van de tabel, wordt het dialoogvenster Bestanden combineren weergegeven.
Notitie
Power Query detecteert automatisch welke connector moet worden gebruikt op basis van het eerste bestand in de lijst. Ga naar Text/CSV voor meer informatie over de CSV-connector.
Laat voor dit voorbeeld alle standaardinstellingen staan (voorbeeldbestand ingesteld op Eerste bestand en de standaardwaarden voor detectie van bestandsoorsprong, scheidingsteken en gegevenstypedetectie).
Selecteer nu Gegevens transformeren in de rechterbenedenhoek om naar de uitvoerquery te gaan.
Nadat u Gegevens transformeren hebt geselecteerd in het dialoogvenster Bestanden combineren, gaat u terug naar de Power Query-editor in de query die u in eerste instantie hebt gemaakt op basis van de verbinding met de lokale map. De uitvoerquery bevat nu de naam van het bronbestand in de meest linkse kolom, samen met de gegevens uit elk van de bronbestanden in de resterende kolommen.
De gegevens hebben echter niet de juiste vorm. U moet de bovenste vier rijen uit elk bestand verwijderen voordat u ze combineert. Als u deze wijziging in elk bestand wilt aanbrengen voordat u ze combineert, selecteert u de query Voorbeeldbestand transformeren in het deelvenster Query's aan de linkerkant van het scherm.
In deze query voorbeeldbestand transformeren geven de waarden in de kolom Datum aan dat de gegevens voor de maand april zijn, die de notatie JJJJ-MM-DD (jaarmaanddag) heeft. April 2019.csv is het eerste bestand dat wordt weergegeven in het voorbeeld van de tabel.
U moet nu een nieuwe set transformaties toepassen om de gegevens op te schonen. Elke transformatie wordt automatisch geconverteerd naar een functie in de Helper-querygroep die wordt toegepast op elk bestand in de map voordat de gegevens uit elk bestand worden gecombineerd.
De transformaties die moeten worden toegevoegd aan de voorbeeldbestandsquery Transformatie zijn:
Bovenste rijen verwijderen: Als u deze bewerking wilt uitvoeren, selecteert u het menu tabelpictogram in de linkerbovenhoek van de tabel en selecteert u vervolgens Bovenste rijen verwijderen.
Voer in het dialoogvenster Bovenste rijen verwijderen 4 in en selecteer VERVOLGENS OK.
Nadat u OK hebt geselecteerd, beschikt uw tabel niet meer over de bovenste vier rijen.
Gebruik de eerste rij als kopteksten: selecteer het tabelpictogram opnieuw en selecteer vervolgens Eerste rij als kopteksten gebruiken.
Met het resultaat van deze bewerking wordt de eerste rij van de tabel naar de nieuwe kolomkoppen gepromoot.
Nadat deze bewerking is voltooid, probeert Power Query standaard automatisch de gegevenstypen van de kolommen te detecteren en een nieuwe stap voor het kolomtype Gewijzigd toe te voegen.
Wanneer u teruggaat naar de CSV-bestandenquery , ziet u dat in de laatste stap een fout wordt weergegeven met de tekst 'Kolom1' van de tabel is niet gevonden. De reden achter deze fout is dat de vorige status van de query een bewerking heeft uitgevoerd op basis van een kolom met de naam Column1. Maar vanwege de wijzigingen in de bestandsquery Transform Sample bestaat deze kolom niet meer. Meer informatie: Omgaan met fouten in Power Query
U kunt deze laatste stap van de query verwijderen uit het deelvenster Toegepaste stappen door het pictogram X verwijderen aan de linkerkant van de naam van de stap te selecteren. Na het verwijderen van deze stap worden in uw query de juiste resultaten weergegeven.
U ziet echter dat aan geen van de kolommen die zijn afgeleid van de bestanden (Datum, Land, Eenheden, Omzet) een specifiek gegevenstype aan hen is toegewezen. Wijs het juiste gegevenstype toe aan elke kolom met behulp van de volgende tabel.
Kolomnaam | Gegevenstype |
---|---|
Datum | Datum |
Land/regio | Sms verzenden |
Eenheden | Geheel getal |
Omzet | Valuta |
Nadat u de gegevenstypen voor elke kolom hebt gedefinieerd, kunt u de tabel laden.
Notitie
Als u wilt weten hoe u kolomgegevenstypen definieert of wijzigt, gaat u naar Gegevenstypen.
Als u wilt controleren of alle bestanden zijn gecombineerd, kunt u het filterpictogram selecteren in de kolomkop Source.Name , waarin alle namen van de bestanden worden weergegeven die zijn gecombineerd. Als u de waarschuwing 'Lijst kan onvolledig zijn', selecteert u Meer laden onderaan het menu om meer beschikbare waarden in de kolom weer te geven.
Nadat u Meer laden hebt geselecteerd, worden alle beschikbare bestandsnamen weergegeven.