Veelvoorkomende gegevensuitdagingen en Power Query transformaties

Voltooid

Een veelvoorkomend voorbeeld van geëxporteerde gegevens die moeten worden opgeruimd, zijn bestanden die gegevens samenvatten die lege of lege rijen bevatten.

Lege of lege rijen

Wanneer u dit type gegevensset in Power Query opgeeft, worden de waarden voor deze lege of lege cellen weergegeven als null-waarden.

Schermopname van een Excel-werkblad met de kolommen Regio & District met lege of lege rijen.

Als u de muisaanwijzer op de statusbalk onder de kolomkop plaatst, geeft de statusbalk Kolomprofilering informatie weer die betrekking heeft op de gegevens van de kolom. In het volgende voorbeeld bevat de tabel 22 lege waarden, wat aangeeft dat 43 procent van de records lege waarden bevat voor de kolom Regio . De gebruiker kan een kolom (of meerdere kolommen tegelijk) omhoog of omlaag vullen, afhankelijk van waar de subtotalen worden weergegeven.

Schermopname van het venster Kolomprofilering in de kolom Regio waarin 43 procent van de rijen leeg is en een venster met het gebied Voorbeeld met de rijwaarden Leeg voor Regio en District.

Als u deze actie uitvoert voor meerdere kolommen, selecteert u eerst de kolomkoppen die u wilt bijwerken door op Ctrl te drukken terwijl u met de linkermuisknop op elke gewenste kolom klikt. Terwijl de kolommen zijn geselecteerd, klikt u met de rechtermuisknop op de kopteksten om de opties voor het bewerken van het kolommenu weer te geven. Selecteer Opvullen en kies vervolgens of u de waarde omlaag of omhoog wilt toepassen. Als u de optie Omlaag selecteert, komt dit overeen met het zoeken van een niet-lege waarde en deze vervolgens naar elke lege cel kopiëren totdat er een nieuwe waarde wordt gevonden. Als u de optie Omhoog selecteert, is het omgekeerde.

Schermopname van het venster Power Query-editor met regio en district geselecteerd en met de menuopties Kolom voor Omlaag/omhoog doorvoeren > met de rijen Regio en Lege districten gevuld met waarden.

Notitie

De opties voor Omhoog/Omlaag doorvoeren > zijn afhankelijk van de volgorde van de gegevens. Sommige functies voor het importeren van databases streamen gegevens asynchroon, wat betekent dat de volgorde van de gegevens mogelijk niet consistent is.

Kruistabelopmaak

Tabellen met kruistabelindelingen (bijvoorbeeld regio- of productrijkoppen en kolomkoppen voor datumperiode) zijn gebruikelijk voor spreadsheets en rapporten. Visueel organiseren kruistabelindelingen de gegevens op een manier die de meeste mensen gemakkelijker kunnen begrijpen en opnemen. Hoewel deze indeling nuttig kan zijn voor gebruikers, is deze niet ideaal voor gegevensmodellering. Power Query heeft hulpprogramma's voor het opheffen van draaitabelen om deze te transponeren van een korte en brede tabel naar lang en smal. Lange en smalle gegevenssets zijn gunstiger voor het maken van metingen voor een gegevensmodel.

De functie Draaitabel opheffen introduceert een belangrijk concept binnen Power Query functies over het selecteren van de kolommen waarop een bewerking moet worden uitgevoerd, of deze nu alleen voor de geselecteerde kolommen of voor niet-geselecteerde kolommen is. Het is aan de auteur om te bepalen welke methode geschikt is voor de gegevensset en situatie. Nadat u de gegevensset hebt geïmporteerd, selecteert u de kolommen met rijkoppen. Ga naar het tabblad Transformeren op het lint, selecteer de vervolgkeuzelijst voor Kolommen opheffen en selecteer vervolgens Draaitabel opheffen voor andere kolommen. Met dit proces wordt een kenmerk en een waardekolom gegenereerd die u kunt wijzigen door te dubbelklikken op de kolomkop.

Schermafbeelding van de voor en na van de bewerking Draaitabel kolommen opheffen.

Gegevens opschonen en opmaken

Het startmenu bevat UI-knoppen die de algemene technieken voor het opschonen van gegevens bevatten, zoals wordt weergegeven in de volgende schermopname.

Schermopname van het tabblad Start geselecteerd en de knoppen Rijen verwijderen en Kolom splitsen gemarkeerd.

De volgende afbeelding is een voorbeeld van de functie Kolom splitsen (die vergelijkbaar is met Tekst naar kolommen in Excel).

Voer de volgende stappen uit om kolommen te splitsen:

  1. Selecteer de kolom die u wilt splitsen.

  2. Selecteer de vervolgkeuzelijst Kolom splitsen .

  3. Selecteer Op scheidingsteken > aangepast en voer vervolgens een schuine streep (/) in.

  4. Selecteer OK.

Schermopname van Excel-gegevens gescheiden door backslashes, het tabblad Transformeren, het venster Kolom splitsen op scheidingsteken en het venster Power Query-editor met Preview.

Uw gegevens verrijken

met Power Query kunt u aanvullende velden toevoegen om diepere analyse mogelijk te maken. Het menu Kolom toevoegen bevat verschillende manieren om uw huidige gegevensset te verbeteren. Wanneer u de knopbewerkingen in het menu Kolom toevoegen gebruikt, worden de resultaten van de bewerking toegevoegd als een nieuwe kolom in het gebied Voorbeeld van gegevens van het Power Query-editor venster.

Schermafbeelding van het venster Power Query-editor met het tabblad Kolom toevoegen geselecteerd om knoppen weer te geven.

Met de functie Kolom uit voorbeelden kunt u nieuwe kolommen toevoegen aan uw gegevensmodel door een of meer voorbeeldwaarden op te geven voor de nieuwe kolommen. U kunt de nieuwe kolomvoorbeelden maken op basis van een selectie of invoer opgeven op basis van alle bestaande kolommen in de tabel.

Praktische redenen voor het kiezen van deze functie zijn dat deze:

  • Gebruiksvriendelijk: u hoeft slechts enkele voorbeelden in te voeren van wat het resultaat moet zijn en Power Query de rest van het werk voor u doet.

  • Snel: Zelfs als u weet hoe u de transformaties moet schrijven, gaat het invoeren van een paar voorbeelden sneller dan het ontwikkelen en testen van de logica voor uw tekstbewerkingen.

Met de functie Voorwaardelijke kolom toevoegen kunt u de voorwaarden ALS-DAN-ANDERS definiëren om waarden voor een bepaalde kolom weer te geven op basis van een reeks logische controles met een gebruiksvriendelijke wizard, zonder dat haakjesbeheer is vereist.

Schermopname van het venster Voorwaardelijke kolom toevoegen.

Met de functie Aangepaste kolom kunt u rechtstreeks een M-expressie schrijven om een nieuwe kolom te maken. Deze optie is nuttig voor complexere toevoegingen die verder gaan dan tekstbewerking in een kolom uit voorbeelden of een eenvoudige voorwaardelijke kolom. Met deze functie kunt u profiteren van M-functies die niet toegankelijk zijn via het lint, profiteren van uitgebreide intelligentie en uw creativiteit laten stromen.

Schermopname van de gebruikersinterface voor aangepaste kolommen.

Notitie

Elke knopselectie in Power Query-editor maakt een M-expressie als stap in de toegepaste stap in het deelvenster Queryinstellingen. M is de formuletaal van Power Query-editor. Hoewel het niet vereist is om de M-formuletaal te leren om Power Query te gebruiken, kan het krachtig en nuttig zijn om te leren.