Διαμόρφωση των αρχικών δεδομένων
Το Πρόγραμμα επεξεργασίας Power Query στο Power BI Desktop σάς επιτρέπει να διαμορφώσετε (μετασχηματίσετε) τα δεδομένα που εισαγάγατε. Μπορείτε να εκτελέσετε ενέργειες όπως η μετονομασία στηλών ή πινάκων, η αλλαγή κειμένου σε αριθμούς, η κατάργηση γραμμών, η ρύθμιση της πρώτης γραμμής ως κεφαλίδων και πολλά ακόμη. Είναι σημαντικό να διαμορφώσετε τα δεδομένα σας για να εξασφαλίσετε ότι ικανοποιούν τις ανάγκες σας και είναι κατάλληλα για χρήση σε αναφορές.
Έχετε φορτώσει ανεπεξέργαστα δεδομένα πωλήσεων από δύο προελεύσεις σε ένα μοντέλο Power BI. Ορισμένα από τα δεδομένα προήλθαν από ένα αρχείο .csv που δημιουργήθηκε με μη αυτόματο τρόπο στο Microsoft Excel από την ομάδα πωλήσεων. Τα άλλα δεδομένα φορτώθηκαν μέσω μιας σύνδεσης με το σύστημα σχεδιασμού εταιρικών πόρων (ERP) του οργανισμού σας. Τώρα, όταν κοιτάζετε τα δεδομένα στο Power BI Desktop, παρατηρείτε ότι επικρατεί αταξία: ορισμένα δεδομένα που δεν χρειάζεστε και ορισμένα δεδομένα που χρειάζεστε έχουν εσφαλμένη μορφή.
Πρέπει να χρησιμοποιήσετε το Πρόγραμμα επεξεργασίας Power Query για να εκκαθαρίσετε και να διαμορφώσετε αυτά τα δεδομένα, για να μπορέσετε να ξεκινήσετε τη δημιουργία αναφορών.
Γρήγορα αποτελέσματα με το Πρόγραμμα επεξεργασίας Power Query
Για να ξεκινήσετε τη διαμόρφωση των δεδομένων σας, ανοίξτε πρόγραμμα επεξεργασίας Power Query, επιλέγοντας Μετασχηματισμός δεδομένων στην Αρχική καρτέλα Power BI Desktop.
Σε πρόγραμμα επεξεργασίας Power Query, τα δεδομένα στο επιλεγμένο ερώτημα εμφανίζονται στο μέσον της οθόνης και, στην αριστερή πλευρά, στο τμήμα παραθύρου Ερωτήματα παρατίθενται τα διαθέσιμα ερωτήματα (πίνακες).
Όταν εργάζεστε στο Πρόγραμμα επεξεργασίας Power Query, καταγράφονται όλα τα βήματα που χρειάζεστε για να διαμορφώσετε τα δεδομένα σας. Στη συνέχεια, κάθε φορά που το ερώτημα συνδέεται με την προέλευση δεδομένων, εφαρμόζει αυτόματα τα βήματά σας, ώστε τα δεδομένα σας να διαμορφώνονται πάντα με τον τρόπο που καθορίσατε. Το Πρόγραμμα επεξεργασίας Power Query κάνει μόνο αλλαγές σε μια συγκεκριμένη προβολή των δεδομένων σας, ώστε να μπορείτε να αισθάνεστε σίγουροι για τις αλλαγές που πραγματοποιούνται στην αρχική προέλευση δεδομένων. Μπορείτε να δείτε μια λίστα με τα βήματά σας στη δεξιά πλευρά της οθόνης, στο τμήμα παραθύρου Ρυθμίσεις ερωτήματος , μαζί με τις ιδιότητες του ερωτήματος.
Η κορδέλα του Προγράμματος επεξεργασίας Power Query περιλαμβάνει πολλά κουμπιά που μπορείτε να χρησιμοποιήσετε για να επιλέξετε, να προβάλετε και να διαμορφώσετε τα δεδομένα σας.
Για να μάθετε περισσότερα σχετικά με τις διαθέσιμες δυνατότητες και συναρτήσεις, ανατρέξτε στην κορδέλα Το ερώτημα.
Σημείωση
Σε πρόγραμμα επεξεργασίας Power Query, τα μενού περιβάλλοντος δεξιού κλικ και η καρτέλα Μετασχηματισμός στην κορδέλα παρέχουν πολλές από τις ίδιες επιλογές.
Προσδιορισμός κεφαλίδων και ονομάτων στηλών
Το πρώτο βήμα για τη διαμόρφωση των αρχικών δεδομένων σας είναι η αναγνώριση των κεφαλίδων και των ονομάτων των στηλών μέσα στα δεδομένα και, στη συνέχεια, η αξιολόγηση της θέσης που βρίσκονται για να διασφαλιστεί ότι βρίσκονται στο σωστό σημείο.
Στο παρακάτω στιγμιότυπο οθόνης, τα δεδομένα προέλευσης στο αρχείο csv για SalesTarget (το δείγμα δεν παρέχεται) είχαν έναν στόχο κατηγοριοποιημένο κατά προϊόντα και μια υποκατηγορία διαιρεμένη κατά μήνες, τα οποία και τα δύο είναι οργανωμένα σε στήλες.
Ωστόσο, παρατηρείτε ότι η εισαγωγή των δεδομένων δεν έγινε όπως αναμενόταν.
Κατά συνέπεια, τα δεδομένα είναι δυσανάγνωστα. Παρουσιάστηκε ένα πρόβλημα με τα δεδομένα στην τρέχουσα κατάστασή τους, επειδή οι κεφαλίδες στηλών βρίσκονται σε διαφορετικές γραμμές (επισημαίνονται με κόκκινο χρώμα) και πολλές στήλες έχουν μη περιγραφικά ονόματα, όπως Column1, Column2 και ούτω καθεξής.
Όταν εντοπίσετε τις κεφαλίδες και τα ονόματα των στηλών, μπορείτε να κάνετε αλλαγές για να αναδιοργανώσετε τα δεδομένα.
Προβιβασμός κεφαλίδων
Κατά τη δημιουργία ενός πίνακα στο Power BI Desktop, το Πρόγραμμα επεξεργασίας Power Query υποθέτει ότι όλα τα δεδομένα ανήκουν σε γραμμές πίνακα. Ωστόσο, μια προέλευση δεδομένων μπορεί να έχει μια πρώτη γραμμή που περιέχει ονόματα στηλών, το οποίο είναι αυτό που συνέβη στο προηγούμενο παράδειγμα SalesTarget. Για να διορθώσετε αυτή την ανακρίβεια, πρέπει να προβιβάσετε την πρώτη γραμμή του πίνακα σε κεφαλίδες στηλών.
Μπορείτε να προβιβάσετε κεφαλίδες με δύο τρόπους: επιλέγοντας Χρήση της πρώτης γραμμής ως κεφαλίδων στην Αρχική καρτέλα ή επιλέγοντας το αναπτυσσόμενο κουμπί δίπλα στην ένδειξη Στήλη1 και, στη συνέχεια, επιλέγοντας Χρήση της πρώτης γραμμής ως κεφαλίδων.
Η παρακάτω εικόνα απεικονίζει τον τρόπο με τον οποίο η δυνατότητα Χρήση της πρώτης γραμμής ως κεφαλίδων επηρεάζει τα δεδομένα:
Μετονομασία στηλών
Το επόμενο βήμα για τη διαμόρφωση των δεδομένων σας είναι να εξετάσετε τις κεφαλίδες των στηλών. Ενδέχεται να διαπιστώσετε ότι μία ή περισσότερες στήλες έχουν λανθασμένες κεφαλίδες, μια κεφαλίδα έχει ορθογραφικό λάθος ή ότι ι κανόνες ονοματοθεσίας κεφαλίδας δεν είναι συνεπείς ή φιλικοί προς τον χρήστη.
Ανατρέξτε στο προηγούμενο στιγμιότυπο οθόνης, το οποίο εμφανίζει την επίδραση της δυνατότητας Χρήση της πρώτης γραμμής ως κεφαλίδων . Παρατηρήστε ότι η στήλη που περιέχει τα δεδομένα όνομα υποκατηγορίας έχει πλέον τον Μήνα ως κεφαλίδα στήλης. Αυτή η κεφαλίδα στήλης δεν είναι σωστή, επομένως πρέπει να μετονομαστεί.
Μπορείτε να μετονομάσετε κεφαλίδες στηλών με δύο τρόπους. Μια προσέγγιση είναι να κάνετε δεξί κλικ στην κεφαλίδα, να επιλέξετε Μετονομασία, να επεξεργαστείτε το όνομα και, στη συνέχεια, να πατήσετε Enter. Εναλλακτικά, μπορείτε να κάνετε διπλό κλικ στην κεφαλίδα της στήλης και να αντικαταστήσετε το όνομα με το σωστό όνομα.
Μπορείτε επίσης να επιλύσετε αυτό το ζήτημα καταργώντας (παρακάμπτοντας) τις πρώτες δύο γραμμές και, στη συνέχεια, μετονομάζοντας τις στήλες με το σωστό όνομα.
Κατάργηση πρώτων γραμμών
Κατά τη διαμόρφωση των δεδομένων σας, ίσως χρειαστεί να καταργήσετε ορισμένες από τις επάνω γραμμές, για παράδειγμα, εάν είναι κενές ή εάν περιέχουν δεδομένα που δεν χρειάζεστε στις αναφορές σας.
Συνεχίζοντας με το παράδειγμα του SalesTarget, παρατηρήστε ότι η πρώτη γραμμή είναι κενή (δεν διαθέτει δεδομένα) και η δεύτερη γραμμή διαθέτει δεδομένα που δεν απαιτούνται πλέον.
Για να καταργήσετε αυτές τις περιττές γραμμές, επιλέξτε Κατάργηση γραμμώνΚατάργηση πρώτων> γραμμών στην Αρχική καρτέλα.
Κατάργηση στηλών
Ένα βασικό βήμα κλειδιού στη διαδικασία διαμόρφωσης δεδομένων είναι η κατάργηση περιττών στηλών. Είναι πολύ προτιμότερο να καταργήσετε τις στήλες όσο το δυνατόν νωρίτερα. Ένας τρόπος για να καταργήσετε στήλες είναι ο περιορισμός της στήλης κατά τη λήψη δεδομένων από την προέλευση δεδομένων. Για παράδειγμα, εάν κάνετε εξαγωγή δεδομένων από μια σχεσιακή βάση δεδομένων χρησιμοποιώντας SQL, θα θέλατε να περιορίσετε τη στήλη που εξάγετε χρησιμοποιώντας μια λίστα στηλών στην πρόταση SELECT.
Η κατάργηση στηλών σε πρώιμο στάδιο της διαδικασίας αντί σε μεταγενέστερο είναι η καλύτερη επιλογή, ειδικά όταν έχετε καθιερώσει σχέσεις ανάμεσα στους πίνακές σας. Η κατάργηση περιττών στηλών θα σας βοηθήσει να εστιάσετε στα δεδομένα που χρειάζεστε και να βελτιώσετε τις συνολικές επιδόσεις των Power BI Desktop σημασιολογικών μοντέλων και αναφορών σας.
Εξετάστε κάθε στήλη και αναρωτηθείτε εάν όντως χρειάζεστε τα δεδομένα που περιέχει. Εάν δεν σκοπεύετε να χρησιμοποιήσετε αυτά τα δεδομένα σε μια αναφορά, η στήλη δεν προσθέτει καμία τιμή στο σημασιολογικό μοντέλο σας. Επομένως, η στήλη θα πρέπει να καταργηθεί. Μπορείτε πάντα να προσθέσετε τη στήλη αργότερα, εάν οι απαιτήσεις σας αλλάξουν με την πάροδο του χρόνου.
Μπορείτε να καταργήσετε στήλες με δύο τρόπους. Η πρώτη μέθοδος είναι να επιλέξετε τις στήλες που θέλετε να καταργήσετε και, στη συνέχεια, στην Αρχική καρτέλα, επιλέξτε Κατάργηση στηλών.
Εναλλακτικά, μπορείτε να επιλέξετε τις στήλες που θέλετε να διατηρήσετε και, στη συνέχεια, στην Αρχική καρτέλα, επιλέξτε Κατάργηση στηλών>Κατάργηση άλλων στηλών.
Κατάργηση συγκέντρωσης στηλών
Η κατάργηση συγκέντρωσης είναι μια χρήσιμη δυνατότητα του Power BI. Μπορείτε να χρησιμοποιήσετε αυτή τη δυνατότητα με δεδομένα από οποιαδήποτε προέλευση δεδομένων, ωστόσο χρησιμοποιείται συχνότερα κατά την εισαγωγή δεδομένων από το Excel. Στο παρακάτω παράδειγμα εμφανίζεται ένα δείγμα εγγράφου Excel με δεδομένα πωλήσεων.
Παρόλο που τα δεδομένα μπορεί αρχικά να έχουν νόημα, θα ήταν δύσκολο να δημιουργηθεί ένα σύνολο με όλες οι πωλήσεις σε συνδυασμό από το 2018 και το 2019. Ο στόχος σας θα ήταν τότε να χρησιμοποιήσετε αυτά τα δεδομένα στο Power BI με τρεις στήλες: Month, Year και SalesAmount.
Κατά την εισαγωγή των δεδομένων στο Power Query, θα μοιάζουν με την παρακάτω εικόνα.
Στη συνέχεια, μετονομάστε την πρώτη στήλη σε Month. Αυτή η στήλη είχε εσφαλμένη ετικέτα, επειδή αυτή η κεφαλίδα στο Excel είχε ετικέτες για τις στήλες 2018 και 2019. Επισημάνετε τις στήλες 2018 και 2019, επιλέξτε την καρτέλα Μετασχηματισμός στο Power Query και, στη συνέχεια, επιλέξτε Κατάργηση συγκέντρωσης.
Μπορείτε να μετονομάσετε τη στήλη Χαρακτηριστικό σε Year και τη στήλη Value σε SalesAmount.
Η κατάργηση συγκέντρωσης απλοποιεί τη διαδικασία δημιουργίας μετρήσεων DAX στα δεδομένα αργότερα. Ολοκληρώνοντας αυτή τη διαδικασία, δημιουργήσατε πλέον έναν απλούστερο τρόπο για να αναλύετε τα δεδομένα με τις στήλες Year και Month.
Στήλες συγκέντρωσης
Εάν τα δεδομένα που διαμορφώνετε είναι επίπεδα (με άλλα λόγια, διαθέτουν πολλές λεπτομέρειες, αλλά δεν είναι οργανωμένα ή ομαδοποιημένα με οποιονδήποτε τρόπο), η έλλειψη δομής μπορεί να περιπλέξει τη δυνατότητα αναγνώρισης μοτίβων στα δεδομένα.
Μπορείτε να χρησιμοποιήσετε τη δυνατότητα Στήλη συγκέντρωσης για να μετατρέψετε τα επίπεδά δεδομένα σας σε έναν πίνακα που περιέχει μια συγκεντρωτική τιμή για κάθε μοναδική τιμή σε μια στήλη. Για παράδειγμα, μπορεί να θέλετε να χρησιμοποιήσετε αυτήν τη δυνατότητα για να συνοψίσετε δεδομένα χρησιμοποιώντας διαφορετικές μαθηματικές συναρτήσεις, όπως Πλήθος, Ελάχιστο, Μέγιστο, Διάμεσος, Μέσος όρος ή Άθροισμα.
Στο παράδειγμα SalesTarget, μπορείτε να κάνετε συγκέντρωση των στηλών για να λάβετε την ποσότητα των υποκατηγοριών προϊόντων σε κάθε κατηγορία προϊόντων.
Στην καρτέλα Μετασχηματισμός , επιλέξτε Μετασχηματισμός > συγκεντρωτικών στηλών.
Στο παράθυρο Στήλη συγκέντρωσης που εμφανίζεται, επιλέξτε μια στήλη από τη λίστα Στήλη τιμών, όπως Όνομα υποκατηγορίας. Αναπτύξτε τις επιλογές για προχωρημένους και κάντε μια επιλογή από τη λίστα Συνάρτηση συγκεντρωτικής τιμής , όπως Πλήθος (Όλα) και, στη συνέχεια, επιλέξτε OK.
Η παρακάτω εικόνα απεικονίζει τον τρόπο με τον οποίο η δυνατότητα Στήλη συγκέντρωσης αλλάζει τον τρόπο με τον οποίο είναι οργανωμένα τα δεδομένα.
Το Πρόγραμμα επεξεργασίας Power Query καταγράφει όλα τα βήματα που κάνετε για να διαμορφώσετε τα δεδομένα σας και η λίστα βημάτων εμφανίζεται στο τμήμα παραθύρου Ρυθμίσεις ερωτήματος . Εάν έχετε κάνει όλες τις απαιτούμενες αλλαγές, επιλέξτε Κλείσιμο & Εφαρμογή για να κλείσετε το Πρόγραμμα επεξεργασίας Power Query και να εφαρμόσετε τις αλλαγές σας στο μοντέλο σημασιολογίας σας. Ωστόσο, προτού επιλέξετε Κλείσιμο & Εφαρμογή, μπορείτε να κάνετε περαιτέρω βήματα για να εκκαθαρίσετε και να μετασχηματίσετε τα δεδομένα σας στο Πρόγραμμα επεξεργασίας Power Query. Αυτά τα πρόσθετα βήματα καλύπτονται αργότερα σε αυτή την εκπαιδευτική ενότητα.