Συνδυασμός αρχείων CSV
Στο Power Query, μπορείτε να συνδυάσετε πολλά αρχεία από μια δεδομένη προέλευση δεδομένων. Αυτό το άρθρο περιγράφει πώς λειτουργεί η εμπειρία όταν τα αρχεία που θέλετε να συνδυάσετε είναι αρχεία CSV. Περισσότερες πληροφορίες: Επισκόπηση συνδυασμού αρχείων
Φιλοδώρημα
Μπορείτε να ακολουθήσετε αυτό το παράδειγμα κάνοντας λήψη των δειγμάτων αρχείων που χρησιμοποιούνται σε αυτό το άρθρο από αυτήν τη σύνδεση λήψης. Μπορείτε να τοποθετήσετε αυτά τα αρχεία στην προέλευση δεδομένων της επιλογής σας, όπως έναν τοπικό φάκελο, φάκελο SharePoint, χώρο αποθήκευσης αντικειμένων Blob Azure, Azure Data Lake Υπηρεσία αποθήκευσης ή άλλη προέλευση δεδομένων που παρέχει την προβολή συστήματος αρχείων.
Για λόγους ευκολίας, το παράδειγμα σε αυτό το άρθρο χρησιμοποιεί τη σύνδεση Φάκελος. Περισσότερες πληροφορίες: Φάκελος
Για να συνδυάσετε αρχεία, είναι επιτακτική ανάγκη να έχουν όλοι την ίδια δομή και την ίδια επέκταση. Όλα τα αρχεία που χρησιμοποιούνται σε αυτό το παράδειγμα έχουν την ίδια δομή και επέκταση (.csv).
Υπάρχουν 12 αρχεία CSV, ένα για κάθε μήνα του ημερολογιακού έτους 2019. Η παρακάτω εικόνα εμφανίζει τις πρώτες 15 γραμμές του αρχείου για τον μήνα Ιανουάριο.
Ο αριθμός των γραμμών ποικίλλει από αρχείο σε αρχείο, αλλά όλα τα αρχεία έχουν μια ενότητα κεφαλίδας στις τέσσερις πρώτες γραμμές. Έχουν κεφαλίδες στηλών στην πέμπτη γραμμή και τα δεδομένα για τον πίνακα ξεκινούν στην έκτη γραμμή και συνεχίζονται σε όλες τις επόμενες γραμμές.
Ο στόχος είναι να συνδυάσετε και τα 12 αρχεία σε έναν ενιαίο πίνακα. Αυτός ο συνδυασμένος πίνακας περιέχει τη γραμμή κεφαλίδας στο επάνω μέρος του πίνακα και περιλαμβάνει το όνομα προέλευσης, την ημερομηνία, τη χώρα, τις μονάδες και τα δεδομένα εσόδων για ολόκληρο το έτος σε ξεχωριστές στήλες μετά τη γραμμή κεφαλίδας.
Κατά τη σύνδεση με τον φάκελο που φιλοξενεί τα αρχεία που θέλετε να συνδυάσετε, σε αυτό το παράδειγμα, το όνομα αυτού του φακέλου είναι CSV Files, εμφανίζεται το παράθυρο διαλόγου προεπισκόπησης πίνακα, το οποίο εμφανίζει τη διαδρομή φακέλου σας στην επάνω αριστερή γωνία. Η προεπισκόπηση δεδομένων εμφανίζει την προβολή συστήματος αρχείων.
Για αυτό το παράδειγμα, επιλέξτε Συνδυασμός.
Σημείωση
Σε διαφορετική περίπτωση, μπορείτε να επιλέξετε Μετασχηματισμός δεδομένων για περαιτέρω φιλτράρισμα και μετασχηματισμό των δεδομένων σας πριν από τον συνδυασμό των αρχείων. Η επιλογή Συνδυασμός συνιστάται μόνο όταν είστε βέβαιοι ότι ο φάκελος περιέχει μόνο τα αρχεία που θέλετε να συνδυάσετε.
Αφού επιλέξετε Συνδυασμός στην προεπισκόπηση πίνακα, εμφανίζεται το παράθυρο διαλόγου Συνδυασμός αρχείων .
Σημείωση
Το Power Query εντοπίζει αυτόματα ποια σύνδεση θα χρησιμοποιήσει με βάση το πρώτο αρχείο που βρέθηκε στη λίστα. Για να μάθετε περισσότερα σχετικά με τη σύνδεση CSV, μεταβείτε στην επιλογή Κείμενο/CSV.
Για αυτό το παράδειγμα, αφήστε όλες τις προεπιλεγμένες ρυθμίσεις (το παράδειγμα αρχείου έχει οριστεί σε Πρώτο αρχείο και τις προεπιλεγμένες τιμές για την Προέλευση αρχείου, τον Οριοθέτη και τον Εντοπισμό τύπου δεδομένων).
Τώρα, επιλέξτε Μετασχηματισμός δεδομένων στην κάτω δεξιά γωνία για να μεταβείτε στο ερώτημα εξόδου.
Αφού επιλέξετε Μετασχηματισμός δεδομένων στο παράθυρο διαλόγου Συνδυασμός αρχείων, θα μεταφερθείτε πίσω στην πρόγραμμα επεξεργασίας Power Query στο ερώτημα που δημιουργήσατε αρχικά από τη σύνδεση στον τοπικό φάκελο. Το ερώτημα εξόδου περιέχει τώρα το όνομα του αρχείου προέλευσης στην αριστερή στήλη, μαζί με τα δεδομένα από κάθε ένα από τα αρχεία προέλευσης στις υπόλοιπες στήλες.
Ωστόσο, τα δεδομένα δεν είναι στο σωστό σχήμα. Πρέπει να καταργήσετε τις τέσσερις πρώτες γραμμές από κάθε αρχείο πριν από τον συνδυασμό τους. Για να κάνετε αυτή την αλλαγή σε κάθε αρχείο προτού τα συνδυάσετε, επιλέξτε το ερώτημα Μετασχηματισμός δείγματος αρχείου στο τμήμα παραθύρου Ερωτήματα στην αριστερή πλευρά της οθόνης σας.
Σε αυτό το ερώτημα αρχείου "Μετασχηματισμός δείγματος ", οι τιμές στη στήλη Ημερομηνία υποδεικνύουν ότι τα δεδομένα αφορούν τον μήνα Απρίλιο, ο οποίος έχει τη μορφή έτος-μήνας-ημέρα (ΕΕΕΕ-ΜΜ-ΗΗ). Η 2019.csv Απριλίου είναι το πρώτο αρχείο που εμφανίζεται στην προεπισκόπηση πίνακα.
Τώρα πρέπει να εφαρμόσετε ένα νέο σύνολο μετασχηματισμών για να καθαρίσετε τα δεδομένα. Κάθε μετασχηματισμός θα μετατρέπεται αυτόματα σε μια συνάρτηση εντός της ομάδας ερωτημάτων Βοηθητικών στοιχείων που θα εφαρμοστεί σε κάθε αρχείο του φακέλου πριν από τον συνδυασμό των δεδομένων από κάθε αρχείο.
Οι μετασχηματισμοί που πρέπει να προστεθούν στο ερώτημα Μετασχηματισμός δείγματος αρχείου είναι οι εξής:
Κατάργηση πρώτων γραμμών: Για να εκτελέσετε αυτήν τη λειτουργία, επιλέξτε το μενού εικονιδίου πίνακα στην επάνω αριστερή γωνία του πίνακα και, στη συνέχεια, επιλέξτε Κατάργηση πρώτων γραμμών.
Στο παράθυρο διαλόγου Κατάργηση πρώτων γραμμών, πληκτρολογήστε 4 και, στη συνέχεια, επιλέξτε OK.
Αφού επιλέξετε OK, ο πίνακάς σας δεν θα έχει πλέον τις τέσσερις πρώτες γραμμές.
Χρήση της πρώτης γραμμής ως κεφαλίδων: Επιλέξτε ξανά το εικονίδιο πίνακα και, στη συνέχεια, επιλέξτε Χρήση της πρώτης γραμμής ως κεφαλίδων.
Το αποτέλεσμα αυτής της λειτουργίας θα προωθήσει την πρώτη γραμμή του πίνακα στις νέες κεφαλίδες στηλών.
Μετά την ολοκλήρωση αυτής της λειτουργίας, το Power Query από προεπιλογή θα προσπαθήσει να εντοπίσει αυτόματα τους τύπους δεδομένων των στηλών και να προσθέσει ένα νέο βήμα αλλαγμένος τύπος στήλης.
Όταν επιστρέψετε στο ερώτημα Αρχεία CSV, θα παρατηρήσετε ότι το τελευταίο βήμα σας παρουσιάζει ένα σφάλμα που αναφέρει "Η στήλη 'Στήλη1' του πίνακα δεν βρέθηκε." Ο λόγος πίσω από αυτό το σφάλμα είναι ότι η προηγούμενη κατάσταση του ερωτήματος πραγματοποιούσε μια λειτουργία σε σχέση με μια στήλη με την ονομασία Column1. Ωστόσο, λόγω των αλλαγών που έγιναν στο ερώτημα αρχείου "Μετασχηματισμός δείγματος ", αυτή η στήλη δεν υπάρχει πλέον. Περισσότερες πληροφορίες: Αντιμετώπιση σφαλμάτων στο Power Query
Μπορείτε να καταργήσετε αυτό το τελευταίο βήμα του ερωτήματος από το τμήμα παραθύρου Εφαρμοσμένα βήματα , επιλέγοντας το εικονίδιο Διαγραφή X στην αριστερή πλευρά του ονόματος του βήματος. Μετά τη διαγραφή αυτού του βήματος, το ερώτημά σας θα εμφανίσει τα σωστά αποτελέσματα.
Ωστόσο, παρατηρήστε ότι σε καμία από τις στήλες που προέρχονται από τα αρχεία (Ημερομηνία, Χώρα, Μονάδες, Έσοδα) έχει αντιστοιχιστεί ένας συγκεκριμένος τύπος δεδομένων. Αντιστοιχίστε τον σωστό τύπο δεδομένων σε κάθε στήλη, χρησιμοποιώντας τον παρακάτω πίνακα.
Όνομα στήλης | Τύπος δεδομένων |
---|---|
Ημερομηνία | Ημερομηνία |
Χώρα | Κείμενο |
Μονάδες | Ακέραιος αριθμός |
Έσοδα | Νομισματική μονάδα |
Αφού ορίσετε τους τύπους δεδομένων για κάθε στήλη, θα είστε έτοιμοι να φορτώσετε τον πίνακα.
Σημείωση
Για να μάθετε πώς μπορείτε να ορίσετε ή να αλλάξετε τύπους δεδομένων στήλης, μεταβείτε στην ενότητα Τύποι δεδομένων.
Για να επικυρώσετε ότι όλα τα αρχεία έχουν συνδυαστεί, μπορείτε να επιλέξετε το εικονίδιο φίλτρου στην Source.Name επικεφαλίδα στήλης, η οποία θα εμφανίσει όλα τα ονόματα των αρχείων που έχουν συνδυαστεί. Εάν λάβετε την προειδοποίηση "Η λίστα ενδέχεται να είναι ελλιπής", επιλέξτε Φόρτωση περισσότερων στο κάτω μέρος του μενού για να εμφανίσετε περισσότερες διαθέσιμες τιμές στη στήλη.
Αφού επιλέξετε Φόρτωση περισσότερων, θα εμφανιστούν όλα τα διαθέσιμα ονόματα αρχείων.