Κοινή χρήση μέσω


Συνδυασμός αρχείων CSV

Στο Power Query, μπορείτε να συνδυάσετε πολλά αρχεία από μια δεδομένη προέλευση δεδομένων. Αυτό το άρθρο περιγράφει πώς λειτουργεί η εμπειρία όταν τα αρχεία που θέλετε να συνδυάσετε είναι αρχεία CSV. Περισσότερες πληροφορίες: Επισκόπηση συνδυασμού αρχείων

Φιλοδώρημα

Μπορείτε να ακολουθήσετε αυτό το παράδειγμα κάνοντας λήψη των δειγμάτων αρχείων που χρησιμοποιούνται σε αυτό το άρθρο από σύνδεσης λήψης. Μπορείτε να τοποθετήσετε αυτά τα αρχεία στην προέλευση δεδομένων της επιλογής σας, όπως έναν τοπικό φάκελο, φάκελο SharePoint, χώρο αποθήκευσης αντικειμένων Blob Azure, Azure Data Lake Storage ή άλλη προέλευση δεδομένων που παρέχει την προβολή συστήματος αρχείων.

Για λόγους ευκολίας, το παράδειγμα σε αυτό το άρθρο χρησιμοποιεί τη σύνδεση Φάκελος. Περισσότερες πληροφορίες: φακέλου

Πληροφορίες για τα δείγματα αρχείων που χρησιμοποιούνται

Για να συνδυάσετε αρχεία, είναι επιτακτική ανάγκη να έχουν όλοι την ίδια δομή και την ίδια επέκταση. Όλα τα αρχεία που χρησιμοποιούνται σε αυτό το παράδειγμα έχουν την ίδια δομή και επέκταση (.csv).

Υπάρχουν 12 αρχεία CSV, ένα για κάθε μήνα του ημερολογιακού έτους 2019. Η παρακάτω εικόνα εμφανίζει τις πρώτες 15 γραμμές του αρχείου για τον μήνα Ιανουάριο.

Στιγμιότυπο οθόνης του δείγματος αρχείου CSV για τον Ιανουάριο του 2019 που εμφανίζει την ενότητα κεφαλίδας και τα υπόλοιπα δεδομένα, διαχωρισμένα με κόμματα.

Ο αριθμός των γραμμών ποικίλλει από αρχείο σε αρχείο, αλλά όλα τα αρχεία έχουν μια ενότητα κεφαλίδας στις τέσσερις πρώτες γραμμές. Έχουν κεφαλίδες στηλών στην πέμπτη γραμμή και τα δεδομένα για τον πίνακα ξεκινούν στην έκτη γραμμή και συνεχίζονται σε όλες τις επόμενες γραμμές.

Ο στόχος είναι να συνδυάσετε και τα 12 αρχεία σε έναν ενιαίο πίνακα. Αυτός ο συνδυασμένος πίνακας περιέχει τη γραμμή κεφαλίδας στο επάνω μέρος του πίνακα και περιλαμβάνει το όνομα προέλευσης, την ημερομηνία, τη χώρα, τις μονάδες και τα δεδομένα εσόδων για ολόκληρο το έτος σε ξεχωριστές στήλες μετά τη γραμμή κεφαλίδας.

Στιγμιότυπο οθόνης του δείγματος τελικού συνδυασμένου πίνακα.

Προεπισκόπηση πίνακα

Κατά τη σύνδεση με τον φάκελο που φιλοξενεί τα αρχεία που θέλετε να συνδυάσετε, σε αυτό το παράδειγμα, το όνομα αυτού του φακέλου είναι αρχεία CSV— θα εμφανιστεί το παράθυρο διαλόγου προεπισκόπησης πίνακα, το οποίο εμφανίζει τη διαδρομή του φακέλου σας στην επάνω αριστερή γωνία. Η προεπισκόπηση δεδομένων εμφανίζει την προβολή συστήματος αρχείων.

Στιγμιότυπο οθόνης της προεπισκόπησης πίνακα για την προβολή συστήματος αρχείων.

Για αυτό το παράδειγμα, επιλέξτε Συνδυασμός. Για το Excel ή το Power Query Desktop, επιλέξτε Συνδυασμός & Μετασχηματισμός δεδομένων.

Σημείωση

Σε διαφορετική περίπτωση, μπορείτε να επιλέξετε Μετασχηματισμός δεδομένων για περαιτέρω φιλτράρισμα και μετασχηματισμό των δεδομένων σας πριν από τον συνδυασμό των αρχείων. Η επιλογή Συνδυασμός συνιστάται μόνο όταν είστε βέβαιοι ότι ο φάκελος περιέχει μόνο τα αρχεία που θέλετε να συνδυάσετε.

Παράθυρο διαλόγου "Συνδυασμός αρχείων"

Αφού επιλέξετε Συνδυασμός στην προεπισκόπηση πίνακα, εμφανίζεται το παράθυρο διαλόγου Συνδυασμός αρχείων.

Στιγμιότυπο οθόνης του παραθύρου διαλόγου Συνδυασμός αρχείων με τα δεδομένα αρχείου να εμφανίζονται.

Σημείωση

Το Power Query εντοπίζει αυτόματα ποια σύνδεση θα χρησιμοποιήσει με βάση το πρώτο αρχείο που βρέθηκε στη λίστα. Για να μάθετε περισσότερα σχετικά με τη σύνδεση CSV, μεταβείτε στο Text/CSV.

Για αυτό το παράδειγμα, αφήστε όλες τις προεπιλεγμένες ρυθμίσεις (Παράδειγμα αρχείου σε First fileκαι τις προεπιλεγμένες τιμές για το Αρχείο προέλευσης, οριοθέτηκαι εντοπισμό τύπου δεδομένων).

Τώρα, επιλέξτε Μετασχηματισμός δεδομένων στην κάτω δεξιά γωνία για να μεταβείτε στο ερώτημα εξόδου.

Ερώτημα εξόδου

Αφού επιλέξετε μετασχηματισμός δεδομένων στο παράθυρο διαλόγου Συνδυασμός αρχείων , θα μεταφερθείτε πίσω στο Πρόγραμμα επεξεργασίας Power Query στο ερώτημα που δημιουργήσατε αρχικά από τη σύνδεση στον τοπικό φάκελο. Το ερώτημα εξόδου περιέχει τώρα το όνομα του αρχείου προέλευσης στην αριστερή στήλη, μαζί με τα δεδομένα από κάθε ένα από τα αρχεία προέλευσης στις υπόλοιπες στήλες.

Στιγμιότυπο οθόνης του ερωτήματος εξόδου για συνδυασμένα αρχεία χωρίς πρόσθετους μετασχηματισμούς.

Ωστόσο, τα δεδομένα δεν είναι στο σωστό σχήμα. Πρέπει να καταργήσετε τις τέσσερις πρώτες γραμμές από κάθε αρχείο πριν από τον συνδυασμό τους. Για να κάνετε αυτή την αλλαγή σε κάθε αρχείο πριν τα συνδυάσετε, επιλέξτε το ερώτημα αρχείου Μετασχηματισμός αρχείου στο τμήμα παραθύρου Ερωτήματα στην αριστερή πλευρά της οθόνης σας.

Τροποποίηση του ερωτήματος "Μετασχηματισμός δείγματος αρχείου"

Σε αυτό το αρχείο μετασχηματισμού δείγματος ερώτημα, οι τιμές στη στήλη ημερομηνίας υποδεικνύουν ότι τα δεδομένα αφορούν τον μήνα Απρίλιο, ο οποίος έχει τη μορφή έτος-ημέρας (έτοςMM-DD). Απρίλιος 2019.csv είναι το πρώτο αρχείο που εμφανίζεται στην προεπισκόπηση πίνακα.

Στιγμιότυπο οθόνης του δείγματος αρχείου μετασχηματισμού με τις στήλες dat από τον Απρίλιο 2019 και την ενότητα κεφαλίδας.

Τώρα πρέπει να εφαρμόσετε ένα νέο σύνολο μετασχηματισμών για να καθαρίσετε τα δεδομένα. Κάθε μετασχηματισμός μετατρέπεται αυτόματα σε μια συνάρτηση εντός του ερωτήματα Βοηθητικών στοιχείων ομάδα που εφαρμόζεται σε κάθε αρχείο του φακέλου πριν από τον συνδυασμό των δεδομένων από κάθε αρχείο.

Οι μετασχηματισμοί που πρέπει να προστεθούν στο αρχείου "Μετασχηματισμός δείγματος" ερώτημα είναι οι εξής:

  1. Κατάργηση πρώτων γραμμών: Για να εκτελέσετε αυτή τη λειτουργία, επιλέξτε το μενού εικονιδίου πίνακα στην επάνω αριστερή γωνία του πίνακα και, στη συνέχεια, επιλέξτε Κατάργηση πρώτων γραμμών.

    Στιγμιότυπο οθόνης του μενού εικονιδίου πίνακα με έμφαση στην επιλογή Κατάργηση πρώτων γραμμών.

    Στο παράθυρο διαλόγου Κατάργηση πρώτων γραμμών , πληκτρολογήστε 4και, στη συνέχεια, επιλέξτε OK.

    Στιγμιότυπο οθόνης του παραθύρου διαλόγου

    Αφού επιλέξετε OK, ο πίνακας δεν έχει πλέον τις τέσσερις πρώτες γραμμές.

    Στιγμιότυπο οθόνης του δείγματος ερωτήματος με τις τέσσερις πρώτες γραμμές καταργημένες.

  2. Χρήση της πρώτης γραμμής ως κεφαλίδων: Επιλέξτε ξανά το εικονίδιο πίνακα και, στη συνέχεια, επιλέξτε Χρήση της πρώτης γραμμής ως κεφαλίδων.

    Στιγμιότυπο οθόνης του μενού εικονιδίου πίνακα με έμφαση στην επιλογή Χρήση της πρώτης γραμμής ως κεφαλίδων.

    Το αποτέλεσμα αυτής της λειτουργίας προωθεί την πρώτη γραμμή του πίνακα στις νέες κεφαλίδες στηλών.

    Στιγμιότυπο οθόνης του δείγματος πίνακα με προβιβασμένες τις κεφαλίδες.

Μετά την ολοκλήρωση αυτής της λειτουργίας, το Power Query από προεπιλογή προσπαθεί να εντοπίσει αυτόματα τους τύπους δεδομένων των στηλών και να προσθέσει ένα νέο αλλαγμένο τύπο στήλης βήμα.

Αναθεώρηση του ερωτήματος εξόδου

Όταν επιστρέψετε στο ερώτημα CSV Files στο Power Query Desktop, το τελευταίο βήμα είναι να λάβετε ένα σφάλμα που αναφέρει "Η στήλη 'Στήλη1' του πίνακα δεν βρέθηκε". Όταν επιστρέψετε στο ερώτημα CSV Files στο Power Query Online, οι αλλαγές που κάνατε προηγουμένως για να καταργήσετε τις τέσσερις πρώτες γραμμές και να χρησιμοποιήσετε την πρώτη γραμμή ως κεφαλίδες δεν εφαρμόζονται στον πίνακα. Στο Power Query Online, επιλέξτε ανανέωσης από την καρτέλα Αρχική. Όταν ανανεωθεί η οθόνη, εμφανίζεται το ίδιο μήνυμα σφάλματος.

Ο λόγος που κρύβεται πίσω από αυτό το σφάλμα είναι ότι η προηγούμενη κατάσταση του ερωτήματος πραγματοποιούσε μια λειτουργία σε σχέση με μια στήλη με την ονομασία Column1. Ωστόσο, λόγω των αλλαγών που έγιναν στο ερώτημα μετασχηματισμό δείγματος αρχείου, αυτή η στήλη δεν υπάρχει πλέον. Περισσότερες πληροφορίες: Αντιμετώπιση σφαλμάτων στο Power Query

Στιγμιότυπο οθόνης του ερωτήματος Output με το σφάλμα επιπέδου βήματος.

Μπορείτε να καταργήσετε αυτό το τελευταίο βήμα του ερωτήματος από το Εφαρμοσμένα βήματα τμήμα παραθύρου, επιλέγοντας το εικονίδιο Διαγραφή X στην αριστερή πλευρά του ονόματος του βήματος. Αφού διαγράψετε αυτό το βήμα, το ερώτημά σας εμφανίζει τα σωστά αποτελέσματα.

Στιγμιότυπο οθόνης του συνδυασμού αρχείων χωρίς το βήμα σφάλματος.

Ωστόσο, παρατηρήστε ότι σε καμία από τις στήλες που προέρχονται από τα αρχεία (Ημερομηνία, Χώρα, Μονάδες, Έσοδα) έχει αντιστοιχιστεί ένας συγκεκριμένος τύπος δεδομένων. Αντιστοιχίστε τον σωστό τύπο δεδομένων σε κάθε στήλη, χρησιμοποιώντας τον παρακάτω πίνακα.

Όνομα στήλης Τύπος δεδομένων
Ημερομηνία Ημερομηνία
Χώρα Κείμενο
Μονάδες Ακέραιος αριθμός
Έσοδο Νόμισμα

Αφού ορίσετε τους τύπους δεδομένων για κάθε στήλη, είστε έτοιμοι να φορτώσετε τον πίνακα.

Στιγμιότυπο οθόνης του τελικού δείγματος συνδυασμένου πίνακα.

Σημείωση

Για να μάθετε πώς μπορείτε να ορίσετε ή να αλλάξετε τύπους δεδομένων στήλης, μεταβείτε στην Τύποι δεδομένων.

Εξακρίβωση

Για να επικυρώσετε ότι όλα τα αρχεία συνδυάζονται, μπορείτε να επιλέξετε το εικονίδιο φίλτρου στην Source.Name επικεφαλίδα στήλης, η οποία εμφανίζει όλα τα ονόματα των αρχείων που συνδυάζονται. Εάν λάβετε την προειδοποίηση "Η λίστα ενδέχεται να είναι ελλιπής", επιλέξτε Φόρτωση περισσότερων στο κάτω μέρος του μενού για να εμφανίσετε περισσότερες διαθέσιμες τιμές στη στήλη.

Στιγμιότυπο οθόνης του παραθύρου διαλόγου φίλτρου με μια ελλιπή λίστα των αρχείων που συνδυάζονται.

Αφού επιλέξετε Φόρτωση περισσότερων, εμφανίζονται όλα τα διαθέσιμα ονόματα αρχείων.

Στιγμιότυπο οθόνης του παραθύρου διαλόγου φίλτρου με την πλήρη λίστα των αρχείων που συνδυάζονται.