Ανάγνωση στα Αγγλικά

Κοινή χρήση μέσω


Συνδυασμός αρχείων CSV

Στο Power Query, μπορείτε να συνδυάσετε πολλά αρχεία από μια δεδομένη προέλευση δεδομένων. Αυτό το άρθρο περιγράφει πώς λειτουργεί η εμπειρία όταν τα αρχεία που θέλετε να συνδυάσετε είναι αρχεία CSV. Περισσότερες πληροφορίες: Επισκόπηση συνδυασμού αρχείων

Φιλοδώρημα

Μπορείτε να ακολουθήσετε αυτό το παράδειγμα κάνοντας λήψη των δειγμάτων αρχείων που χρησιμοποιούνται σε αυτό το άρθρο από αυτήν τη σύνδεση λήψης. Μπορείτε να τοποθετήσετε αυτά τα αρχεία στην προέλευση δεδομένων της επιλογής σας, όπως έναν τοπικό φάκελο, φάκελο SharePoint, χώρο αποθήκευσης αντικειμένων Blob Azure, Azure Data Lake Υπηρεσία αποθήκευσης ή άλλη προέλευση δεδομένων που παρέχει την προβολή συστήματος αρχείων.

Για λόγους ευκολίας, το παράδειγμα σε αυτό το άρθρο χρησιμοποιεί τη σύνδεση Φάκελος. Περισσότερες πληροφορίες: Φάκελος

Πληροφορίες για τα δείγματα αρχείων που χρησιμοποιούνται

Για να συνδυάσετε αρχεία, είναι επιτακτική ανάγκη να έχουν όλοι την ίδια δομή και την ίδια επέκταση. Όλα τα αρχεία που χρησιμοποιούνται σε αυτό το παράδειγμα έχουν την ίδια δομή και επέκταση (.csv).

Υπάρχουν 12 αρχεία CSV, ένα για κάθε μήνα του ημερολογιακού έτους 2019. Η παρακάτω εικόνα εμφανίζει τις πρώτες 15 γραμμές του αρχείου για τον μήνα Ιανουάριο.

Δείγμα αρχείου CSV για τον Ιανουάριο 2019 που εμφανίζει την ενότητα κεφαλίδας και τα υπόλοιπα δεδομένα, διαχωρισμένα με κόμματα.

Ο αριθμός των γραμμών ποικίλλει από αρχείο σε αρχείο, αλλά όλα τα αρχεία έχουν μια ενότητα κεφαλίδας στις τέσσερις πρώτες γραμμές. Έχουν κεφαλίδες στηλών στην πέμπτη γραμμή και τα δεδομένα για τον πίνακα ξεκινούν στην έκτη γραμμή και συνεχίζονται σε όλες τις επόμενες γραμμές.

Ο στόχος είναι να συνδυάσετε και τα 12 αρχεία σε έναν ενιαίο πίνακα. Αυτός ο συνδυασμένος πίνακας περιέχει τη γραμμή κεφαλίδας στο επάνω μέρος του πίνακα και περιλαμβάνει το όνομα προέλευσης, την ημερομηνία, τη χώρα, τις μονάδες και τα δεδομένα εσόδων για ολόκληρο το έτος σε ξεχωριστές στήλες μετά τη γραμμή κεφαλίδας.

Δείγμα τελικού συνδυασμένου πίνακα.

Προεπισκόπηση πίνακα

Κατά τη σύνδεση με τον φάκελο που φιλοξενεί τα αρχεία που θέλετε να συνδυάσετε, σε αυτό το παράδειγμα, το όνομα αυτού του φακέλου είναι CSV Files, εμφανίζεται το παράθυρο διαλόγου προεπισκόπησης πίνακα, το οποίο εμφανίζει τη διαδρομή φακέλου σας στην επάνω αριστερή γωνία. Η προεπισκόπηση δεδομένων εμφανίζει την προβολή συστήματος αρχείων.

Προεπισκόπηση πίνακα για την προβολή συστήματος αρχείων.

Για αυτό το παράδειγμα, επιλέξτε Συνδυασμός.

Σημείωση

Σε διαφορετική περίπτωση, μπορείτε να επιλέξετε Μετασχηματισμός δεδομένων για περαιτέρω φιλτράρισμα και μετασχηματισμό των δεδομένων σας πριν από τον συνδυασμό των αρχείων. Η επιλογή Συνδυασμός συνιστάται μόνο όταν είστε βέβαιοι ότι ο φάκελος περιέχει μόνο τα αρχεία που θέλετε να συνδυάσετε.

Παράθυρο διαλόγου "Συνδυασμός αρχείων"

Αφού επιλέξετε Συνδυασμός στην προεπισκόπηση πίνακα, εμφανίζεται το παράθυρο διαλόγου Συνδυασμός αρχείων .

Παράθυρο διαλόγου

Σημείωση

Το Power Query εντοπίζει αυτόματα ποια σύνδεση θα χρησιμοποιήσει με βάση το πρώτο αρχείο που βρέθηκε στη λίστα. Για να μάθετε περισσότερα σχετικά με τη σύνδεση CSV, μεταβείτε στην επιλογή Κείμενο/CSV.

Για αυτό το παράδειγμα, αφήστε όλες τις προεπιλεγμένες ρυθμίσεις (το παράδειγμα αρχείου έχει οριστεί σε Πρώτο αρχείο και τις προεπιλεγμένες τιμές για την Προέλευση αρχείου, τον Οριοθέτη και τον Εντοπισμό τύπου δεδομένων).

Τώρα, επιλέξτε Μετασχηματισμός δεδομένων στην κάτω δεξιά γωνία για να μεταβείτε στο ερώτημα εξόδου.

Ερώτημα εξόδου

Αφού επιλέξετε Μετασχηματισμός δεδομένων στο παράθυρο διαλόγου Συνδυασμός αρχείων, θα μεταφερθείτε πίσω στην πρόγραμμα επεξεργασίας Power Query στο ερώτημα που δημιουργήσατε αρχικά από τη σύνδεση στον τοπικό φάκελο. Το ερώτημα εξόδου περιέχει τώρα το όνομα του αρχείου προέλευσης στην αριστερή στήλη, μαζί με τα δεδομένα από κάθε ένα από τα αρχεία προέλευσης στις υπόλοιπες στήλες.

Ερώτημα εξόδου για συνδυασμένα αρχεία χωρίς πρόσθετους μετασχηματισμούς.

Ωστόσο, τα δεδομένα δεν είναι στο σωστό σχήμα. Πρέπει να καταργήσετε τις τέσσερις πρώτες γραμμές από κάθε αρχείο πριν από τον συνδυασμό τους. Για να κάνετε αυτή την αλλαγή σε κάθε αρχείο προτού τα συνδυάσετε, επιλέξτε το ερώτημα Μετασχηματισμός δείγματος αρχείου στο τμήμα παραθύρου Ερωτήματα στην αριστερή πλευρά της οθόνης σας.

Τροποποίηση του ερωτήματος "Μετασχηματισμός δείγματος αρχείου"

Σε αυτό το ερώτημα αρχείου "Μετασχηματισμός δείγματος ", οι τιμές στη στήλη Ημερομηνία υποδεικνύουν ότι τα δεδομένα αφορούν τον μήνα Απρίλιο, ο οποίος έχει τη μορφή έτος-μήνας-ημέρα (ΕΕΕΕ-ΜΜ-ΗΗ). Η 2019.csv Απριλίου είναι το πρώτο αρχείο που εμφανίζεται στην προεπισκόπηση πίνακα.

Πίνακας που εμφανίζει τις στήλες δεδομένων από τον Απρίλιο 2019, συμπεριλαμβανομένης της ενότητας κεφαλίδας στις πρώτες τέσσερις γραμμές και τις επικεφαλίδες στην πέμπτη γραμμή.

Τώρα πρέπει να εφαρμόσετε ένα νέο σύνολο μετασχηματισμών για να καθαρίσετε τα δεδομένα. Κάθε μετασχηματισμός θα μετατρέπεται αυτόματα σε μια συνάρτηση εντός της ομάδας ερωτημάτων Βοηθητικών στοιχείων που θα εφαρμοστεί σε κάθε αρχείο του φακέλου πριν από τον συνδυασμό των δεδομένων από κάθε αρχείο.

Οι μετασχηματισμοί που πρέπει να προστεθούν στο ερώτημα Μετασχηματισμός δείγματος αρχείου είναι οι εξής:

  1. Κατάργηση πρώτων γραμμών: Για να εκτελέσετε αυτήν τη λειτουργία, επιλέξτε το μενού εικονιδίου πίνακα στην επάνω αριστερή γωνία του πίνακα και, στη συνέχεια, επιλέξτε Κατάργηση πρώτων γραμμών.

    Καταργήστε τις επάνω γραμμές από το μενού του πίνακα.

    Στο παράθυρο διαλόγου Κατάργηση πρώτων γραμμών, πληκτρολογήστε 4 και, στη συνέχεια, επιλέξτε OK.

    Παράθυρο διαλόγου κατάργησης πρώτων γραμμών.

    Αφού επιλέξετε OK, ο πίνακάς σας δεν θα έχει πλέον τις τέσσερις πρώτες γραμμές.

    Δείγμα ερωτήματος με καταργημένες γραμμές.

  2. Χρήση της πρώτης γραμμής ως κεφαλίδων: Επιλέξτε ξανά το εικονίδιο πίνακα και, στη συνέχεια, επιλέξτε Χρήση της πρώτης γραμμής ως κεφαλίδων.

    Χρησιμοποιήστε την πρώτη γραμμή ως κεφαλίδες εικονίδιο.

    Το αποτέλεσμα αυτής της λειτουργίας θα προωθήσει την πρώτη γραμμή του πίνακα στις νέες κεφαλίδες στηλών.

    Δείγμα πίνακα προβιβασμένων κεφαλίδων.

Μετά την ολοκλήρωση αυτής της λειτουργίας, το Power Query από προεπιλογή θα προσπαθήσει να εντοπίσει αυτόματα τους τύπους δεδομένων των στηλών και να προσθέσει ένα νέο βήμα αλλαγμένος τύπος στήλης.

Αναθεώρηση του ερωτήματος εξόδου

Όταν επιστρέψετε στο ερώτημα Αρχεία CSV, θα παρατηρήσετε ότι το τελευταίο βήμα σας παρουσιάζει ένα σφάλμα που αναφέρει "Η στήλη 'Στήλη1' του πίνακα δεν βρέθηκε." Ο λόγος πίσω από αυτό το σφάλμα είναι ότι η προηγούμενη κατάσταση του ερωτήματος πραγματοποιούσε μια λειτουργία σε σχέση με μια στήλη με την ονομασία Column1. Ωστόσο, λόγω των αλλαγών που έγιναν στο ερώτημα αρχείου "Μετασχηματισμός δείγματος ", αυτή η στήλη δεν υπάρχει πλέον. Περισσότερες πληροφορίες: Αντιμετώπιση σφαλμάτων στο Power Query

Ερώτημα εξόδου με σφάλμα επιπέδου βήματος.

Μπορείτε να καταργήσετε αυτό το τελευταίο βήμα του ερωτήματος από το τμήμα παραθύρου Εφαρμοσμένα βήματα , επιλέγοντας το εικονίδιο Διαγραφή X στην αριστερή πλευρά του ονόματος του βήματος. Μετά τη διαγραφή αυτού του βήματος, το ερώτημά σας θα εμφανίσει τα σωστά αποτελέσματα.

Συνδυασμός αρχείων χωρίς βήμα σφάλματος.

Ωστόσο, παρατηρήστε ότι σε καμία από τις στήλες που προέρχονται από τα αρχεία (Ημερομηνία, Χώρα, Μονάδες, Έσοδα) έχει αντιστοιχιστεί ένας συγκεκριμένος τύπος δεδομένων. Αντιστοιχίστε τον σωστό τύπο δεδομένων σε κάθε στήλη, χρησιμοποιώντας τον παρακάτω πίνακα.

Όνομα στήλης Τύπος δεδομένων
Ημερομηνία Ημερομηνία
Χώρα Κείμενο
Μονάδες Ακέραιος αριθμός
Έσοδα Νομισματική μονάδα

Αφού ορίσετε τους τύπους δεδομένων για κάθε στήλη, θα είστε έτοιμοι να φορτώσετε τον πίνακα.

Δείγμα τελικού συνδυασμένου πίνακα.

Σημείωση

Για να μάθετε πώς μπορείτε να ορίσετε ή να αλλάξετε τύπους δεδομένων στήλης, μεταβείτε στην ενότητα Τύποι δεδομένων.

Επαλήθευσης

Για να επικυρώσετε ότι όλα τα αρχεία έχουν συνδυαστεί, μπορείτε να επιλέξετε το εικονίδιο φίλτρου στην Source.Name επικεφαλίδα στήλης, η οποία θα εμφανίσει όλα τα ονόματα των αρχείων που έχουν συνδυαστεί. Εάν λάβετε την προειδοποίηση "Η λίστα ενδέχεται να είναι ελλιπής", επιλέξτε Φόρτωση περισσότερων στο κάτω μέρος του μενού για να εμφανίσετε περισσότερες διαθέσιμες τιμές στη στήλη.

Ελλιπής λίστα των αρχείων που έχουν συνδυαστεί.

Αφού επιλέξετε Φόρτωση περισσότερων, θα εμφανιστούν όλα τα διαθέσιμα ονόματα αρχείων.

Πλήρης λίστα των αρχείων που έχουν συνδυαστεί.