Κοινοποίηση μέσω


Γρήγορη εκκίνηση: Δημιουργία της πρώτης ροής δεδομένων σας για λήψη και μετασχηματισμό δεδομένων

Οι ροές δεδομένων είναι μια τεχνολογία προετοιμασίας δεδομένων που βασίζεται στο cloud και που βασίζεται στο cloud. Σε αυτό το άρθρο, δημιουργείτε την πρώτη ροή δεδομένων σας, λαμβάνετε δεδομένα για τη ροή δεδομένων σας και, στη συνέχεια, μετασχηματίζετε τα δεδομένα και δημοσιεύετε τη ροή δεδομένων.

Προαπαιτούμενα στοιχεία

Πριν ξεκινήσετε, απαιτούνται οι ακόλουθες προϋποθέσεις:

Δημιουργία ροής δεδομένων

Σε αυτή την ενότητα, δημιουργείτε την πρώτη ροή δεδομένων σας.

  1. Μεταβείτε στον χώρο εργασίας σας Microsoft Fabric.

    Στιγμιότυπο οθόνης του παραθύρου χώρων εργασίας όπου μεταβαίνετε στον χώρο εργασίας σας.

  2. Επιλέξτε +Νέο στοιχείο και, στη συνέχεια, επιλέξτε Ροή δεδομένων Gen2.

    Στιγμιότυπο οθόνης με έμφαση στην επιλογή Dataflow Gen2.

Λήψη δεδομένων

Ας πάρουμε ορισμένα δεδομένα! Σε αυτό το παράδειγμα, λαμβάνετε δεδομένα από μια υπηρεσία OData. Ακολουθήστε τα παρακάτω βήματα για να λάβετε δεδομένα στη ροή δεδομένων σας.

  1. Στο πρόγραμμα επεξεργασίας ροής δεδομένων, επιλέξτε Λήψη δεδομένων και, στη συνέχεια, επιλέξτε Περισσότερα.

    Στιγμιότυπο οθόνης με επιλεγμένη την επιλογή Λήψη δεδομένων και με μεγαλύτερη έμφαση στο αναπτυσσόμενο πλαίσιο.

  2. Στην Επιλογή προέλευσης δεδομένων, επιλέξτε Προβολή περισσότερων.

    Στιγμιότυπο οθόνης της λήψης προέλευσης δεδομένων με έμφαση στην προβολή.

  3. Στη Νέα προέλευση, επιλέξτε Άλλα>OData ως προέλευση δεδομένων.

    Στιγμιότυπο οθόνης της δυνατότητας

  4. Εισαγάγετε τη διεύθυνση URL https://services.odata.org/v4/northwind/northwind.svc/και, στη συνέχεια, επιλέξτε Επόμενο.

    Στιγμιότυπο οθόνης της προέλευσης δεδομένων OData όπου εισαγάγετε τη διεύθυνση URL δεδομένων.

  5. Επιλέξτε τους πίνακες Orders και Customers και, στη συνέχεια, επιλέξτε Δημιουργία.

    Στιγμιότυπο οθόνης της περιήγησης Power Query με έμφαση στους πίνακες Customers και Orders.

Μπορείτε να μάθετε περισσότερα σχετικά με την εμπειρία και τη λειτουργικότητα των δεδομένων στην επισκόπηση λήψης δεδομένων.

Εφαρμογή μετασχηματισμών και δημοσίευση

Φορτώσατε τα δεδομένα σας στην πρώτη ροή δεδομένων σας. Συγχαρητήρια! Τώρα είναι ώρα να εφαρμόσετε μερικούς μετασχηματισμούς για να φέρετε αυτά τα δεδομένα στη μορφή που χρειαζόμαστε.

Μετασχηματίζετε τα δεδομένα στο πρόγραμμα επεξεργασίας Power Query. Μπορείτε να βρείτε μια λεπτομερή επισκόπηση του προγράμματος επεξεργασίας Power Query στο περιβάλλον εργασίας χρήστη Power Query, αλλά αυτή η ενότητα σάς καθοδηγεί στα βασικά βήματα:

  1. Βεβαιωθείτε ότι τα εργαλεία προφίλ δεδομένων είναι ενεργοποιημένα. Μεταβείτε στις Αρχικές>επιλογές Καθολικές>επιλογές και, στη συνέχεια, επιλέξτε όλες τις επιλογές στο Προφίλ στήλης.

    Στιγμιότυπο οθόνης των καθολικών επιλογών με έμφαση στις επιλογές προφίλ στήλης.

    Επίσης, βεβαιωθείτε ότι ενεργοποιείτε την προβολή διαγράμματος χρησιμοποιώντας τις ρυθμίσεις παραμέτρων διάταξης στην καρτέλα Προβολή στην κορδέλα του προγράμματος επεξεργασίας Power Query ή επιλέγοντας το εικονίδιο προβολής διαγράμματος στην κάτω δεξιά πλευρά του παραθύρου του Power Query.

    Στιγμιότυπο οθόνης της συνολικής εμφάνισης της προβολής διαγράμματος του Power Query.

  2. Στον πίνακα Orders, υπολογίστε τον συνολικό αριθμό παραγγελιών ανά πελάτη: Επιλέξτε τη στήλη CustomerID στην προεπισκόπηση δεδομένων και, στη συνέχεια, επιλέξτε Ομαδοποίηση κατά στην καρτέλα Μετασχηματισμός στην κορδέλα.

    Στιγμιότυπο οθόνης που εμφανίζει τον επιλεγμένο πίνακα Orders και με έμφαση στην καρτέλα

  3. Εκτελείτε ένα πλήθος γραμμών ως συνάθροιση εντός της ομάδας κατά. Μπορείτε να μάθετε περισσότερα σχετικά με τις δυνατότητες Ομαδοποίηση κατά στην Ομαδοποίηση ή σύνοψη γραμμών.

    Στιγμιότυπο οθόνης της επιλογής Ομαδοποίηση κατά, με επιλεγμένη τη λειτουργία Πλήθος γραμμών.

  4. Μετά την ομαδοποίηση των δεδομένων στον πίνακα Orders, θα λάβουμε έναν πίνακα δύο στηλών με τα CustomerID και Count ως τις στήλες.

    Στιγμιότυπο οθόνης του πίνακα δύο στηλών.

  5. Στη συνέχεια, θέλετε να συνδυάσετε δεδομένα από τον πίνακα Customers με το ερώτημα Πλήθος παραγγελιών ανά πελάτη: Επιλέξτε το ερώτημα Customers στην προβολή διαγράμματος και χρησιμοποιήστε το μενού "⋮" για να αποκτήσετε πρόσβαση στα ερωτήματα συγχώνευσης ως νέο μετασχηματισμό.

    Στιγμιότυπο οθόνης του προγράμματος επεξεργασίας ροής δεδομένων, με τα κατακόρυφα αποσιωπητικά του πίνακα Customers και τα ερωτήματα συγχώνευσης ως νέα έμφαση.

  6. Ρυθμίστε τις παραμέτρους της λειτουργίας Συγχώνευση επιλέγοντας CustomerID ως την αντίστοιχη στήλη και στους δύο πίνακες. Επιλέξτε Ok.

    Στιγμιότυπο οθόνης του παραθύρου

    Στιγμιότυπο οθόνης του παραθύρου Συγχώνευση, με τον αριστερό πίνακα για συγχώνευση να έχει οριστεί στον πίνακα Customers και τον δεξιό πίνακα για συγχώνευση να έχει οριστεί στον πίνακα Orders. Η στήλη CustomerID επιλέγεται για τους πίνακες Customers και Orders. Επίσης, το Join Kind έχει οριστεί σε Αριστερό εξωτερικό. Όλες οι άλλες επιλογές ορίζονται στην προεπιλεγμένη τιμή τους.

  7. Τώρα υπάρχει ένα νέο ερώτημα με όλες τις στήλες από τον πίνακα Customers και μία στήλη με ένθετα δεδομένα από τον πίνακα Orders.

    Στιγμιότυπο οθόνης του προγράμματος επεξεργασίας ροής δεδομένων με το νέο ερώτημα συγχώνευσης που προστέθηκε στα δεξιά των πινάκων

  8. Ας εστιάσουμε σε λίγες μόνο στήλες από τον πίνακα Customers. Για να το κάνετε αυτό, ενεργοποιήστε την προβολή σχήματος επιλέγοντας το κουμπί προβολής σχήματος στην κάτω δεξιά γωνία του προγράμματος επεξεργασίας ροής δεδομένων.

    Στιγμιότυπο οθόνης του προγράμματος επεξεργασίας ροής δεδομένων με έμφαση στο κουμπί προβολής σχήματος στην κάτω δεξιά γωνία.

  9. Στην προβολή σχήματος, θα δείτε όλες τις στήλες στον πίνακά σας. Επιλέξτε CustomerID, CompanyName και Orders (2). Στη συνέχεια, μεταβείτε στην καρτέλα Εργαλεία σχήματος , επιλέξτε Κατάργηση στηλών και επιλέξτε Κατάργηση άλλων στηλών. Αυτό διατηρεί μόνο τις στήλες που θέλετε.

    Στιγμιότυπο οθόνης της προβολής σχήματος που εμφανίζει όλα τα διαθέσιμα ονόματα στηλών, με έμφαση στις στήλες CustomerID, CompanyName και Orders (2).

    Στιγμιότυπο οθόνης του μενού εργαλείων σχήματος με έμφαση στην επιλογή Κατάργηση άλλων στηλών.

  10. Η στήλη Παραγγελίες (2) περιέχει επιπλέον λεπτομέρειες από το βήμα συγχώνευσης. Για να δείτε και να χρησιμοποιήσετε αυτά τα δεδομένα, επιλέξτε το κουμπί Εμφάνιση προβολής δεδομένων στην κάτω δεξιά γωνία, δίπλα στο στοιχείο Εμφάνιση προβολής σχήματος. Στη συνέχεια, στην κεφαλίδα στήλης Παραγγελίες (2 ), επιλέξτε το εικονίδιο Ανάπτυξη στήλης και επιλέξτε τη στήλη Πλήθος . Αυτό προσθέτει το πλήθος παραγγελιών για κάθε πελάτη στον πίνακά σας.

    Στιγμιότυπο οθόνης για τη χρήση της προβολής δεδομένων.

  11. Τώρα ας κατατάξουμε τους πελάτες σας βάσει του αριθμού παραγγελιών που έχουν κάνει. Επιλέξτε τη στήλη Πλήθος , μεταβείτε στην καρτέλα Προσθήκη στήλης και επιλέξτε Στήλη κατάταξης. Αυτό προσθέτει μια νέα στήλη που εμφανίζει την κατάταξη κάθε πελάτη με βάση το πλήθος παραγγελιών του.

    Στιγμιότυπο οθόνης του προγράμματος επεξεργασίας ροής δεδομένων με επιλεγμένη τη στήλη Πλήθος.

  12. Διατηρήστε τις προεπιλεγμένες ρυθμίσεις στη Στήλη κατάταξης. Στη συνέχεια, επιλέξτε OK για να εφαρμόσετε αυτόν τον μετασχηματισμό.

    Στιγμιότυπο οθόνης του παραθύρου

  13. Τώρα, μετονομάστε το ερώτημα που προκύπτει σε Ranked Customers χρησιμοποιώντας το τμήμα παραθύρου Ρυθμίσεις ερωτήματος στη δεξιά πλευρά της οθόνης.

    Στιγμιότυπο οθόνης του προγράμματος επεξεργασίας ροής δεδομένων με έμφαση στο όνομα Ranked Customers κάτω από τις ιδιότητες ρυθμίσεων ερωτήματος.

  14. Είστε έτοιμοι να ορίσετε πού θα μεταβούν τα δεδομένα σας. Στο τμήμα παραθύρου Ρυθμίσεις ερωτήματος , κάντε κύλιση στο κάτω μέρος και επιλέξτε Επιλογή προορισμού δεδομένων.

    Στιγμιότυπο οθόνης του προγράμματος επεξεργασίας ροής δεδομένων με έμφαση στη θέση της επιλογής προορισμού δεδομένων.

  15. Μπορείτε να στείλετε τα αποτελέσματά σας σε ένα lakehouse εάν έχετε ένα ή να παραλείψετε αυτό το βήμα εάν δεν το κάνετε. Εδώ, μπορείτε να επιλέξετε ποια λίμνη και πίνακα θα χρησιμοποιήσετε για τα δεδομένα σας και να επιλέξετε αν θα προσθέσετε νέα δεδομένα (Προσάρτηση) ή θα αντικαταστήσετε αυτά που υπάρχουν εκεί (Αντικατάσταση).

    Στιγμιότυπο οθόνης του παραθύρου Σύνδεση σε προορισμό δεδομένων με επιλεγμένη τη lakehouse.

    Στιγμιότυπο οθόνης του παραθύρου Επιλογή ρυθμίσεων προορισμού.

  16. Η ροή δεδομένων σας είναι τώρα έτοιμη για δημοσίευση. Εξετάστε τα ερωτήματα στην προβολή διαγράμματος και, στη συνέχεια, επιλέξτε Δημοσίευση.

    Στιγμιότυπο οθόνης του προγράμματος επεξεργασίας ροής δεδομένων με έμφαση στο κουμπί Δημοσίευση στην κάτω δεξιά πλευρά.

    Επιλέξτε Δημοσίευση στην κάτω δεξιά γωνία για να αποθηκεύσετε τη ροή δεδομένων σας. Θα επιστρέψετε στον χώρο εργασίας σας, όπου εμφανίζεται ένα εικονίδιο στροφείου δίπλα στο όνομα της ροής δεδομένων που εμφανίζεται. Όταν ο σβήνων εξαφανίζεται, η ροή δεδομένων σας είναι έτοιμη για ανανέωση!

    Σημαντικό

    Την πρώτη φορά που δημιουργείτε ένα Dataflow Gen2 σε έναν χώρο εργασίας, το Fabric ρυθμίζει ορισμένα στοιχεία παρασκηνίου (Lakehouse και Warehouse) που βοηθούν στην εκτέλεση της ροής δεδομένων σας. Αυτά τα στοιχεία είναι κοινόχρηστα από όλες τις ροές δεδομένων στον χώρο εργασίας και δεν θα πρέπει να τα διαγράψετε. Δεν προορίζονται για απευθείας χρήση και συνήθως δεν είναι ορατές στον χώρο εργασίας σας, αλλά μπορεί να τις βλέπετε σε άλλα σημεία όπως σημειωματάρια ή αναλύσεις SQL. Αναζητήστε ονόματα που ξεκινούν με DataflowStaging για να τα εντοπίσετε.

  17. Στον χώρο εργασίας σας, επιλέξτε το εικονίδιο Προγραμματισμός ανανέωσης .

    Στιγμιότυπο οθόνης του χώρου εργασίας με έμφαση στο εικονίδιο προγραμματισμού ανανέωσης.

  18. Ενεργοποιήστε την προγραμματισμένη ανανέωση, επιλέξτε Προσθήκη άλλης ώρας και ρυθμίστε τις παραμέτρους της ανανέωσης, όπως φαίνεται στο παρακάτω στιγμιότυπο οθόνης.

    Στιγμιότυπο οθόνης που δείχνει πώς μπορείτε να επιλέξετε μια άλλη φορά.

    Στιγμιότυπο οθόνης των επιλογών προγραμματισμένης ανανέωσης, με ενεργοποιημένη την προγραμματισμένη ανανέωση, τη συχνότητα ανανέωσης που έχει οριστεί σε Ημερήσια, τη Ζώνη ώρας που έχει οριστεί σε συντονισμένη παγκόσμια ώρα και την Ώρα που έχει οριστεί σε 4:00 Π.Μ. Το κουμπί ενεργοποίησης, η επιλογή Προσθήκη άλλης ώρας, ο κάτοχος της ροής δεδομένων και το κουμπί εφαρμογής δίνονται έμφαση σε όλα.

Εκκαθάριση των πόρων

Εάν δεν πρόκειται να συνεχίσετε να χρησιμοποιείτε αυτή τη ροή δεδομένων, διαγράψτε τη ροή δεδομένων ακολουθώντας τα παρακάτω βήματα:

  1. Μεταβείτε στον χώρο εργασίας σας Microsoft Fabric.

    Στιγμιότυπο οθόνης του παραθύρου χώρων εργασίας όπου μεταβαίνετε στον χώρο εργασίας σας.

  2. Επιλέξτε τα κατακόρυφα αποσιωπητικά δίπλα στο όνομα της ροής δεδομένων σας και, στη συνέχεια, επιλέξτε Διαγραφή.

    Στιγμιότυπο οθόνης με τις τρεις κατακόρυφες κουκκίδες και με έμφαση στην επιλογή διαγραφής στο αναπτυσσόμενο μενού.

  3. Επιλέξτε Διαγραφή για να επιβεβαιώσετε τη διαγραφή της ροής δεδομένων σας.

    Στιγμιότυπο οθόνης του παραθύρου

Η ροή δεδομένων σε αυτό το δείγμα σάς δείχνει πώς μπορείτε να φορτώσετε και μετασχηματίζετε δεδομένα στο Dataflow Gen2. Μάθατε πώς να εκτελείτε τις εξής ενέργειες:

  • Δημιουργήστε μια ροή δεδομένων Gen2.
  • Μετασχηματισμός δεδομένων.
  • Ρυθμίστε τις παραμέτρους προορισμού για μετασχηματισμένο δεδομένα.
  • Εκτελέστε και προγραμματίστε τη διοχέτευσή σας.

Προχωρήστε στο επόμενο άρθρο για να μάθετε πώς να δημιουργήσετε τον πρώτο σας αγωγό.