Κοινή χρήση μέσω


Βέλτιστες πρακτικές για την επανάληψη χρήσης ροών δεδομένων σε περιβάλλοντα και χώρους εργασίας

Αυτό το άρθρο εξετάζει μια συλλογή βέλτιστων πρακτικών για την αποτελεσματική και αποτελεσματική επαναχρηστικότητα των ροών δεδομένων. Διαβάστε αυτό το άρθρο για να αποφύγετε παγίδες σχεδίασης και πιθανά προβλήματα επιδόσεων καθώς αναπτύσσετε ροές δεδομένων για επαναχρησιμοποίηση.

Διαχωρισμός ροών δεδομένων μετασχηματισμού δεδομένων από ροές δεδομένων προεργασίας/εξαγωγής

Εάν μια ροή δεδομένων εκτελεί όλες τις ενέργειες, είναι δύσκολο να χρησιμοποιήσετε ξανά τους πίνακές της σε άλλες ροές δεδομένων ή για άλλους σκοπούς. Οι καλύτερες ροές δεδομένων για επαναχρησιμοποίηση είναι εκείνες οι ροές δεδομένων που κάνουν μόνο μερικές ενέργειες. Η δημιουργία ροών δεδομένων που ειδικεύονται σε μια συγκεκριμένη εργασία είναι ένας από τους καλύτερους τρόπους για να τις χρησιμοποιήσετε ξανά. Εάν έχετε ένα σύνολο ροών δεδομένων που χρησιμοποιείτε ως ροές δεδομένων προεργασίας, η μόνη τους ενέργεια είναι να εξάγουν δεδομένα όπως είναι από το σύστημα προέλευσης. Αυτές οι ροές δεδομένων μπορούν να χρησιμοποιηθούν ξανά σε πολλές άλλες ροές δεδομένων.

Εάν έχετε ροές δεδομένων μετασχηματισμού δεδομένων, μπορείτε να τις διαιρέσετε σε ροές δεδομένων που κάνουν κοινούς μετασχηματισμούς. Κάθε ροή δεδομένων μπορεί να κάνει μόνο μερικές ενέργειες. Αυτές οι λίγες ενέργειες ανά ροή δεδομένων εξασφαλίζουν ότι η έξοδος αυτής της ροής δεδομένων είναι επαναχρησιμοποιήσιμη από άλλες ροές δεδομένων.

Dataflow doing only a few actions.

Εικόνα με δεδομένα που εξάγονται από μια προέλευση δεδομένων σε ροές δεδομένων προεργασίας, όπου οι πίνακες είτε αποθηκεύονται στο Dataverse είτε στο Azure Data Lake Storage. Στη συνέχεια, τα δεδομένα μετακινούνται σε ροές δεδομένων μετασχηματισμού όπου τα δεδομένα μετασχηματώνονται και μετατρέπονται στη δομή αποθήκης δεδομένων. Τέλος, τα δεδομένα φορτώνονται σε ένα σημασιολογικό μοντέλο Power BI.

Χρήση πολλών χώρων εργασίας

Κάθε χώρος εργασίας (ή περιβάλλον) είναι διαθέσιμος μόνο για τα μέλη αυτού του χώρου εργασίας. Εάν δημιουργείτε όλες τις ροές δεδομένων σας σε έναν χώρο εργασίας, ελαχιστοποιείτε την επαναχρησιμοποίηση των ροών δεδομένων σας. Μπορείτε να έχετε ορισμένους γενικούς χώρους εργασίας για ροές δεδομένων που επεξεργάζονται πίνακες σε όλη την εταιρεία. Μπορείτε επίσης να έχετε ορισμένο χώρο εργασίας για ροές δεδομένων για την επεξεργασία πινάκων σε πολλά τμήματα. Επίσης, μπορείτε να έχετε ορισμένους χώρους εργασίας για ροές δεδομένων που θα χρησιμοποιηθούν μόνο σε συγκεκριμένα τμήματα.

Image showing the separate workspaces.

Ορισμός των σωστών επιπέδων πρόσβασης στους χώρους εργασίας

Για να παραχωρήσετε πρόσβαση σε ροές δεδομένων σε άλλους χώρους εργασίας για χρήση της εξόδου μιας ροής δεδομένων σε έναν χώρο εργασίας, χρειάζεται απλώς να τους δώσετε πρόσβαση προβολής στον χώρο εργασίας. Για να μάθετε περισσότερα σχετικά με άλλους ρόλους σε έναν χώρο εργασίας Power BI, μεταβείτε στην ενότητα Ρόλοι στους νέους χώρους εργασίας.

Screenshot showing how to access to the Power BI workspace.

Έγκριση στη ροή δεδομένων στο Power BI

Μπορεί να υπάρχουν πολλές ροές δεδομένων που δημιουργούνται σε έναν οργανισμό μισθωτή και μπορεί να είναι δύσκολο για τους χρήστες να γνωρίζουν ποια ροή δεδομένων είναι πιο αξιόπιστη. Οι συντάκτες μιας ροής δεδομένων ή οι χρήστες που έχουν πρόσβαση επεξεργασίας σε αυτήν, μπορούν να εγκρίνουν τη ροή δεδομένων σε τρία επίπεδα: χωρίς έγκριση, προώθηση ή πιστοποίηση.

Αυτά τα επίπεδα έγκρισης βοηθούν τους χρήστες να βρίσκουν αξιόπιστες ροές δεδομένων πιο εύκολα και ταχύτερα. Η ροή δεδομένων με υψηλότερο επίπεδο έγκρισης εμφανίζεται πρώτη. Ο διαχειριστής του Power BI μπορεί να αναθέσει τη δυνατότητα έγκρισης ροών δεδομένων στο πιστοποιημένο επίπεδο σε άλλα άτομα. Περισσότερες πληροφορίες: Έγκριση - Προβιβασία και πιστοποίηση περιεχομένου Power BI

Screenshot of the Power Query Navigator showing the promoted and certified endorsement labels on specific dataflows.

Διαχωρισμός πινάκων σε πολλές ροές δεδομένων

Μπορείτε να έχετε πολλούς πίνακες σε μία ροή δεδομένων. Ένας από τους λόγους για τους οποίους μπορείτε να διαιρέσετε πίνακες σε πολλές ροές δεδομένων είναι αυτό που μάθατε νωρίτερα σε αυτό το άρθρο σχετικά με τον διαχωρισμό των ροών δεδομένων πρόσληψης δεδομένων και μετασχηματισμού δεδομένων. Ένας άλλος καλός λόγος για να έχετε πίνακες σε πολλές ροές δεδομένων είναι όταν θέλετε ένα διαφορετικό χρονοδιάγραμμα ανανέωσης από άλλους πίνακες.

Στο παράδειγμα που φαίνεται στην παρακάτω εικόνα, ο πίνακας πωλήσεων πρέπει να ανανεώνεται κάθε τέσσερις ώρες. Ο πίνακας ημερομηνιών πρέπει να ανανεώνεται μόνο μία φορά την ημέρα για να διατηρείται ενημερωμένη η τρέχουσα εγγραφή ημερομηνίας. Επίσης, ένας πίνακας αντιστοίχισης προϊόντων χρειάζεται να ανανεώνεται μόνο μία φορά την εβδομάδα. Εάν έχετε όλους αυτούς τους πίνακες σε μία ροή δεδομένων, έχετε μόνο μία επιλογή ανανέωσης για όλους. Ωστόσο, εάν διαιρέσετε αυτούς τους πίνακες σε πολλές ροές δεδομένων, μπορείτε να προγραμματίσετε την ανανέωση κάθε ροής δεδομένων ξεχωριστά.

Image showing dataflows with different schedules for the refresh.

Κατάλληλοι υποψήφιοι πίνακα για πίνακες ροής δεδομένων

Όταν αναπτύσσετε λύσεις χρησιμοποιώντας το Power Query στα εργαλεία επιφάνειας εργασίας, μπορεί να αναρωτηθείτε. ποιοι από αυτούς τους πίνακες είναι καλοί υποψήφιοι για να μετακινηθούν σε μια ροή δεδομένων; Οι καλύτεροι πίνακες προς μετακίνηση στη ροή δεδομένων είναι αυτοί οι πίνακες που πρέπει να χρησιμοποιηθούν σε περισσότερες από μία λύσεις ή σε περισσότερα από ένα περιβάλλοντα ή υπηρεσίες. Για παράδειγμα, ο πίνακας Date που εμφανίζεται στην παρακάτω εικόνα πρέπει να χρησιμοποιηθεί σε δύο ξεχωριστά αρχεία Power BI. Αντί να αναπαύσετε αυτόν τον πίνακα σε κάθε αρχείο, μπορείτε να δημιουργήσετε τον πίνακα σε μια ροή δεδομένων ως πίνακα και να τον χρησιμοποιήσετε ξανά σε αυτά τα αρχεία Power BI.

Image showing a shared table used in a dataflow.