Κοινή χρήση μέσω


Βέλτιστες πρακτικές για τη σχεδίαση και την ανάπτυξη σύνθετων ροών δεδομένων

Εάν η ροή δεδομένων που αναπτύσσετε μεγαλώνει και γίνεται πιο σύνθετη, δείτε εδώ ορισμένα πράγματα που μπορείτε να κάνετε για να βελτιώσετε την αρχική σχεδίασή σας.

Διασπάσετε το σε πολλαπλές ροές δεδομένων

Μην κάνετε τα πάντα σε μία ροή δεδομένων. Μια μεμονωμένη, σύνθετη ροή δεδομένων καθιστά τη διαδικασία μετασχηματισμού δεδομένων μεγαλύτερη, αλλά καθιστά επίσης δυσκολότερη την κατανόηση και την επαναχρησιμοποίηση της ροής δεδομένων. Η διάσπαση της ροής δεδομένων σας σε πολλές ροές δεδομένων μπορεί να γίνει διαχωρίζοντας πίνακες σε διαφορετικές ροές δεδομένων ή ακόμη και έναν πίνακα σε πολλές ροές δεδομένων. Μπορείτε να χρησιμοποιήσετε την έννοια ενός υπολογισμένου πίνακα ή συνδεδεμένου πίνακα για να δημιουργήσετε μέρος του μετασχηματισμού σε μία ροή δεδομένων και να τον χρησιμοποιήσετε ξανά σε άλλες ροές δεδομένων.

Διαίρεση ροών δεδομένων μετασχηματισμού δεδομένων από ροές δεδομένων προεργασίας/εξαγωγής

Η παρουσία ορισμένων ροών δεδομένων μόνο για την εξαγωγή δεδομένων (δηλαδή, προεργασία ροών δεδομένων) και άλλες μόνο για τον μετασχηματισμό δεδομένων είναι χρήσιμη όχι μόνο για τη δημιουργία μιας πολυεπίπεδης αρχιτεκτονικής, αλλά είναι επίσης χρήσιμη για τη μείωση της πολυπλοκότητας των ροών δεδομένων. Ορισμένα βήματα απλώς εξάγουν δεδομένα από την προέλευση δεδομένων, όπως λήψη δεδομένων, περιήγηση και αλλαγές τύπου δεδομένων. Διαχωρίζοντας τις ροές δεδομένων προεργασίας και τις ροές δεδομένων μετασχηματισμού, κάνετε πιο εύκολη την ανάπτυξη των ροών δεδομένων σας.

Multilayered dataflow architecture.

Εικόνα που εμφανίζει δεδομένα που έχουν εξαχθεί από μια προέλευση δεδομένων σε ροές δεδομένων προεργασίας, όπου οι πίνακες είτε αποθηκεύονται στο Dataverse είτε στο Azure Data Lake Storage. Στη συνέχεια, τα δεδομένα μετακινούνται σε ροές δεδομένων μετασχηματισμού όπου τα δεδομένα μετασχηματώνονται και μετατρέπονται στη δομή αποθήκης δεδομένων. Στη συνέχεια, τα δεδομένα μετακινούνται στο μοντέλο σημασιολογίας.

Χρήση προσαρμοσμένων συναρτήσεων

Οι προσαρμοσμένες συναρτήσεις είναι χρήσιμες σε σενάρια όπου πρέπει να γίνει ένας συγκεκριμένος αριθμός βημάτων για έναν αριθμό ερωτημάτων από διαφορετικές προελεύσεις. Οι προσαρμοσμένες συναρτήσεις μπορούν να αναπτυχθούν μέσω της γραφικής διασύνδεσης σε πρόγραμμα επεξεργασίας Power Query ή χρησιμοποιώντας μια δέσμη ενεργειών M. Οι συναρτήσεις μπορούν να επαναχρησιμοποιηθούν σε μια ροή δεδομένων σε όσους πίνακες χρειάζεται.

Η ύπαρξη μιας προσαρμοσμένης συνάρτησης βοηθά με την ύπαρξη μόνο μίας έκδοσης του πηγαίου κώδικα, ώστε να μην χρειάζεται να αναπαραγάγετε τον κώδικα. Κατά συνέπεια, η διατήρηση της λογικής μετασχηματισμού Power Query και ολόκληρης της ροής δεδομένων είναι πολύ πιο εύκολη. Για περισσότερες πληροφορίες, μεταβείτε στην ακόλουθη καταχώρηση ιστολογίου: Προσαρμοσμένες συναρτήσεις που διευκολύνουν στο Power BI Desktop.

Screenshot of the Queries pane with the Get Holidays custom function and its data emphasized.

Σημείωμα

Ορισμένες φορές μπορεί να λάβετε μια ειδοποίηση που σας ενημερώνει ότι απαιτούνται premium εκχωρημένοι πόροι για την ανανέωση μιας ροής δεδομένων με μια προσαρμοσμένη συνάρτηση. Μπορείτε να αγνοήσετε αυτό το μήνυμα και να ανοίξετε ξανά το πρόγραμμα επεξεργασίας ροής δεδομένων. Αυτό συνήθως επιλύει το πρόβλημα, εκτός εάν η συνάκησή σας αναφέρεται σε ένα ερώτημα "με δυνατότητα φόρτωσης".

Τοποθέτηση ερωτημάτων σε φακέλους

Η χρήση φακέλων για ερωτήματα βοηθά στην ομαδοποίηση σχετικών ερωτημάτων. Όταν αναπτύσσετε τη ροή δεδομένων, αφιερώστε λίγο περισσότερο χρόνο για να τακτοποιήσετε τα ερωτήματα σε φακέλους που έχουν νόημα. Χρησιμοποιώντας αυτήν την προσέγγιση, μπορείτε να βρείτε τα ερωτήματα πιο εύκολα στο μέλλον και η συντήρηση του κώδικα είναι πολύ πιο εύκολη.

Χρήση υπολογοποιημένων πινάκων

Οι υπολογισμένοι πίνακες όχι μόνο κάνουν τη ροή δεδομένων σας πιο κατανοητή, αλλά παρέχουν επίσης καλύτερες επιδόσεις. Όταν χρησιμοποιείτε έναν υπολογισμένο πίνακα, οι άλλοι πίνακες στους οποίους γίνεται αναφορά λαμβάνουν δεδομένα από έναν πίνακα "ήδη επεξεργασμένο και αποθηκευμένο". Ο μετασχηματισμός είναι πολύ πιο απλός και ταχύτερος.

Επωφεληθείτε από τη βελτιωμένη μηχανή υπολογιστικής λειτουργίας

Για ροές δεδομένων που έχουν αναπτυχθεί στην πύλη διαχείρισης του Power BI, βεβαιωθείτε ότι χρησιμοποιείτε πρώτα τη βελτιωμένη μηχανή υπολογιστικής λειτουργίας εκτελώντας συνδέσμους και μετασχηματισμούς φίλτρων πρώτα σε έναν υπολογιζόμενη πίνακα πριν κάνετε άλλους τύπους μετασχηματισμών.

Διακοπή πολλών βημάτων σε πολλά ερωτήματα

Είναι δύσκολο να παρακολουθείτε έναν μεγάλο αριθμό βημάτων σε έναν πίνακα. Αντί για αυτό, θα πρέπει να διασπάσετε ένα μεγάλο αριθμό βημάτων σε πολλούς πίνακες. Μπορείτε να χρησιμοποιήσετε την Ενεργοποίηση φόρτωσης για άλλα ερωτήματα και να τα απενεργοποιήσετε εάν είναι ενδιάμεσα ερωτήματα και να φορτώσετε μόνο τον τελικό πίνακα μέσω της ροής δεδομένων. Όταν έχετε πολλά ερωτήματα με μικρότερα βήματα σε κάθε ένα, είναι πιο εύκολο να χρησιμοποιήσετε το διάγραμμα εξάρτησης και να παρακολουθήσετε κάθε ερώτημα για περαιτέρω διερεύνηση, αντί να εμβαθύνετε σε εκατοντάδες βήματα σε ένα ερώτημα.

Προσθήκη ιδιοτήτων για ερωτήματα και βήματα

Η τεκμηρίωση είναι το κλειδί για την ύπαρξη κώδικα που διατηρείται εύκολα. Στο Power Query, μπορείτε να προσθέσετε ιδιότητες στους πίνακες καθώς και σε βήματα. Το κείμενο που προσθέτετε στις ιδιότητες εμφανίζεται ως συμβουλή εργαλείου όταν τοποθετείτε τον δείκτη επάνω σε αυτό το ερώτημα ή βήμα. Αυτή η τεκμηρίωση σάς βοηθά να διατηρήσετε το μοντέλο σας στο μέλλον. Με μια ματιά σε έναν πίνακα ή βήμα, μπορείτε να κατανοήσετε τι συμβαίνει εκεί, αντί να αναθεωρείτε και να θυμάστε τι έχετε κάνει σε αυτό το βήμα.

Βεβαιωθείτε ότι οι εκχωρημένοι πόροι είναι στην ίδια περιοχή

Οι ροές δεδομένων δεν υποστηρίζουν προς το παρόν πολλές χώρες ή περιοχές. Οι Premium εκχωρημένοι πόροι πρέπει να είναι στην ίδια περιοχή με τον μισθωτή σας Power BI.

Διαχωρισμός προελεύσεων εσωτερικής εγκατάστασης από προελεύσεις cloud

Συνιστούμε να δημιουργήσετε μια ξεχωριστή ροή δεδομένων για κάθε τύπο προέλευσης, όπως εσωτερικής εγκατάστασης, cloud, SQL Server, Spark και Dynamics 365. Ο διαχωρισμός των ροών δεδομένων κατά τύπο προέλευσης διευκολύνει τη γρήγορη αντιμετώπιση προβλημάτων και αποφεύγει τα εσωτερικά όρια όταν ανανεώνετε τις ροές δεδομένων σας.

Διαχωρισμός ροών δεδομένων με βάση την προγραμματισμένη ανανέωση που απαιτείται για πίνακες

Εάν έχετε έναν πίνακα συναλλαγών πωλήσεων που ενημερώνεται στο σύστημα προέλευσης κάθε μία ώρα και έχετε έναν πίνακα αντιστοίχισης προϊόντων που ενημερώνεται κάθε εβδομάδα, διασπάστε αυτούς τους δύο πίνακες σε δύο ροές δεδομένων με διαφορετικά χρονοδιαγράμματα ανανέωσης δεδομένων.

Αποφύγετε τον προγραμματισμό ανανέωσης για συνδεδεμένους πίνακες στον ίδιο χώρο εργασίας

Εάν είστε συχνά αποκλεισμένοι από τις ροές δεδομένων σας που περιέχουν συνδεδεμένους πίνακες, αυτό μπορεί να οφείλεται σε μια αντίστοιχη, εξαρτώμενη ροή δεδομένων στον ίδιο χώρο εργασίας που είναι κλειδωμένη κατά την ανανέωση της ροής δεδομένων. Αυτό το κλείδωμα παρέχει ακρίβεια συναλλαγών και εξασφαλίζει ότι και οι δύο ροές δεδομένων ανανεώνονται με επιτυχία, αλλά μπορεί να σας αποκλείσει από την επεξεργασία.

Εάν ρυθμίσετε ένα ξεχωριστό χρονοδιάγραμμα για τη συνδεδεμένη ροή δεδομένων, οι ροές δεδομένων μπορούν να ανανεωθούν χωρίς λόγο και να σας αποκλείσουν από την επεξεργασία της ροής δεδομένων. Υπάρχουν δύο προτάσεις για να αποφύγετε αυτό το πρόβλημα:

  • Μην ορίσετε ένα χρονοδιάγραμμα ανανέωσης για μια συνδεδεμένη ροή δεδομένων στον ίδιο χώρο εργασίας με τη ροή δεδομένων προέλευσης.
  • Εάν θέλετε να ρυθμίσετε ένα χρονοδιάγραμμα ανανέωσης ξεχωριστά και θέλετε να αποφύγετε τη συμπεριφορά κλειδώματος, μετακινήστε τη ροή δεδομένων σε έναν ξεχωριστό χώρο εργασίας.