Ρύθμιση παραμέτρων χώρου αποθήκευσης ροής δεδομένων για χρήση του Azure Data Lake Gen 2

Τα δεδομένα που χρησιμοποιούνται με το Power BI αποθηκεύονται στον εσωτερικό χώρο αποθήκευσης που παρέχεται από το Power BI από προεπιλογή. Με την ενοποίηση των ροών δεδομένων και του Azure Data Lake Υπηρεσία αποθήκευσης Gen 2 (ADLS Gen2), μπορείτε να αποθηκεύσετε τις ροές δεδομένων σας στον λογαριασμό Azure Data Lake Υπηρεσία αποθήκευσης Gen2 του οργανισμού σας. Αυτή η δυνατότητα ουσιαστικά σάς επιτρέπει να "μεταφέρετε τον δικό σας χώρο αποθήκευσης" στις ροές δεδομένων Power BI και να δημιουργήσετε μια σύνδεση σε επίπεδο μισθωτή ή χώρου εργασίας.

Λόγοι χρήσης του χώρου εργασίας ADLS Gen 2 ή της σύνδεσης μισθωτή

Αφού επισυνάψετε τη ροή δεδομένων σας, το Power BI ρυθμίζει τις παραμέτρους και αποθηκεύει μια αναφορά, ώστε να μπορείτε πλέον να διαβάζετε και να γράφετε δεδομένα στο δικό σας ADLS Gen 2. Το Power BI αποθηκεύει τα δεδομένα σε μορφή common data model (CDM), η οποία καταγράφει μετα-δεδομένα σχετικά με τα δεδομένα σας, εκτός από τα πραγματικά δεδομένα που δημιουργούνται από την ίδια τη ροή δεδομένων. Αυτή η δυνατότητα ξεκλειδώνει πολλές ισχυρές δυνατότητες και επιτρέπει στα δεδομένα σας και τα συσχετισμένα μετα-δεδομένα σε μορφή CDM να εξυπηρετούν πλέον σενάρια επεκτασιμότητας, αυτοματισμού, παρακολούθησης και δημιουργίας αντιγράφων ασφαλείας. Όταν κάνετε αυτά τα δεδομένα διαθέσιμα και ευρέως προσβάσιμα στο δικό σας περιβάλλον, σας επιτρέπει να εκδημοκρατίζετε τις πληροφορίες και τα δεδομένα που δημιουργούνται εντός του οργανισμού σας. Ξεκλειδώνει επίσης τη δυνατότητα για εσάς να δημιουργείτε περαιτέρω λύσεις με ένα ευρύ φάσμα πολυπλοκότητας. Οι λύσεις σας μπορούν να είναι προσαρμοσμένες εφαρμογές και λύσεις με επίγνωση CDM στο Power Platform, το Azure και εκείνες που είναι διαθέσιμες μέσω οικοσυστημάτων συνεργατών και ανεξάρτητων προμηθευτών λογισμικού (ISV). Εναλλακτικά, μπορείτε να δημιουργήσετε μια εφαρμογή για να διαβάσετε ένα CSV. Οι μηχανικοί δεδομένων, οι επιστήμονες δεδομένων και οι αναλυτές σας μπορούν πλέον να εργαστούν, να χρησιμοποιήσουν και να επαναχρησιμοποιήσουν ένα κοινό σύνολο δεδομένων που έχει επιμεληθεί στο ADLS Gen 2.

Υπάρχουν δύο τρόποι για να ρυθμίσετε τον χώρο αποθήκευσης ADLS Gen 2 που θα χρησιμοποιηθεί: μπορείτε να χρησιμοποιήσετε έναν λογαριασμό ADLS Gen 2 που έχει ανατεθεί από τον μισθωτή ή να μεταφέρετε τον δικό σας χώρο αποθήκευσης ADLS Gen 2 σε επίπεδο χώρου εργασίας.

Προαπαιτούμενα στοιχεία

  • Για να μεταφέρετε τον δικό σας λογαριασμό ADLS Gen 2, πρέπει να έχετε δικαίωμα Κατόχου στο επίπεδο λογαριασμού χώρου αποθήκευσης. Τα δικαιώματα σε επίπεδο ομάδας πόρων ή συνδρομής δεν θα λειτουργούν. Εάν είστε διαχειριστής, εξακολουθείτε να πρέπει να εκχωρήσετε στον εαυτό σας το δικαίωμα Κάτοχος. Προς το παρόν, η δεν υποστηρίζει λογαριασμούς Υπηρεσία αποθήκευσης ADLS Gen2 πίσω από ένα τείχος προστασίας.

  • Ο λογαριασμός χώρου αποθήκευσης πρέπει να δημιουργηθεί με ενεργοποιημένο τον Ιεραρχικό χώρο ονομάτων (HNS ).

  • Ο λογαριασμός χώρου αποθήκευσης πρέπει να δημιουργηθεί στον ίδιο μισθωτή Microsoft Entra με τον μισθωτή Power BI.

  • Ο χρήστης πρέπει να έχει Υπηρεσία αποθήκευσης ρόλο "Κάτοχος δεδομένων αντικειμένου Blob", Υπηρεσία αποθήκευσης ρόλο "Αναγνώστης δεδομένων blob" και ρόλο "Κάτοχος" σε επίπεδο λογαριασμού χώρου αποθήκευσης (η εμβέλεια πρέπει να είναι αυτός ο πόρος και να μην μεταβιβαστεί). Τυχόν αλλαγές στον εφαρμοσμένο ρόλο μπορεί να χρειαστούν μερικά λεπτά για να συγχρονιστούν και πρέπει να συγχρονιστούν για να ολοκληρωθούν τα ακόλουθα βήματα στο Υπηρεσία Power BI.

  • Η περιοχή μισθωτή χώρου εργασίας Power BI πρέπει να είναι ίδια με την περιοχή του λογαριασμού χώρου αποθήκευσης.

  • Απαιτείται έκδοση TLS (Transport Layer Security) 1.2 (ή νεότερη) για την προστασία των τελικών σημείων σας. Τα προγράμματα περιήγησης Web και άλλες εφαρμογές-πελάτες που χρησιμοποιούν εκδόσεις TLS παλαιότερες από το TLS 1.2 δεν θα μπορούν να συνδεθούν.

  • Η επισύναψη μιας ροής δεδομένων με το ADLS Gen 2 πίσω από τον έλεγχο ταυτότητας πολλών παραγόντων (MFA) δεν υποστηρίζεται.

  • Τέλος, μπορείτε να συνδεθείτε σε οποιοδήποτε ADLS Gen 2 από την πύλη Διαχείριση, αλλά εάν συνδεθείτε απευθείας σε έναν χώρο εργασίας, πρέπει πρώτα να βεβαιωθείτε ότι δεν υπάρχουν ροές δεδομένων στον χώρο εργασίας πριν από τη σύνδεση.

Σημείωμα

Η χρήση του δικού σας χώρου αποθήκευσης (Azure Data Lake Gen 2) δεν είναι διαθέσιμη στην Υπηρεσία Power BI για τους πελάτες GCC για δημόσιους οργανισμούς των Η.Π.Α. Για περισσότερες πληροφορίες σχετικά με το ποιες δυνατότητες είναι διαθέσιμες και ποιες όχι, ανατρέξτε στο θέμα Διαθεσιμότητα δυνατοτήτων του Power BI για τους πελάτες δημόσιους οργανισμούς των Η.Π.Α.

Ο παρακάτω πίνακας περιγράφει τα δικαιώματα για ADLS και για το Power BI που απαιτούνται για τα ADLS Gen 2 και Power BI:

Ενέργεια Δικαιώματα ADLS Ελάχιστα δικαιώματα Power BI
Σύνδεση ADLS Gen 2 σε μισθωτή Power BI Κάτοχος Διαχειριστής του Power BI
Σύνδεση ADLS Gen 2 σε Χώρος εργασίας Κάτοχος Διαχειριστής χώρου εργασίας
Δημιουργία ροών δεδομένων Power BI που επιστρέφουν σε συνδεδεμένο λογαριασμό ADLS Δεν ισχύει Συμβάλλων στον χώρο εργασίας
Κατανάλωση ροής δεδομένων Power BI Δεν ισχύει Πρόγραμμα προβολής χώρου εργασίας

Σύνδεση σε ένα Azure Data Lake Gen 2 σε επίπεδο χώρου εργασίας

Μεταβείτε σε έναν χώρο εργασίας που δεν έχει ροές δεδομένων. Επιλέξτε Ρυθμίσεις χώρου εργασίας. Επιλέξτε την καρτέλα Σύνδεση ions του Azure και, στη συνέχεια, επιλέξτε την ενότητα Υπηρεσία αποθήκευσης.

Screenshot of the Workspace settings pane on the Azure connections tab.

Η επιλογή Χρήση προεπιλεγμένης σύνδεσης Azure είναι ορατή εάν ο διαχειριστής έχει ήδη ρυθμίσει έναν λογαριασμό ADLS Gen 2 που έχει ανατεθεί σε μισθωτή. Έχετε δύο επιλογές:

  • Χρησιμοποιήστε τον λογαριασμό ADLS Gen 2 που έχει ρυθμιστεί από τον μισθωτή, επιλέγοντας το πλαίσιο με την ονομασία Χρήση της προεπιλεγμένης σύνδεσης Azure ή
  • Επιλέξτε Σύνδεση στο Azure για να κατευθύνετε σε έναν νέο λογαριασμό Υπηρεσία αποθήκευσης Azure.

Όταν επιλέγετε Σύνδεση στο Azure, το Power BI ανακτά μια λίστα συνδρομών Azure στις οποίες έχετε πρόσβαση. Συμπληρώστε τις αναπτυσσόμενες λίστες. Στη συνέχεια, επιλέξτε μια έγκυρη συνδρομή, ομάδα πόρων και λογαριασμό χώρου αποθήκευσης Azure που έχει ενεργοποιημένη την επιλογή ιεραρχικού χώρου ονομάτων, που είναι η σημαία ADLS Gen2. Ο προσωπικός λογαριασμός που χρησιμοποιείται για τη σύνδεση στο Azure χρησιμοποιείται μόνο μία φορά, για να ορίσετε την αρχική σύνδεση και να εκχωρήσετε στο Υπηρεσία Power BI δικαιώματα λογαριασμού για την ανάγνωση και εγγραφή δεδομένων, μετά από την οποία ο αρχικός λογαριασμός χρήστη δεν είναι πλέον απαραίτητος για να διατηρηθεί η σύνδεση ενεργή.

Screenshot of the Settings window after choosing Connecting to Azure.

Αφού επιλέξετε την επιλογή σας, επιλέξτε Αποθήκευση και τώρα έχετε συνδέσει με επιτυχία τον χώρο εργασίας στον δικό σας λογαριασμό ADLS Gen2. Το Power BI ρυθμίζει αυτόματα τον λογαριασμό χώρου αποθήκευσης με τα απαιτούμενα δικαιώματα και ρυθμίζει το σύστημα αρχείων Power BI στο οποίο θα εγγραφούν τα δεδομένα. Σε αυτό το σημείο, τα δεδομένα κάθε ροής δεδομένων μέσα σε αυτόν τον χώρο εργασίας θα εγγράφονται απευθείας σε αυτό το σύστημα αρχείων, το οποίο μπορεί να χρησιμοποιηθεί με άλλες υπηρεσίες Azure. Τώρα έχετε μία μόνο προέλευση για όλα τα δεδομένα του οργανισμού ή του τμήματος.

Ρύθμιση παραμέτρων συνδέσεων Azure

Η ρύθμιση παραμέτρων των συνδέσεων Azure είναι μια προαιρετική ρύθμιση με περισσότερες ιδιότητες που μπορούν προαιρετικά να οριστούν:

  • Χώρος αποθήκευσης σε επίπεδο μισθωτή, που σας επιτρέπει να ορίσετε μια προεπιλογή ή/και
  • Χώρος αποθήκευσης σε επίπεδο χώρου εργασίας, που σας επιτρέπει να καθορίσετε τη σύνδεση ανά χώρο εργασίας

Μπορείτε προαιρετικά να ρυθμίσετε τις παραμέτρους του χώρου αποθήκευσης σε επίπεδο μισθωτή, εάν θέλετε να χρησιμοποιήσετε μόνο μια κεντρική λίμνη δεδομένων ή θέλετε αυτός ο χώρος αποθήκευσης να είναι η προεπιλεγμένη επιλογή. Δεν ξεκινάμε αυτόματα χρησιμοποιώντας την προεπιλογή για να επιτρέψουμε την ευελιξία στη ρύθμιση παραμέτρων σας, επομένως έχετε την ευελιξία να ρυθμίσετε τις παραμέτρους των χώρων εργασίας που χρησιμοποιούν αυτήν τη σύνδεση όπως επιθυμείτε. Εάν ρυθμίσετε έναν λογαριασμό ADLS Gen 2 που έχει αντιστοιχιστεί σε μισθωτή, πρέπει ακόμα να ρυθμίσετε τις παραμέτρους κάθε χώρου εργασίας για να χρησιμοποιήσετε αυτή την προεπιλεγμένη επιλογή.

Μπορείτε προαιρετικά ή επιπλέον να ρυθμίσετε τις παραμέτρους των δικαιωμάτων χώρου αποθήκευσης σε επίπεδο χώρου εργασίας ως ξεχωριστή επιλογή, το οποίο παρέχει πλήρη ευελιξία να ορίσετε έναν συγκεκριμένο λογαριασμό ADLS Gen 2 σε έναν χώρο εργασίας βάσει χώρου εργασίας.

Για να συνοψίσουμε, εάν επιτρέπονται δικαιώματα χώρου αποθήκευσης σε επίπεδο μισθωτή και χώρου αποθήκευσης σε επίπεδο χώρου εργασίας, οι διαχειριστές χώρου εργασίας μπορούν προαιρετικά να χρησιμοποιήσουν την προεπιλεγμένη σύνδεση ADLS ή να επιλέξουν να ρυθμίσουν έναν άλλο λογαριασμό χώρου αποθήκευσης ξεχωριστά από την προεπιλογή. Εάν δεν έχει οριστεί χώρος αποθήκευσης μισθωτή, οι διαχειριστές χώρου εργασίας μπορούν προαιρετικά να ρυθμίσουν τις παραμέτρους λογαριασμών ADLS σε έναν χώρο εργασίας βάσει χώρου εργασίας. Τέλος, εάν επιλεγεί χώρος αποθήκευσης σε επίπεδο μισθωτή και δεν επιτρέπεται χώρος αποθήκευσης σε επίπεδο χώρου εργασίας, οι διαχειριστές χώρου εργασίας μπορούν προαιρετικά να ρυθμίσουν τις παραμέτρους των ροών δεδομένων τους για να χρησιμοποιήσουν αυτήν τη σύνδεση.

Δομή και μορφή για συνδέσεις χώρου εργασίας ADLS Gen 2

Στον λογαριασμό χώρου αποθήκευσης ADLS Gen 2, όλες οι ροές δεδομένων αποθηκεύονται στο κοντέινερ powerbi του συστήματος αρχείων.

Η δομή του κοντέινερ powerbi έχει την εξής μορφή: <workspace name>/<dataflow name>/model.json, <workspace name>/<dataflow name>/model.json.snapshots/<all snapshots> και <workspace name>/<dataflow name>/<table name>/<tablesnapshots>

Η θέση όπου οι ροές δεδομένων αποθηκεύουν δεδομένα στην ιεραρχία φακέλων για το ADLS Gen 2 είναι η ίδια, ανεξάρτητα από το αν ο χώρος εργασίας βρίσκεται σε κοινόχρηστους εκχωρημένους πόρους ή σε Premium εκχωρημένους πόρους.

Το παρακάτω παράδειγμα χρησιμοποιεί τον πίνακα Orders του δείγματος Odata Northwind.

Screenshot of the file explorer showing an example using the Orders table of the Northwind Odata sample.

Στην προηγούμενη εικόνα:

  • Το model.json είναι η πιο πρόσφατη έκδοση της ροής δεδομένων.
  • Τα model.json.snapshots είναι όλες προηγούμενες εκδόσεις της ροής δεδομένων. Αυτό το ιστορικό είναι χρήσιμο εάν χρειάζεστε μια προηγούμενη έκδοση συνδυασμού δεδομένων ή ρυθμίσεις επαύξησης.
  • Το όνομα πίνακα είναι ο φάκελος που περιέχει τα δεδομένα που προκύπτουν μετά την ολοκλήρωση μιας ανανέωσης ροής δεδομένων.

Γράφουμε μόνο σε αυτόν τον λογαριασμό χώρου αποθήκευσης και δεν διαγράφουμε δεδομένα προς το παρόν. Επομένως, ακόμη και μετά το απόσπασμα, δεν διαγράφουμε από τον λογαριασμό ADLS, επομένως, όλα τα αρχεία που αναφέρονται στην προηγούμενη λίστα εξακολουθούν να αποθηκεύονται.

Σημείωμα

Οι ροές δεδομένων επιτρέπουν τη σύνδεση ή την αναφορά πινάκων σε άλλες ροές δεδομένων. Σε αυτές τις ροές δεδομένων, το αρχείο model.json μπορεί να αναφέρεται σε ένα άλλο model.json άλλης ροής δεδομένων στον ίδιο ή σε άλλο χώρο εργασίας.

Μετακίνηση αρχείων μεταξύ/εντός λογαριασμών αποθήκευσης ADLS Gen 2

Όταν μετακινείτε μια ροή δεδομένων από έναν λογαριασμό χώρου αποθήκευσης ADLS Gen2 σε έναν άλλο, πρέπει να βεβαιωθείτε ότι οι διαδρομές στο αρχείο model.json ενημερώνονται ώστε να αντικατοπτρίζουν τη νέα θέση. Αυτό συμβαίνει επειδή το αρχείο model.json περιέχει τη διαδρομή προς τη ροή δεδομένων και τη διαδρομή προς τα δεδομένα. Εάν δεν ενημερώσετε τις διαδρομές, η ροή δεδομένων δεν θα μπορεί να εντοπίσει τα δεδομένα και προκαλεί σφάλματα δικαιωμάτων. Για να ενημερώσετε τις διαδρομές, μπορείτε να χρησιμοποιήσετε τα παρακάτω βήματα:

  • Ανοίξτε το αρχείο model.json σε ένα πρόγραμμα επεξεργασίας κειμένου.
  • Βρείτε τη διεύθυνση URL λογαριασμού χώρου αποθήκευσης και αντικαταστήστε τη με τη νέα διεύθυνση URL λογαριασμού χώρου αποθήκευσης.
  • Αποθηκεύστε το αρχείο.
  • Αντικαταστήστε το υπάρχον αρχείο model.json στον λογαριασμό χώρου αποθήκευσης ADLS Gen2.

Επεκτασιμότητα για συνδέσεις χώρου εργασίας ADLS Gen 2

Εάν συνδέετε το ADLS Gen 2 στο Power BI, μπορείτε να κάνετε αυτή την ενέργεια σε επίπεδο χώρου εργασίας ή μισθωτή. Βεβαιωθείτε ότι έχετε το σωστό επίπεδο πρόσβασης. Μάθετε περισσότερα στα Προαπαιτούμενα.

Η δομή αποθήκευσης συμμορφώνεται με τη μορφή Common Data Model. Μάθετε περισσότερα σχετικά με τη δομή αποθήκευσης και το CDM, ανατρέξτε στο θέμα Ποια είναι η δομή αποθήκευσης για τις ροές δεδομένων ανάλυσης και Χρησιμοποιήστε το Common Data Model για να βελτιστοποιήσετε το Azure Data Lake Υπηρεσία αποθήκευσης Gen2.

Αφού ρυθμιστούν σωστά, τα δεδομένα και τα μετα-δεδομένα βρίσκονται στον έλεγχό σας. Πολλές εφαρμογές γνωρίζουν το CDM και τα δεδομένα μπορούν να επεκταθούν χρησιμοποιώντας τα Azure, PowerApps και PowerAutomate. Μπορείτε επίσης να χρησιμοποιήσετε οικοσυστήματα τρίτων κατασκευαστών, είτε συμμορφώνοντας με τη μορφή είτε διαβάζοντας τα ανεπεξέργαστα δεδομένα.

Απόσπαση του Azure Data Lake Gen 2 από έναν χώρο εργασίας ή μισθωτή

Για να καταργήσετε μια σύνδεση σε επίπεδο χώρου εργασίας, πρέπει πρώτα να εξασφαλίσετε ότι όλες οι ροές δεδομένων στον χώρο εργασίας διαγράφονται. Αφού καταργηθούν όλες οι ροές δεδομένων, επιλέξτε Αποσύνδεση στις ρυθμίσεις του χώρου εργασίας. Το ίδιο ισχύει και για έναν μισθωτή, αλλά πρέπει πρώτα να βεβαιωθείτε ότι όλοι οι χώροι εργασίας έχουν αποσυνδεθεί από τον λογαριασμό χώρου αποθήκευσης μισθωτή, για να μπορέσετε να αποσυνδεθείτε σε επίπεδο μισθωτή.

Απενεργοποίηση του Azure Data Lake Gen 2

Στην πύλη Διαχείριση, στην περιοχή ροές δεδομένων, μπορείτε να απενεργοποιήσετε την πρόσβαση για τους χρήστες ώστε να χρησιμοποιούν αυτήν τη δυνατότητα και να απαγορεύσετε στους διαχειριστές χώρων εργασίας να χρησιμοποιούν τις δικές τους Υπηρεσία αποθήκευσης Azure.

Επαναφορά από το Azure Data Lake Gen 2

Αφού ρυθμιστεί ο χώρος αποθήκευσης ροής δεδομένων για χρήση του Azure Data Lake Gen 2, δεν υπάρχει τρόπος αυτόματης επαναφοράς. Η διαδικασία επιστροφής στον διαχειριζόμενο χώρο αποθήκευσης Power BI είναι μη αυτόματη.

Για να επαναφέρετε τη μετεγκατάσταση που πραγματοποιήσατε στη Gen 2, πρέπει να διαγράψετε τις ροές δεδομένων σας και να τις δημιουργήσετε εκ νέου στον ίδιο χώρο εργασίας. Στη συνέχεια, επειδή δεν διαγράφουμε δεδομένα από το ADLS Gen 2, μεταβείτε στον ίδιο τον πόρο και εκκαθαρίστε τα δεδομένα. Αυτή η ενέργεια θα περιλαμβάνει τα παρακάτω βήματα.

  1. Εξαγάγετε ένα αντίγραφο της ροής δεδομένων από το Power BI. Εναλλακτικά, αντιγράψτε το αρχείο model.json. Το αρχείο model.json αποθηκεύεται στο ADLS.

  2. Διαγράψτε τις ροές δεδομένων.

  3. Αποσπασματικά ADLS.

  4. Δημιουργήστε εκ νέου τις ροές δεδομένων χρησιμοποιώντας την εισαγωγή. Τα δεδομένα επαυξητικής ανανέωσης (εάν υπάρχουν) θα πρέπει να διαγραφούν πριν από την εισαγωγή. Αυτή η ενέργεια μπορεί να γίνει διαγράφοντας τα σχετικά διαμερίσματα στο αρχείο model.json.

  5. Ρυθμίστε τις παραμέτρους ανανέωσης/δημιουργίας εκ νέου πολιτικών επαυξητικής ανανέωσης.

Σύνδεση στα δεδομένα χρησιμοποιώντας τη σύνδεση ADLS Gen 2

Η εμβέλεια αυτού του εγγράφου περιγράφει τις συνδέσεις ροών δεδομένων ADLS Gen 2 και όχι τη σύνδεση Power BI ADLS Gen 2. Η εργασία με τη σύνδεση ADLS Gen 2 είναι ένα ξεχωριστό, πιθανώς προσθετικό, σενάριο. Η σύνδεση ADLS χρησιμοποιεί απλώς το ADLS ως προέλευση δεδομένων. Επομένως, η χρήση του Power Query Online για υποβολή ερωτημάτων σε σχέση με αυτά τα δεδομένα δεν χρειάζεται να είναι σε μορφή CDM, μπορεί να είναι όποια μορφή δεδομένων θέλει ο πελάτης. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Azure Data Lake Υπηρεσία αποθήκευσης Gen2.

Τα παρακάτω άρθρα παρέχουν περισσότερες πληροφορίες σχετικά με τις ροές δεδομένων και το Power BI: