Κοινοποίηση μέσω


OneLake, το OneDrive για δεδομένα

Το OneLake είναι μια ενιαία, ενοποιημένη, λογική λίμνη δεδομένων για ολόκληρο τον οργανισμό σας. Όπως το OneDrive, το OneLake παρέχεται αυτόματα με κάθε μισθωτή Microsoft Fabric και έχει σχεδιαστεί για να είναι το μοναδικό σημείο για όλα τα δεδομένα αναλύσεων.

Το OneLake φέρνει πελάτες:

  • Μία λίμνη δεδομένων για ολόκληρο τον οργανισμό
  • Ένα αντίγραφο δεδομένων για χρήση με πολλούς μηχανισμούς ανάλυσης

Μία λίμνη δεδομένων για ολόκληρο τον οργανισμό

Πριν από το OneLake, πολλοί οργανισμοί δημιούργησαν πολλές λίμνες για διαφορετικές επιχειρηματικές ομάδες, γεγονός που οδήγησε σε επιπλέον έξοδα για τη διαχείριση πολλών πόρων. Το OneLake καταργεί αυτές τις προκλήσεις βελτιώνοντας τη συνεργασία:

  • Κάθε μισθωτής Fabric λαμβάνει αυτόματα ένα OneLake
  • Δεν μπορείτε να δημιουργήσετε πολλά OneLake ή να διαγράψετε το OneLake σας
  • Δεν υπάρχουν επιπλέον πόροι για παροχή ή διαχείριση

Αυτή η απλότητα βοηθά τον οργανισμό σας να συνεργάζεται σε μια ενιαία, ενοποιημένη λίμνη δεδομένων.

Διέπεται από προεπιλογή με κατανεμημένη ιδιοκτησία για συνεργασία

Το ανώτερο επίπεδο οργάνωσης και διαχείρισης για τα δεδομένα Fabric είναι ο μισθωτής. Όλα τα δεδομένα που προσγειώνονται στο OneLake προστατεύονται αυτόματα από πολιτικές σε επίπεδο μισθωτή για ασφάλεια, συμμόρφωση και διαχείριση δεδομένων.

Μέσα σε έναν μισθωτή, η συνεργασία πραγματοποιείται εντός χώρων εργασίας. Μπορείτε να δημιουργήσετε οποιονδήποτε αριθμό χώρων εργασίας για να οργανώσετε τα δεδομένα σας. Οι χώροι εργασίας επιτρέπουν σε διαφορετικά μέρη του οργανισμού να διανέμουν πολιτικές ιδιοκτησίας και πρόσβασης. Κάθε χώρος εργασίας αποτελεί μέρος ενός συνόλου εκχωρημένων πόρων που συνδέονται με μια συγκεκριμένη περιοχή και χρεώνονται ξεχωριστά.

Διάγραμμα που εμφανίζει τη συνάρτηση και τη δομή του OneLake.

Μέσα σε έναν χώρο εργασίας, δημιουργείτε και έχετε πρόσβαση σε όλα τα δεδομένα μέσω στοιχείων δεδομένων. Παρόμοια με τον τρόπο που το Office αποθηκεύει αρχεία Word, Excel και PowerPoint στο OneDrive, το Fabric αποθηκεύει lakehouses, αποθήκες και άλλα στοιχεία στο OneLake. Κάθε τύπος στοιχείου παρέχει προσαρμοσμένες εμπειρίες για διαφορετικές προσωπικότητες, όπως η εμπειρία προγραμματιστή Apache Spark σε ένα lakehouse.

Βασισμένο σε ανοιχτά πρότυπα και τύπους αρχειοθέτησης

Το OneLake βασίζεται στο Azure Data Lake Storage (ADLS) Gen2 και μπορεί να υποστηρίζει οποιονδήποτε τύπο αρχείου, δομημένο ή μη δομημένο. Όλα τα στοιχεία δεδομένων Fabric, όπως αποθήκες δεδομένων και lakehouses αποθηκεύουν τα δεδομένα τους αυτόματα σε μορφή OneLake σε Delta Parquet. Εάν ένας μηχανικός δεδομένων φορτώσει δεδομένα σε μια λίμνη χρησιμοποιώντας το Apache Spark και, στη συνέχεια, ένας προγραμματιστής SQL χρησιμοποιήσει T-SQL για τη φόρτωση δεδομένων σε μια αποθήκη δεδομένων πλήρως συναλλαγών, και οι δύο συμβάλλουν στην ίδια λίμνη δεδομένων. Το OneLake αποθηκεύει όλα τα δεδομένα σε μορφή πίνακα σε μορφή Delta Parquet.

Το OneLake υποστηρίζει τα ίδια ADLS Gen2 API και SDK για να είναι συμβατά με υπάρχουσες εφαρμογές ADLS Gen2, συμπεριλαμβανομένων των Azure Databricks. Μπορείτε να απευθυνθείτε σε δεδομένα στο OneLake σαν να πρόκειται για έναν μεγάλο λογαριασμό χώρου αποθήκευσης ADLS για ολόκληρο τον οργανισμό. Κάθε χώρος εργασίας εμφανίζεται ως κοντέινερ στον συγκεκριμένο λογαριασμό χώρου αποθήκευσης και διαφορετικά στοιχεία δεδομένων εμφανίζονται ως φάκελοι μέσα σε αυτά τα κοντέινερ.

Διάγραμμα που δείχνει πώς μπορείτε να αποκτήσετε πρόσβαση σε δεδομένα OneLake με API και SDK.

Για περισσότερες πληροφορίες σχετικά με τα API και τα τελικά σημεία, ανατρέξτε στο θέμα Πρόσβαση OneLake και API. Για παραδείγματα ενοποιήσεων OneLake με το Azure, ανατρέξτε στα άρθρα Azure Synapse Analytics, Εξερεύνηση αποθήκευσης Azure, Azure Databricks και Azure HDInsight .

Εξερεύνηση αρχείων OneLake για Windows

Μπορείτε να εξερευνήσετε δεδομένα OneLake από τα Windows χρησιμοποιώντας την εξερεύνηση αρχείων OneLake για Windows. Μπορείτε να περιηγηθείτε σε όλους τους χώρους εργασίας και τα στοιχεία δεδομένων σας, να κάνετε εύκολα αποστολή, λήψη ή τροποποίηση αρχείων, όπως ακριβώς κάνετε στο Office. Η εξερεύνηση αρχείων OneLake απλοποιεί την εργασία με λίμνες δεδομένων, επιτρέποντας ακόμη και στους μη επιχειρηματικούς χρήστες να τις χρησιμοποιούν.

Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Εξερεύνηση αρχείων OneLake.

Ένα αντίγραφο δεδομένων

Το OneLake στοχεύει να σας προσφέρει τη μεγαλύτερη δυνατή αξία από ένα μόνο αντίγραφο δεδομένων χωρίς μετακίνηση ή αντιγραφή δεδομένων. Δεν χρειάζεται να αντιγράψετε δεδομένα μόνο για να τα χρησιμοποιήσετε με έναν άλλο μηχανισμό ή για να αναλύσετε δεδομένα από πολλές πηγές.

Οι συντομεύσεις συνδέουν δεδομένα μεταξύ τομέων χωρίς μετακίνηση δεδομένων

Μια συντόμευση είναι μια αναφορά σε δεδομένα που είναι αποθηκευμένα σε άλλες θέσεις αρχείων. Αυτές οι θέσεις αρχείων μπορεί να βρίσκονται εντός του ίδιου χώρου εργασίας ή σε διαφορετικούς χώρους εργασίας, εντός του OneLake ή εκτός του OneLake, όπως ADLS, S3 ή Dataverse. Ανεξάρτητα από τη θέση, οι συντομεύσεις κάνουν τα αρχεία και τους φακέλους να μοιάζουν όπως ότι τα έχετε αποθηκεύσει τοπικά.

Οι συντομεύσεις επιτρέπουν στον οργανισμό σας να μοιράζεται δεδομένα μεταξύ χρηστών και εφαρμογών χωρίς να χρειάζεται να μετακινεί και να αντιγράφει άσκοπα πληροφορίες. Όταν οι ομάδες εργάζονται ανεξάρτητα σε ξεχωριστούς χώρους εργασίας, οι συντομεύσεις σάς επιτρέπουν να συνδυάσετε δεδομένα σε διαφορετικούς επιχειρηματικούς ομίλους και τομείς σε ένα εικονικό προϊόν δεδομένων για να ικανοποιήσετε τις συγκεκριμένες ανάγκες ενός χρήστη.

Διάγραμμα που δείχνει πώς οι συντομεύσεις συνδέουν δεδομένα μεταξύ χώρων εργασίας και στοιχείων.

Για περισσότερες πληροφορίες σχετικά με τον τρόπο χρήσης συντομεύσεων, ανατρέξτε στο θέμα Συντομεύσεις OneLake.

Σύνδεση δεδομένων σε πολλαπλές μηχανές ανάλυσης

Τα δεδομένα συχνά βελτιστοποιούνται για μία μόνο μηχανή, γεγονός που καθιστά δύσκολη την επαναχρησιμοποίηση των ίδιων δεδομένων για πολλές εφαρμογές. Με το Fabric, οι διαφορετικοί μηχανισμοί ανάλυσης (T-SQL, Apache Spark, Analysis Services και άλλοι) αποθηκεύουν δεδομένα στην ανοιχτή μορφή Delta Parquet για να σας επιτρέψουν να χρησιμοποιήσετε τα ίδια δεδομένα σε πολλούς μηχανισμούς.

Δεν χρειάζεται να αντιγράψετε δεδομένα μόνο για να τα χρησιμοποιήσετε με άλλη μηχανή ή να αισθάνεστε κολλημένοι με τη χρήση μιας συγκεκριμένης μηχανής, επειδή εκεί βρίσκονται τα δεδομένα σας. Για παράδειγμα, φανταστείτε μια ομάδα μηχανικών SQL να δημιουργεί μια πλήρως συναλλακτική αποθήκη δεδομένων. Μπορούν να χρησιμοποιήσουν τον μηχανισμό T-SQL και όλη την ισχύ του T-SQL για να δημιουργήσουν πίνακες, να μετασχηματίσουν δεδομένα και να φορτώσουν τα δεδομένα σε πίνακες. Εάν ένας επιστήμονας δεδομένων θέλει να χρησιμοποιήσει αυτά τα δεδομένα, δεν χρειάζεται να περάσει από ένα ειδικό πρόγραμμα οδήγησης Spark/SQL. Το OneLake αποθηκεύει όλα τα δεδομένα σε μορφή Delta Parquet. Ο επιστήμονας δεδομένων μπορεί να χρησιμοποιήσει την πλήρη ισχύ της μηχανής Spark και των βιβλιοθηκών ανοιχτού κώδικα απευθείας πάνω από τα δεδομένα.

Οι χρήστες επιχείρησης μπορούν να δημιουργήσουν αναφορές Power BI απευθείας πάνω από το OneLake χρησιμοποιώντας τη λειτουργία Direct Lake στον μηχανισμό των Υπηρεσιών ανάλυσης. Ο μηχανισμός των Υπηρεσιών ανάλυσης υποστηρίζει σημασιολογικά μοντέλα Power BI και πάντα προσέφερε δύο τρόπους πρόσβασης σε δεδομένα: εισαγωγή και άμεσο ερώτημα. Αυτή η τρίτη λειτουργία, η λειτουργία Direct Lake, παρέχει στους χρήστες όλη την ταχύτητα εισαγωγής χωρίς να χρειάζεται να αντιγράψουν τα δεδομένα, συνδυάζοντας την καλύτερη εισαγωγή και άμεσο ερώτημα. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Direct Lake.

Παράδειγμα διαγράμματος που εμφανίζει τη φόρτωση δεδομένων με χρήση του Spark, την υποβολή ερωτημάτων με χρήση T-SQL και την προβολή των δεδομένων σε μια αναφορά Power BI.

Επόμενα βήματα

Είστε έτοιμοι να ξεκινήσετε να χρησιμοποιείτε το OneLake; Δείτε πώς μπορείτε να ξεκινήσετε: