Κοινοποίηση μέσω


Χρησιμοποιήστε τη βάση δεδομένων SQL σε αντίστροφο ETL

Ισχύει για:Βάση δεδομένων SQL στο Microsoft Fabric

Αυτό το άρθρο περιγράφει τον τρόπο χρήσης της βάσης δεδομένων SQL στο Fabric ως αντίστροφου προορισμού ETL σε μια περιοχή δεδομένων που βασίζεται σε Fabric. Παρέχει αρχιτεκτονική καθοδήγηση, λειτουργικά μοτίβα και ζητήματα υλοποίησης για τη μετακίνηση επιμελημένων δεδομένων από αναλυτικές προελεύσεις (όπως το Microsoft Fabric Data Warehouse ή το Fabric Lakehouse) στη βάση δεδομένων SQL στο Fabric για λειτουργική χρήση από εφαρμογές, API και εμπειρίες σε πραγματικό χρόνο.

Τι είναι το αντίστροφο ETL στο ύφασμα;

Πολλοί πελάτες έχουν επενδύσει σημαντικό χρόνο και προσπάθεια στη δημιουργία διαδικασιών εξαγωγής, μετασχηματισμού, φόρτωσης (ETL) για να μετατρέψουν τα ακατέργαστα λειτουργικά δεδομένα σε πιο εκλεπτυσμένα αναλυτικά δεδομένα που μπορούν να χρησιμοποιηθούν για επιχειρηματικές αναφορές. Το τελικό αποτέλεσμα μιας διαδικασίας ETL είναι συνήθως ένας χώρος αποθήκευσης ανάλυσης, όπως μια αποθήκη ή μια λίμνη, στον οποίο έχει πρόσβαση ένα επίπεδο αναφοράς όπως το Power BI. Αυτή η αρχιτεκτονική εξυπηρετεί καλά τους επιχειρηματικούς χρήστες, αλλά οι αναφορές είναι σχετικά στατικές και οι πληροφορίες μπορούν να προκύψουν μόνο με ανθρώπινη παρέμβαση. Χρησιμοποιώντας το αντίστροφο ETL, μπορείτε να τροφοδοτήσετε τα μετασχηματισμένα δεδομένα πίσω σε λειτουργικά συστήματα, έτσι ώστε οι εφαρμογές και οι πράκτορες να μπορούν να αποκτήσουν πληροφορίες από αυτά τα αναλυμένα δεδομένα σε πραγματικό χρόνο. Το Reverse ETL ωθεί δεδομένα από γεγονότα και διαστάσεις σε αναλυτικά καταστήματα σε ένα επίπεδο εξυπηρέτησης όπου είναι δυνατή η πρόσβαση σε αυτά μέσω τελικών σημείων όπως το GraphQL ή απευθείας μέσω ερωτημάτων TDS (Tabular Data Stream).

Ενώ μπορείτε να συνδέσετε λειτουργικές εφαρμογές απευθείας σε μια αποθήκη ή μια λίμνη, αυτοί οι χώροι αποθήκευσης δεδομένων έχουν σχεδιαστεί για αναλυτικούς φόρτους εργασίας. Οι λειτουργικοί χώροι αποθήκευσης δεδομένων, όπως η βάση δεδομένων SQL στο Fabric, έχουν σχεδιαστεί για να υποστηρίζουν ερωτήματα συναλλαγών και παρέχουν καλύτερες επιδόσεις και επεκτασιμότητα για λειτουργικούς φόρτους εργασίας. Οι λειτουργικές βάσεις δεδομένων σάς δίνουν επίσης την επιλογή να εμπλουτίσετε περαιτέρω τα δεδομένα με διανυσματικές ενσωματώσεις και πρόσθετα μεταδεδομένα για να διευκολύνετε τη διανυσματική και υβριδική αναζήτηση καθώς και την ανάκτηση-επαυξημένη παραγωγή (RAG).

  • Σε αυτό το μοτίβο, η αποθήκη ή το lakehouse παραμένει το αναλυτικό σύστημα καταγραφής.
  • Η βάση δεδομένων SQL στο Fabric χρησιμεύει ως λειτουργικός χώρος αποθήκευσης που προσφέρει χαμηλό λανθάνοντα χρόνο, εκλεπτυσμένη ευρετηρίαση, αυστηρούς περιορισμούς δεδομένων και σχέσεων και τις SLA που αναμένονται από τις ομάδες εφαρμογών.

Κοινοί στόχοι αντίστροφου ETL

Οι κοινοί αντίστροφοι στόχοι ETL αντιπροσωπεύουν συνήθως επιμελημένες φέτες δεδομένων υψηλής αξίας που μπορούν να καταναλώσουν τα λειτουργικά συστήματα με ελάχιστο μετασχηματισμό. Αυτοί οι στόχοι έχουν σχεδιαστεί για να παρέχουν πρόσβαση χαμηλής καθυστέρησης σε αξιόπιστα δεδομένα, διατηρώντας παράλληλα την επιχειρηματική λογική που εφαρμόζεται στο αναλυτικό επίπεδο. Ενδεικτικά αναφέρονται:

  • Δεδομένα πελατών και χρηστών (για παράδειγμα, μετρήσεις δέσμευσης, όπως δραστηριότητα περιόδου σύνδεσης, χρήση λειτουργιών και αλληλεπιδράσεις)
  • Δεδομένα πωλήσεων και μάρκετινγκ (για παράδειγμα, μετρήσεις βαθμολόγησης, όπως τάση για αγορά, βαθμολογίες αφοσίωσης, πιθανότητα μετατροπής)
  • Λειτουργικά και συναλλακτικά δεδομένα (για παράδειγμα, δεδομένα παραγγελιών και αποθέματος, όπως επίπεδα αποθεμάτων, κατάσταση παραγγελιών και χρονοδιαγράμματα παράδοσης)
  • AI/ML Παράγωγα δεδομένα (για παράδειγμα, εξατομικευμένες προτάσεις προϊόντων, προγνωστικές βαθμολογίες όπως κίνδυνος ανατροπής ή τάση ανοδικών πωλήσεων ή ανάλυση συναισθήματος)

Μηχανισμοί μετακίνησης δεδομένων

Η διαδικασία ξεκινά με τον καθορισμό των δεδομένων προέλευσης, τον ορισμό του προορισμού και, στη συνέχεια, την επιλογή ενός μηχανισμού μετακίνησης δεδομένων. Επιλέξτε έναν ή περισσότερους από τους παρακάτω μηχανισμούς για να μετακινήσετε δεδομένα από τον χώρο αποθήκευσης αναλυτικών στοιχείων στη βάση δεδομένων SQL στο Fabric.

Φιλοδώρημα

Κατά γενικό κανόνα, χρησιμοποιήστε:

  • Αγωγοί για απλή αντιγραφή και προγραμματισμένες φορτώσεις.
  • Ροές δεδομένων Gen2 για μετασχηματισμούς χαμηλών απαιτήσεων κώδικα.
  • Spark για πολύπλοκη και μεγάλης κλίμακας επεξεργασία (συμπεριλαμβανομένης της μηχανικής μάθησης).
  • T-SQL μεταξύ στοιχείων όπου είναι διαθέσιμη για τη διατήρηση των λειτουργιών με επίκεντρο την SQL, για παράδειγμα, σύνδεση ενός πίνακα στη βάση δεδομένων SQL με έναν πίνακα σε μια αποθήκη ή τελικό σημείο ανάλυσης SQL.
Μηχανισμός Χρησιμοποιήστε όταν Δυνάμεις Θεωρήσεις
διοχετεύσεων δεδομένων Fabric Χρειάζεστε διαχειριζόμενα, επαναλαμβανόμενα φορτία (παρτίδα ή μικρο-παρτίδα) λειτουργιών αντιγραφής δεδομένων Ενσωμάτωση πρώτης κατηγορίας. υποστηρίζει υδατογραφήσεις και αποθηκευμένες διαδικασίες Ταυτοχρονισμός; κλίμακα βάσης δεδομένων SQL κατά τη διάρκεια φορτίων
Ροή δεδομένων Gen2 Χρειάζεστε μετασχηματισμούς δεδομένων χαμηλών απαιτήσεων κώδικα και βελτιωμένη λογική διεργασιών Φιλικό προς τις επιχειρήσεις; υποστηρίζει τη διαμόρφωση και τον καθαρισμό της στήλης Χαμηλότερη απόδοση για μεγάλους όγκους. Κατάτμηση σχεδίου
Spark (σημειωματάρια/εργασίες) Χρειάζεστε σύνθετους μετασχηματισμούς βασισμένους σε κώδικα και αναμόρφωση μεγάλης κλίμακας Πλήρης έλεγχος κώδικα. αποτελεσματικές αναγνώσεις Delta. Υποστήριξη εγγραφής JDBC Έλεγχος ταυτότητας και ομαδοποίηση. Αποφύγετε τις μεγάλες συναλλαγές
Ερωτήματα T-SQL μεταξύ στοιχείων Χρειάζεστε μετακίνηση SQL στη βάση δεδομένων μεταξύ στοιχείων Fabric Ελάχιστες υδραυλικές εγκαταστάσεις. SQL-εγγενής; Εύκολο στον προγραμματισμό

Αρχιτεκτονική αναφοράς: αντιστροφή ETL σε βάση δεδομένων SQL στο Fabric

Η αρχιτεκτονική αναφοράς για το αντίστροφο ETL στο Fabric συγκεντρώνει τα βασικά δομικά στοιχεία που απαιτούνται για τη λειτουργικότητα των επιμελημένων αναλυτικών δεδομένων. Δείχνει πώς τα δεδομένα ρέουν από αξιόπιστες αναλυτικές πηγές μέσω επιπέδων μετασχηματισμού σε μια δομημένη βάση δεδομένων SQL. Η επιχειρησιακή βάση δεδομένων χρησιμεύει ως διεπαφή για τα κατάντη συστήματα. Αυτό το μοτίβο διασφαλίζει ότι οι εφαρμογές, τα API και τα εργαλεία αναφοράς μπορούν να έχουν πρόσβαση σε δεδομένα χαμηλής καθυστέρησης και υψηλής ποιότητας χωρίς να διακυβεύεται η ακεραιότητα του αναλυτικού συστήματος καταγραφής.

Τα βασικά στοιχεία αυτής της ροής περιλαμβάνουν:

  • Προέλευση: Επιμελημένα σύνολα δεδομένων από μια αποθήκη δεδομένων Fabric ή Lakehouse (Delta).
  • Μετασχηματισμοί: Αντίστροφοι μετασχηματισμοί ETL που εφαρμόζονται με χρήση διοχετεύσεων, ροής δεδομένων Gen2, Spark ή T-SQL μεταξύ στοιχείων.
  • Προορισμός: Βάση δεδομένων SQL στο Fabric με καθορισμένα σχήματα προσγείωσης, ιστορικού (προαιρετικά), καραντίνας και προβολής.
  • Καταναλωτές: Εφαρμογές μέσω GraphQL ή TDS, API και Power BI για πίνακες εργαλείων και αναφορές σε πραγματικό χρόνο.

Διάγραμμα μιας αντίστροφης αρχιτεκτονικής αναφοράς ETL που περιλαμβάνει βάση δεδομένων SQL στο Fabric.

Στοιχεία

Τα ακόλουθα στοιχεία εμπλέκονται στη γενική ροή για τη χρήση της βάσης δεδομένων SQL στο Fabric ως αντίστροφου προορισμού ETL.

Σχήματα σερβιρίσματος και προσγείωσης

  • Αντιστοιχίστε τα δεδομένα προέλευσης σε κατάλληλα σχήματα προορισμού στη βάση δεδομένων SQL στο Fabric.
  • Προαιρετικά διατηρήστε ένα history σχήμα για δυνατότητα ελέγχου.
  • Χρησιμοποιήστε ένα quarantine σχήμα για απορρίψεις (ζητήματα ποιότητας δεδομένων).
  • Ορίστε ένα serving σχήμα για κατάντη κατανάλωση με κατάλληλους περιορισμούς και ευρετηρίαση.

Ενορχήστρωση

  • Προγραμματίστε μεταφορές στο Fabric χρησιμοποιώντας διοχετεύσεις, ροές δεδομένων ή εργασίες Spark.
  • Χρησιμοποιήστε τον ενσωματωμένο προγραμματισμό για να διαμορφώσετε τον ρυθμό, την ώρα έναρξης και τη ζώνη ώρας.
  • Προγραμματίστε σημειωματάρια Spark μέσω της πύλης ή του API Fabric.
  • Παρακολουθήστε τις εκτελέσεις από άκρο σε άκρο στον διανομέα παρακολούθησης Fabric.

Κατανάλωση

  • Εκθέστε δεδομένα μέσω τελικών σημείων GraphQL ή T-SQL μέσω TDS χρησιμοποιώντας βιβλιοθήκες πελατών όπως το ADO.NET (και άλλες).
  • Δημιουργήστε πίνακες εργαλείων και απεικονίσεις Power BI απευθείας μέσω βάσης δεδομένων SQL στο Fabric.

Διαχείριση και ασφάλεια

  • Χρησιμοποιήστε το Microsoft Entra ID για έλεγχο ταυτότητας και εξουσιοδότηση.
  • Συνδυάστε δικαιώματα ρόλων χώρου εργασίας Fabric και δικαιώματα SQL για λεπτομερή έλεγχο.
  • Προαιρετικά, διαμορφώστε τα κλειδιά που διαχειρίζεται ο πελάτης για κρυπτογράφηση αδρανών δεδομένων.
  • Ελέγξτε την πρόσβαση και ασφαλίστε τα δεδομένα κατά τη μεταφορά χρησιμοποιώντας το Private Link.

Εξυπηρέτηση εφαρμογών

Αφού επιμεληθείτε και ανανεώσετε δεδομένα στη βάση δεδομένων SQL, εστιάστε στην παροχή γρήγορης και αξιόπιστης πρόσβασης για λειτουργικούς καταναλωτές. Σε αυτό το πλαίσιο, η εξυπηρέτηση εφαρμογών σημαίνει την έκθεση αξιόπιστων συνόλων δεδομένων μέσω διεπαφών χαμηλής καθυστέρησης που ευθυγραμμίζονται με τα σύγχρονα μοτίβα εφαρμογών.

Μετά την προσγείωση και την ανανέωση των δεδομένων στη βάση δεδομένων SQL στο Fabric:

  • Για την εξυπηρέτηση λειτουργικών φόρτων εργασίας, εκθέστε δεδομένα μέσω τελικών σημείων GraphQL ή του πρωτοκόλλου TDS , που θα καταναλωθούν μέσω ADO.NET και άλλων βιβλιοθηκών πελατών. Για παράδειγμα, παρέχετε πληροφορίες προϊόντος, αλυσίδα εφοδιασμού ή περιπτώσεις χρήσης εξυπηρέτησης πελατών.
  • Δημιουργήστε ζεύξη του συνόλου δεδομένων με το Power BI για την παροχή πινάκων εργαλείων και αναλύσεων αυτοεξυπηρέτησης σε πραγματικό χρόνο.

Ειδικές εκτιμήσεις για το ύφασμα

Η βάση δεδομένων SQL στο Fabric χρησιμοποιεί τον ίδιο μηχανισμό βάσης δεδομένων SQL με τη βάση δεδομένων SQL Azure και ελέγχεται, ασφαλίζεται, χρεώνεται και λειτουργεί μέσω της πύλης Fabric. Προσφέρει επίσης ενσωματωμένο κατοπτρισμό σε αρχεία Delta/Parquet που είναι αποθηκευμένα στο Microsoft OneLake, στα οποία έχετε πρόσβαση μέσω ενός τελικού σημείου ανάλυσης SQL. Δεδομένου ότι βρίσκεται στο περιβάλλον Microsoft Fabric, υπάρχουν μερικά ζητήματα που πρέπει να λάβετε υπόψη κατά τη δημιουργία του σχεδίου σας:

  • Ισοτιμία δυνατοτήτων: Η βάση δεδομένων SQL στο Fabric συγκλίνει με τη βάση δεδομένων SQL Azure. Επικυρώστε συγκεκριμένες λειτουργίες που χρειάζεστε για να διασφαλίσετε ότι είναι κατάλληλες για τον σκοπό και παρακολουθήστε τις ενημερώσεις του οδικού χάρτη.
  • Μοντέλο ασφαλείας: Η βάση δεδομένων SQL στο Fabric χρησιμοποιεί μόνο έλεγχο ταυτότητας Microsoft Entra ID . Σχεδιάστε ταυτότητες για εργασίες διοχέτευσης, ροών δεδομένων και Spark ανάλογα.
  • Αναπαραγωγή: Η βάση δεδομένων SQL στο Fabric αναπαράγει αυτόματα δεδομένα μόνο για ανάγνωση στο OneLake. Αυτός ο συγχρονισμός είναι χρήσιμος για τις ανάγκες αναφοράς και ανάλυσης, ενώ η βάση δεδομένων παραμένει διαθέσιμη για λειτουργικούς φόρτους εργασίας ανάγνωσης/εγγραφής.