Σημείωμα
Η πρόσβαση σε αυτήν τη σελίδα απαιτεί εξουσιοδότηση. Μπορείτε να δοκιμάσετε να εισέλθετε ή να αλλάξετε καταλόγους.
Η πρόσβαση σε αυτήν τη σελίδα απαιτεί εξουσιοδότηση. Μπορείτε να δοκιμάσετε να αλλάξετε καταλόγους.
Ισχύει για:✅ Warehouse στο Microsoft Fabric
Αυτή η εκμάθηση σάς καθοδηγεί στη ρύθμιση του dbt και την ανάπτυξη του πρώτου σας έργου σε μια Αποθήκη Fabric.
Εισαγωγή
Το πλαίσιο ανοιχτού κώδικα dbt (Εργαλείο δόμησης δεδομένων) απλοποιεί τον μετασχηματισμό δεδομένων και τη μηχανική ανάλυσης. Εστιάζει σε μετασχηματισμούς που βασίζονται σε SQL εντός του επιπέδου ανάλυσης, αντιμετωπίζοντας το SQL ως κώδικα. Το dbt υποστηρίζει τον έλεγχο εκδόσεων, τη διαμόρφωση, τις δοκιμές και την τεκμηρίωση.
Ο προσαρμογέας βάσης δεδομένων για το Microsoft Fabric μπορεί να χρησιμοποιηθεί για τη δημιουργία έργων dbt, τα οποία μπορούν έπειτα να αναπτυχθούν σε μια Αποθήκη δεδομένων Fabric.
Μπορείτε, για παράδειγμα, να αλλάξετε την πλατφόρμα προορισμού για το έργο dbt αλλάζοντας απλώς τον προσαρμογέα. Ένα έργο που έχει δημιουργηθεί για τον αποκλειστικό χώρο συγκέντρωσης SQL Azure Synapse μπορεί να αναβαθμιστεί σε λίγα δευτερόλεπτα σε Μια Αποθήκη δεδομένων Fabric.
Προαπαιτούμενα για τον προσαρμογέα βάσης δεδομένων για το Microsoft Fabric
Ακολουθήστε αυτήν τη λίστα για να εγκαταστήσετε και να ρυθμίσετε τις προϋποθέσεις dbt:
Τελευταία έκδοση του προσαρμογέα dbt-fabric από το αποθετήριο δεδομένων PyPI (Python Package Index) χρησιμοποιώντας το
pip install dbt-fabric.pip install dbt-fabricΣημείωμα
Αλλάζοντας
pip install dbt-fabricτο σεpip install dbt-synapseκαι χρησιμοποιώντας τις ακόλουθες οδηγίες, μπορείτε να εγκαταστήσετε τον προσαρμογέα βάσης δεδομένων για τον χώρο συγκέντρωσης ΑΠΟΚΛΕΙΣΤΙΚΏΝ SQL Synapse.Βεβαιωθείτε ότι έχετε επαληθεύσει ότι το dbt-fabric και οι εξαρτήσεις του εγκαθίστανται χρησιμοποιώντας την
pip listεντολή:pip listΜια μεγάλη λίστα με τα πακέτα και τις τρέχουσες εκδόσεις πρέπει να επιστραφεί από αυτήν την εντολή.
Εάν δεν έχετε ήδη μία, δημιουργήστε μια Αποθήκη. Μπορείτε να χρησιμοποιήσετε τους δοκιμαστικούς εκχωρημένους πόρους για αυτήν την άσκηση: εγγραφείτε για τη δωρεάν δοκιμαστική έκδοση του Microsoft Fabric, δημιουργήστε έναν χώρο εργασίας και, στη συνέχεια , δημιουργήστε μια αποθήκη.
Γρήγορα αποτελέσματα με τον προσαρμογέα dbt-fabric
Αυτή η εκμάθηση χρησιμοποιεί το Visual Studio Code, αλλά μπορείτε να χρησιμοποιήσετε το εργαλείο που προτιμάτε της επιλογής σας.
Κλωνοποιήστε το έργο jaffle_shop επίδειξης στον υπολογιστή σας.
- Μπορείτε να κλωνοποιήσετε ένα αποθετήριο με το ενσωματωμένο στοιχείο ελέγχου προέλευσης του Visual Studio Code.
- Εναλλακτικά, για παράδειγμα, μπορείτε να χρησιμοποιήσετε την
git cloneεντολή:
git clone https://github.com/dbt-labs/jaffle-shop-classic.gitΑνοίξτε τον
jaffle_shopφάκελο έργου στο Visual Studio Code.
Μπορείτε να παραλείψετε την εγγραφή, εάν έχετε δημιουργήσει ήδη μια Αποθήκη.
Δημιουργήστε ένα
profiles.ymlαρχείο. Προσθέστε την παρακάτω ρύθμιση παραμέτρων στοprofiles.yml. Αυτό το αρχείο ρυθμίζει τις παραμέτρους της σύνδεσης στην αποθήκη σας στο Microsoft Fabric χρησιμοποιώντας τον προσαρμογέα dbt-fabric.config: partial_parse: true jaffle_shop: target: fabric-dev outputs: fabric-dev: authentication: CLI database: <put the database name here> driver: ODBC Driver 18 for SQL Server host: <enter your SQL analytics endpoint here> schema: dbo threads: 4 type: fabricΣημείωμα
Αλλάξτε την
typeαπόfabricσε , γιαsynapseνα αλλάξετε τον προσαρμογέα βάσης δεδομένων σε Azure Synapse Analytics, εάν θέλετε. Η πλατφόρμα δεδομένων οποιουδήποτε υπάρχοντος έργου dbt μπορεί να ενημερωθεί αλλάζοντας τον προσαρμογέα βάσης δεδομένων. Για περισσότερες πληροφορίες, ανατρέξτε στη λίστα dbt των υποστηριζόμενων πλατφορμών δεδομένων.Πραγματοποιήστε έλεγχο ταυτότητας στο Azure στο τερματικό Visual Studio Code.
- Εκτελέστε
az loginτο στο τερματικό Visual Studio Code, εάν χρησιμοποιείτε έλεγχο ταυτότητας Azure CLI. - Για τον έλεγχο ταυτότητας κύριας υπηρεσίας ή άλλου αναγνωριστικού Microsoft Entra (πρώην Azure Active Directory) στο Microsoft Fabric, ανατρέξτε στο θέμα ρύθμιση dbt (εργαλείο δόμησης δεδομένων) και ρυθμίσεις παραμέτρων πόρων dbt. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Έλεγχος ταυτότητας Microsoft Entra ως εναλλακτική λύση στον έλεγχο ταυτότητας SQL στο Microsoft Fabric.
- Εκτελέστε
Τώρα είστε έτοιμοι να ελέγξετε τη συνδεσιμότητα. Για να ελέγξετε τη συνδεσιμότητα στην αποθήκη σας, εκτελέστε
dbt debugτο στο τερματικό Visual Studio Code.dbt debugΌλοι οι έλεγχοι μεταβιβάζονται, το οποίο σημαίνει ότι μπορείτε να συνδέσετε την αποθήκη σας χρησιμοποιώντας προσαρμογέα dbt-fabric από το
jaffle_shopέργο dbt.Τώρα είναι ώρα να ελέγξετε εάν ο προσαρμογέας λειτουργεί ή όχι. Πρώτα, εκτελέστε
dbt seedτην για να εισαγάγετε ένα δείγμα δεδομένων στην αποθήκη.Εκτελέστε
dbt runτο για να εκτελέσετε τα μοντέλα που ορίζονται στο έργο επίδειξης dbt.dbt runΕκτελέστε
dbt testτο για να επικυρώσετε δεδομένα σε σχέση με ορισμένες δοκιμές.dbt test
Έχετε αναπτύξει τώρα ένα έργο dbt στην Αποθήκη δεδομένων Fabric.
Μετακίνηση μεταξύ διαφορετικών αποθηκών
Είναι μια απλή μετακίνηση του έργου dbt μεταξύ διαφορετικών αποθηκών. Ένα έργο dbt σε οποιαδήποτε υποστηριζόμενη αποθήκη μπορεί να μετεγκατασταθεί γρήγορα με αυτή τη διαδικασία τριών βημάτων:
Εγκαταστήστε τον νέο προσαρμογέα. Για περισσότερες πληροφορίες και πλήρεις οδηγίες εγκατάστασης, ανατρέξτε στο θέμα Προσαρμογείς dbt.
Ενημερώστε την
typeιδιότητα στοprofiles.ymlαρχείο.Δημιουργία του έργου.
dbt στο Fabric Data Factory
Όταν ενσωματώνεται με το Apache Airflow, ένα δημοφιλές σύστημα διαχείρισης ροής εργασιών, το dbt γίνεται ένα ισχυρό εργαλείο για την ενορχήστρωση μετασχηματισμών δεδομένων. Οι δυνατότητες προγραμματισμού και διαχείρισης εργασιών της Airflow επιτρέπουν στις ομάδες δεδομένων να αυτοματοποιούν τις εκτελέσεις βάσης δεδομένων. Εξασφαλίζει τακτικές ενημερώσεις δεδομένων και διατηρεί μια συνεπή ροή δεδομένων υψηλής ποιότητας για ανάλυση και αναφορά. Αυτή η συνδυασμένη προσέγγιση, χρησιμοποιώντας την τεχνογνωσία μετασχηματισμού της dbt με τη διαχείριση ροής εργασιών της Airflow, παρέχει αποτελεσματικούς και ισχυρούς αγωγούς, οδηγώντας τελικά σε ταχύτερες και πιο διορατικές αποφάσεις που βασίζονται σε δεδομένα.
Το Apache Airflow είναι μια πλατφόρμα ανοιχτού κώδικα που χρησιμοποιείται για τη δημιουργία, τον προγραμματισμό και την παρακολούθηση σύνθετων ροών εργασιών δεδομένων. Σας επιτρέπει να ορίσετε ένα σύνολο εργασιών, που ονομάζονται τελεστές, που μπορούν να συνδυαστούν σε κατευθυνόμενα άκυκλα γραφήματα (DAG) για να αναπαραστήσουν αγωγούς.
Για περισσότερες πληροφορίες σχετικά με τη λειτουργία της βάσης δεδομένων με την αποθήκη σας, ανατρέξτε στο θέμα Μετασχηματισμός δεδομένων με χρήση του Data Factory στο Microsoft Fabric.
Παράγοντες που πρέπει να ληφθούν υπόψη
Σημαντικά πράγματα που πρέπει να λάβετε υπόψη κατά τη χρήση του προσαρμογέα dbt-fabric:
Εξετάστε τους τρέχοντες περιορισμούς στην αποθήκη δεδομένων Microsoft Fabric.
Το Fabric υποστηρίζει έλεγχο ταυτότητας Microsoft Entra ID (πρώην Azure Active Directory) για οντότητες χρηστών, ταυτότητες χρήστη και οντότητες υπηρεσίας. Η προτεινόμενη λειτουργία ελέγχου ταυτότητας για αλληλεπιδραστική εργασία σε αποθήκη είναι CLI (διασυνδέσεις γραμμής εντολών) και χρήση αρχών υπηρεσίας για αυτοματοποίηση.
Εξετάστε τις εντολές T-SQL (Transact-SQL) που δεν υποστηρίζονται στην Αποθήκη δεδομένων Fabric.
Ορισμένες εντολές T-SQL υποστηρίζονται από τον προσαρμογέα dbt-fabric χρησιμοποιώντας
Create Table as Select(CTAS),DROPκαιCREATEεντολές, όπωςALTER TABLE ADD/ALTER/DROP COLUMN,MERGE,TRUNCATEsp_rename.Εξετάστε τους Μη υποστηριζόμενους τύπους δεδομένων για να μάθετε σχετικά με τους υποστηριζόμενους και μη υποστηριζόμενους τύπους δεδομένων.
Μπορείτε να συνδεθείτε ζητήματα στον προσαρμογέα dbt-fabric στο GitHub με την επίσκεψη Ζητήματα · microsoft/dbt-fabric · GitHub.