Στοιχείο ελέγχου προέλευσης και ανάπτυξη σημειωματάριου

Αυτό το άρθρο εξηγεί πώς μπορείτε να χρησιμοποιήσετε διοχετεύσεις ενοποίησης και ανάπτυξης Git με σημειωματάρια στο Microsoft Fabric. Μαθαίνετε πώς να συνδέετε ένα χώρο αποθήκευσης, να διαχειρίζεστε τον πηγαίο κώδικα του σημειωματαρίου και να αναπτύσσετε σημειωματάρια σε περιβάλλοντα.

Προτού ξεκινήσετε

  • Συνδέστε τον χώρο εργασίας σας στο Git πριν ολοκληρώσετε τα βήματα ελέγχου προέλευσης σημειωματαρίου. Για οδηγίες ρύθμισης, ανατρέξτε στο θέμα Γρήγορα αποτελέσματα με την ενοποίηση του Git.
  • Δημιουργήστε κανόνες ανάπτυξης σημειωματαρίου στο στάδιο προορισμού (για παράδειγμα, Δοκιμή ή Παραγωγή) και όχι στην Ανάπτυξη.
  • Για να δημιουργήσετε κανόνες ανάπτυξης, πρέπει να είστε ο κάτοχος του στοιχείου.

Ενοποίηση Git σημειωματάριου

Τα σημειωματάρια Fabric υποστηρίζουν την ενοποίηση Git με το Azure DevOps για έλεγχο προέλευσης. Μπορείτε να εκδώσετε αλλαγές σημειωματαρίου, να συνεργαστείτε χρησιμοποιώντας κλάδους και να διαχειριστείτε ενημερώσεις κύκλου ζωής σημειωματαρίου απευθείας στο Fabric.

Όταν δεσμεύετε ένα σημειωματάριο μαζί με τις συνημμένες εξαρτήσεις του (για παράδειγμα, περιβάλλοντα), ο συγχρονισμός με έναν άλλο χώρο εργασίας διατηρεί αυτές τις συνδέσεις. Το Fabric συνδέει αυτόματα το σημειωματάριο με τους αντίστοιχους πόρους στο νέο χώρο εργασίας.

Για να υποστηρίξει αυτήν τη συμπεριφορά, το Fabric αποθηκεύει λογικά αναγνωριστικά για συνημμένους πόρους σε μετα-δεδομένα σημειωματαρίου. Ως αποτέλεσμα, οι διαφορές Git μπορούν να εμφανίζουν ενημερώσεις μεταδεδομένων από φυσικά αναγνωριστικά σε λογικά αναγνωριστικά.

Σημείωμα

Οι ενημερώσεις μετα-δεδομένων που σχετίζονται με τα λογικά αναγνωριστικά και την αυτόματη δέσμευση μπορούν να εμφανίζονται στις προβολές διαφορών Git ακόμα και όταν ο κώδικας σημειωματαρίου δεν αλλάζει.

Ρύθμιση σύνδεσης

Από τις ρυθμίσεις χώρου εργασίας, ρυθμίστε μια σύνδεση με το αποθετήριο δεδομένων σας για να δεσμεύσετε και να συγχρονίσετε τις αλλαγές. Για οδηγίες ρύθμισης, ανατρέξτε στο θέμα Γρήγορα αποτελέσματα με την ενοποίηση του Git. Μετά τη σύνδεση, τα στοιχεία σας, συμπεριλαμβανομένων των σημειωματαρίων, εμφανίζονται στον πίνακα ελέγχου "Προέλευση ".

Στιγμιότυπο οθόνης του πίνακα ελέγχου προέλευσης χώρου εργασίας.

Αφού δεσμεύσουμε παρουσίες σημειωματάριου στο αποθετήριο Git, μπορούμε να δούμε τη δομή του φακέλου σημειωματάριου στο αποθετήριο.

Τώρα μπορείτε να εκτελέσετε λειτουργίες Git, όπως Δημιουργία αιτήματος έλξης.

Αναπαράσταση σημειωματάριου στο Git

Το παρακάτω κείμενο δείχνει τη δομή αρχείου για ένα στοιχείο σημειωματάριου στο αποθετήριο Git:

.
├── Notebook_1.Notebook/
│   ├── Resources/ (Optional)
│   │   └── builtin/
│   │       ├── large_dataset.parquet
│   │       └── model_output.parquet
│   ├── .platform
│   ├── fs-settings.json (Optional)
│   ├── notebook-content.py
│   └── notebook-settings.json (Optional)
└── Readme.md
.
├── Notebook_2.Notebook/
│   ├── Resources/ (Optional)
│   │   └── builtin/
│   │       ├── large_dataset.parquet
│   │       └── model_output.parquet
│   ├── .platform
│   ├── fs-settings.json (Optional)
│   ├── notebook-content.sql
│   └── notebook-settings.json (Optional)
└── Readme.md

Όταν δεσμεύετε ένα στοιχείο σημειωματαρίου, το Fabric το αποθηκεύει ως αρχεία προέλευσης αντί για ένα τυπικό .ipynb αρχείο. Για παράδειγμα, ένα σημειωματάριο PySpark αποθηκεύεται ως notebook-content.py. Αυτή η μορφή είναι πιο εύκολο να αναθεωρηθεί στις διαφορές Git.

Το αρχείο προέλευσης διατηρεί τα μετα-δεδομένα σημειωματαρίου (συμπεριλαμβανομένου του προεπιλεγμένου lakehouse και του συνδεδεμένου περιβάλλοντος), τα κελιά σήμανσης και τα κελιά κώδικα ως ξεχωριστές ενότητες. Το Fabric χρησιμοποιεί αυτήν τη δομή για να ανακατασκευάσει το σημειωματάριο όταν συγχρονίζετε ξανά σε έναν χώρο εργασίας.

Η έξοδος κελιού σημειωματάριου δεν περιλαμβάνεται κατά τον συγχρονισμό με το Git.

Το παρακάτω στιγμιότυπο οθόνης δείχνει τη μορφή προέλευσης στο αποθετήριο Git:

Στιγμιότυπο οθόνης της μορφής περιεχομένου Git repo σημειωματάριου.

Σημείωμα

Διατηρήστε τα σημειωματάρια και τα εξαρτώμενα περιβάλλοντά τους στον ίδιο χώρο εργασίας και εκδώστε τα στοιχεία σημειωματαρίου και περιβάλλοντος στο Git. Το Fabric αντιστοιχίζει αυτές τις σχέσεις όταν συγχρονίζετε σε νέους χώρους εργασίας.

Το προεπιλεγμένο αναγνωριστικό lakehouse παραμένει στα μετα-δεδομένα σημειωματαρίου όταν συγχρονίζετε από το αποθετήριο δεδομένων σε έναν χώρο εργασίας Fabric. Εάν χρειάζεται, συνδέστε με μη αυτόματο τρόπο το σημειωματάριο με το νέο στοιχείο lakehouse. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Ενοποίηση Git lakehouse.

Ρυθμίσεις Git σημειωματαρίου

Ο πίνακας ρυθμίσεων Git σάς επιτρέπει να ελέγχετε τον τρόπο με τον οποίο τα σημειωματάρια αλληλεπιδρούν με τον έλεγχο προέλευσης, συμπεριλαμβανομένων των επιλογών για τη σύνδεση Git και τη διαχείριση των αρχείων φακέλων πόρων που περιλαμβάνονται στις υποβολές.

Σημείωμα

Μην κάνετε επεξεργασία notebook-settings.json στο αποθετήριο Git για να ελέγξετε την αυτόματη δέσμευση ή τους πόρους του Git. Διαχειριστείτε αυτές τις ρυθμίσεις μέσω της σελίδας ρυθμίσεων σημειωματαρίου.

Αυτόματη σύνδεση Lakehouse στο Git

Η αυτόματη σύνδεση Lakehouse επιτρέπει στο Fabric να επιλύει το σωστό προεπιλεγμένο lakehouse για κάθε χώρο εργασίας που είναι συνδεδεμένος με το Git. Αυτό μειώνει τη μη αυτόματη επανασύνδεση όταν μετακινείτε σημειωματάρια σε χώρους εργασίας ανάπτυξης, δοκιμής και παραγωγής.

Ενεργοποιήστε αυτήν τη δυνατότητα από τις ρυθμίσεις του Σημειωματάριου. Αφού το ενεργοποιήσετε, το Fabric δημιουργεί notebook-settings.json στο αποθετήριο και διαχειρίζεται αυτόματα αυτό το αρχείο. Μην επεξεργαστείτε αυτό το αρχείο με μη αυτόματο τρόπο.

Στιγμιότυπο οθόνης του σημειωματάριου git-binding.

Σημείωμα

Η ενοποίηση του Notebook Git υποστηρίζει τη διατήρηση της σχέσης σύνδεσης μεταξύ των σημειωματάριων και των συνδεδεμένων λιμνών τους κατά τον συγχρονισμό μεταξύ των χώρων εργασίας. Κατά το συγχρονισμό ενός σημειωματαρίου με έναν άλλο χώρο εργασίας, μπορείτε να επιλέξετε εάν θα συνδέεται με το lakehouse στον χώρο εργασίας προέλευσης ή με το lakehouse στον νέο χώρο εργασίας. Για σημειωματάρια που έχουν ήδη εκδοθεί στο Git, το φυσικό αναγνωριστικό του συνδεδεμένου lakehouse στα μετα-δεδομένα του σημειωματάριου αντικαθίσταται με ένα λογικό αναγνωριστικό. Αυτή η αλλαγή μπορεί να εμφανιστεί στην προβολή διαφορών Git.

Υποστήριξη φακέλων πόρων σημειωματάριων στο Git

Σημείωμα

Ο φάκελος Environment Resources και η ενοποίηση με διοχετεύσεις ανάπτυξης και δημόσια API δεν υποστηρίζονται προς το παρόν.

Ο ενσωματωμένος φάκελος Resources μπορεί να δεσμευτεί στο Git, έτσι ώστε οι δέσμες ενεργειών και τα αρχεία διαμόρφωσης να εκδίδονται με το σημειωματάριο.

Αυτή η δυνατότητα είναι προαιρετική και απενεργοποιημένη από προεπιλογή. Ενεργοποιήστε το από τις ρυθμίσεις σημειωματάριου στην ενότητα Ρυθμίσεις Git. Αφού το ενεργοποιήσετε, τα αρχεία στο φάκελο Πόροι περιλαμβάνονται στις υποβολές. Επειδή οι υποβολές έχουν όριο 50 MB , χρησιμοποιήστε .gitignore κανόνες αρχείων ή Git για να εξαιρέσετε μεγάλα ή προσωρινά αρχεία ή φακέλους.

Στιγμιότυπο οθόνης των πόρων σημειωματαρίου στη ρύθμιση παραμέτρων git.

Σημείωμα

Μόνο ο .gitignore ενσωματωμένος ριζικός φάκελος πόρων τίθεται σε ισχύ.

Αφού ρυθμίσετε τις παραμέτρους των κανόνων Git και υποβάλετε αλλαγές, το Fabric αποθηκεύει τους κανόνες στο fs-settings.json αποθετήριο. Το Fabric δημιουργεί και διαχειρίζεται αυτό το αρχείο για να διατηρεί συνεπή τη ρύθμιση παραμέτρων του αποθετηρίου. Επίσης, δεν συνιστούμε την επεξεργασία αυτού του αρχείου απευθείας στο αποθετήριο Git.

Στιγμιότυπο οθόνης της δομής πόρων σημειωματάριου στη ρύθμιση παραμέτρων git.

Σημειωματάριο σε διοχετεύσεις ανάπτυξης

Χρησιμοποιήστε διοχετεύσεις ανάπτυξης για να προωθήσετε τις αλλαγές σημειωματαρίων σε διάφορα στάδια, όπως η ανάπτυξη, η δοκιμή και η παραγωγή. Επικυρώστε τις ενημερώσεις σε προηγούμενα στάδια πριν τις προωθήσετε στην παραγωγή.

Η ανάπτυξη σημειωματαρίου υποστηρίζει την αυτόματη σύνδεση για το προεπιλεγμένο lakehouse και το συνδεδεμένο περιβάλλον όταν τα εξαρτώμενα στοιχεία βρίσκονται στον ίδιο χώρο εργασίας. Κατά τη διάρκεια της ανάπτυξης, το Fabric μπορεί να επανασυνδέσει αυτές τις εξαρτήσεις σε αντίστοιχα στοιχεία στον χώρο εργασίας προορισμού. Οι αλλαγές μετα-δεδομένων μπορούν να εμφανιστούν στην προβολή διαφορών.

Εάν χρειάζεστε ένα συγκεκριμένο προεπιλεγμένο lakehouse σταδίου προορισμού, ρυθμίστε τις παραμέτρους ενός κανόνα ανάπτυξης για να παρακάμψετε την αυτόματη δέσμευση.

Το νέο περιβάλλον εργασίας χρήστη διοχέτευσης ανάπτυξης χρησιμοποιείται αυτήν τη στιγμή σε αυτό το άρθρο. Μπορείτε να μεταβείτε στο παλιό περιβάλλον εργασίας χρήστη απενεργοποιώντας τη διοχέτευση νέας ανάπτυξης.

Σημείωμα

Γνωστό πρόβλημα: Η κατάσταση παγωμένου κελιού σε σημειωματάρια δεν διατηρείται κατά την ανάπτυξη.

Χρησιμοποιήστε τα παρακάτω βήματα για να αναπτύξετε σημειωματάρια μέσω μιας διοχέτευσης ανάπτυξης.

  1. Δημιουργήστε μια διοχέτευση ανάπτυξης ή ανοίξτε μια υπάρχουσα. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Γρήγορα αποτελέσματα με διοχετεύσεις ανάπτυξης.

  2. Αναθέστε χώρους εργασίας σε διαφορετικά στάδια σύμφωνα με τους στόχους ανάπτυξής σας.

  3. Επιλέξτε, προβάλετε και συγκρίνετε στοιχεία, συμπεριλαμβανομένων των σημειωματαρίων, μεταξύ των σταδίων. Το επισημασμένο σήμα δείχνει τον αριθμό των αλλαγμένων στοιχείων μεταξύ του προηγούμενου σταδίου και του τρέχοντος σταδίου.

    Στιγμιότυπο οθόνης σημειωματάριου στη διοχέτευση ανάπτυξης.

  4. Επιλέξτε Ανάπτυξη για να προωθήσετε σημειωματάρια στα στάδια ανάπτυξης, δοκιμής και παραγωγής.

    Στιγμιότυπο οθόνης επιλογής στοιχείων και ανάπτυξης.

  5. Στο παράθυρο Ανάπτυξη σε αυτό το στάδιο , εξετάστε τα νέα και τα τροποποιημένα στοιχεία. Για να συνεχίσετε την ανάπτυξη ακόμα και αν ένα ή περισσότερα στοιχεία αποτύχουν, επιλέξτε Συνέχεια ανάπτυξης εάν ένα ή περισσότερα στοιχεία αποτύχουν.

    Αφού ελέγξετε και επιβεβαιώσετε την επιλογή, επιλέξτε Ανάπτυξη.

    Στιγμιότυπο οθόνης ανάπτυξης περιεχομένων pop-up.png.

  6. (Προαιρετικό.) Για να δημιουργήσετε κανόνες ανάπτυξης, επιλέξτε Κανόνες ανάπτυξης στο στοιχείο σταδίου προορισμού στη διοχέτευση (για παράδειγμα, Δοκιμή ή Παραγωγή).

    Για τη γενική συμπεριφορά και τους περιορισμούς των κανόνων, ανατρέξτε στην ενότητα Δημιουργία κανόνων ανάπτυξης.

    Στιγμιότυπο οθόνης καταχώρησης κανόνων ανάπτυξης.

  7. Ρυθμίστε τις παραμέτρους ενός προεπιλεγμένου κανόνα lakehouse για κάθε ανάπτυξη σημειωματαρίου.

    Αυτός ο κανόνας ελέγχει σε ποια λίμνη συνδέεται το σημειωματάριο στο στάδιο προορισμού μετά την ανάπτυξη.

    Στο τμήμα παραθύρου Ορισμός κανόνων ανάπτυξης , επιλέξτε το πλακίδιο Προεπιλεγμένο lakehouse .

    Χρησιμοποιήστε τις αναπτυσσόμενες λίστες Από και Έως για να αντιστοιχίσετε το προεπιλεγμένο lakehouse σταδίου προέλευσης στο προεπιλεγμένο lakehouse σταδίου προορισμού:

    • Το ίδιο με το lakehouse προέλευσης: Διατηρήστε την ίδια προεπιλεγμένη ρύθμιση lakehouse με το στάδιο προέλευσης.
    • Δ/Υ (χωρίς προεπιλεγμένο lakehouse): Καταργήστε την προεπιλεγμένη ρύθμιση lakehouse στο στάδιο προορισμού.
    • Άλλο: Αντικαταστήστε το προεπιλεγμένο lakehouse σταδίου προέλευσης με ένα διαφορετικό lakehouse στο στάδιο προορισμού.

    Εάν επιλέξετε Άλλο στην αναπτυσσόμενη λίστα Προς , δώστε τις λεπτομέρειες της λίμνης προορισμού:

    • Αναγνωριστικό Lakehouse
    • Όνομα Lakehouse
    • Αναγνωριστικό χώρου εργασίας Lakehouse

    Στιγμιότυπο οθόνης ενός καθορισμένου προεπιλεγμένου lakehouse.

    Σημείωμα

    Το αναγνωριστικό Lakehouse απαιτείται όταν ρυθμίζετε τις παραμέτρους αυτού του κανόνα. Μπορείτε να λάβετε το αναγνωριστικό lakehouse από τη διεύθυνση URL του στοιχείου. Οι κανόνες ανάπτυξης έχουν προτεραιότητα έναντι της αυτόματης δέσμευσης. Εάν έχει ρυθμιστεί ένας κανόνας ανάπτυξης, παρακάμπτει το lakehouse που συνδέεται αυτόματα.

  8. Παρακολουθήστε την κατάσταση ανάπτυξης από το ιστορικό ανάπτυξης.