Κοινοποίηση μέσω


Χρήση της εμπειρίας Python στο Notebook

Το σημειωματάριο Python είναι μια νέα εμπειρία που βασίζεται στο σημειωματάριο Fabric. Είναι ένα ευέλικτο και αλληλεπιδραστικό εργαλείο που έχει σχεδιαστεί για ανάλυση δεδομένων, απεικόνιση και εκμάθηση μηχανής. Παρέχει μια απρόσκοπτη εμπειρία ανάπτυξης για τη σύνταξη και εκτέλεση κώδικα Python. Αυτή η δυνατότητα το καθιστά βασικό εργαλείο για επιστήμονες δεδομένων, αναλυτές και προγραμματιστές BI, ειδικά για εργασίες εξερεύνησης που δεν απαιτούν μεγάλα δεδομένα και κατανεμημένους υπολογισμούς.

Με ένα σημειωματάριο Python, μπορείτε να λάβετε τα εξής:

  • Πολλοί ενσωματωμένοι πυρήνες python: Τα σημειωματάρια Python προσφέρουν ένα καθαρό περιβάλλον κωδικοποίησης Python χωρίς Spark, με δύο εκδόσεις του πυρήνα Python - Το Python 3.10 και 3.11 διαθέσιμο από προεπιλογή και τις εγγενείς δυνατότητες ipython που υποστηρίζονται όπως το iPyWidget, μαγικές εντολές.

  • Οικονομικά: Ο νέος φορητός υπολογιστής Python προσφέρει πλεονεκτήματα εξοικονόμησης κόστους με την εκτέλεση σε ένα σύμπλεγμα κόμβων με μνήμη 2vCores/16GB από προεπιλογή. Αυτή η ρύθμιση εξασφαλίζει την αποτελεσματική χρήση πόρων για έργα εξερεύνησης δεδομένων με μικρότερο μέγεθος δεδομένων.

  • Lakehouse & Πόροι είναι εγγενώς διαθέσιμοι: Το Fabric Lakehouse μαζί με τους ενσωματωμένους Πόρους πλήρεις λειτουργίες του Notebook είναι διαθέσιμες στο σημειωματάριο Python. Αυτή η δυνατότητα επιτρέπει στους χρήστες να μεταφέρουν εύκολα τα δεδομένα στο σημειωματάριο python. Απλώς δοκιμάστε να σύρετε & απόθεση για να λάβετε το τμήμα κώδικα.

  • Προγραμματισμός Mix μεT-SQL: Το σημειωματάριο Python προσφέρει έναν εύκολο τρόπο αλληλεπίδρασης με την Αποθήκη δεδομένων και τα τελικά σημεία SQL στην εξερεύνηση, χρησιμοποιώντας τη σύνδεση δεδομένων notebookutils και μπορείτε εύκολα να εκτελέσετε τις δέσμες ενεργειών T-SQL στο πλαίσιο της python.

  • υποστήριξη για δημοφιλείς βιβλιοθήκες ανάλυσης δεδομένων: Τα σημειωματάρια Python παρέχονται με προεγκατεστημένες βιβλιοθήκες όπως το DuckDB, το Polars και το Scikit-learn, παρέχοντας μια ολοκληρωμένη εργαλειοθήκη για τον χειρισμό δεδομένων, την ανάλυση και την εκμάθηση μηχανής.

  • Advanced intellisense: Το Python notebook υιοθετεί το Pylance ως μηχανή intellisense, μαζί με άλλες προσαρμοσμένες γλωσσικές υπηρεσίες Fabric, με στόχο να παρέχει εμπειρία κωδικοποίησης αιχμής για προγραμματιστές φορητών υπολογιστών.

  • NotebookUtils & σύνδεση σημασιολογίας: Τα ισχυρά κιτ εργαλείων API σάς παρέχουν τη δυνατότητα να χρησιμοποιείτε εύκολα τις δυνατότητες Fabric και Power BI με εμπειρία πρώτης χρήσης κώδικα.

  • δυνατότητες εμπλουτισμένων απεικονίσεων: Εκτός από τη δημοφιλή συνάρτηση προεπισκόπησης εμπλουτισμένου πλαισίου δεδομένων "Table" και τη συνάρτηση "Chart", υποστηρίζουμε επίσης δημοφιλείς βιβλιοθήκες απεικονίσεων όπως Matplotlib, Seaborn και Plotly. Το PowerBIClient υποστηρίζει επίσης αυτές τις βιβλιοθήκες για να βοηθήσει τους χρήστες να κατανοούν καλύτερα τα μοτίβα δεδομένων και τις πληροφορίες.

  • Συνήθεις δυνατότητες για το Σημειωματάριο Fabric: Όλες οι δυνατότητες επιπέδου Σημειωματάριου ισχύουν φυσικά για το σημειωματάριο Python, όπως οι δυνατότητες επεξεργασίας, η Αυτόματη αποθήκευση, η συνεργασία, η κοινή χρήση και η διαχείριση δικαιωμάτων, η ενοποίηση Git, η εισαγωγή/εξαγωγή κ.λπ.

  • δυνατότητες της επιστήμης δεδομένων πλήρους στοίβας: Το προηγμένο κιτ εργαλείων χαμηλού κώδικα Data Wrangler, το MLFlow πλαισίου εκμάθησης μηχανής και το ισχυρό Copilot είναι όλα διαθέσιμα στο σημειωματάριο Python.

Τρόπος πρόσβασης στο Python Notebook

Αφού ανοίξετε ένα σημειωματάριο Fabric, μπορείτε να μεταβείτε σε Python στο αναπτυσσόμενο μενού γλώσσας στην καρτέλα Αρχική σελίδα και να μετατρέψετε ολόκληρη τη ρύθμιση του σημειωματάριου σε Python.

Στιγμιότυπο οθόνης που εμφανίζει τη μετάβαση σε Python από το μενού γλώσσας σημειωματάριου.

Οι περισσότερες από τις συνήθεις δυνατότητες υποστηρίζονται ως επίπεδο σημειωματάριου. Μπορείτε να ανατρέξετε στην Τρόπος χρήσης σημειωματάριων Microsoft Fabric και Ανάπτυξη, εκτέλεση και διαχείριση σημειωματάριων Microsoft Fabric για να μάθετε τη λεπτομερή χρήση. Εδώ παραθέτουμε ορισμένες βασικές δυνατότητες ειδικά για σενάρια Python.

Εκτέλεση σημειωματάριων Python

Το σημειωματάριο Python υποστηρίζει πολλούς τρόπους εκτέλεσης εργασιών:

  • Διαδραστική εκτέλεση: Μπορείτε να εκτελέσετε ένα σημειωματάριο Python διαδραστικά όπως ένα εγγενές σημειωματάριο Jupyter.
  • Προγραμματισμός εκτέλεσης: Μπορείτε να χρησιμοποιήσετε την εμπειρία ελαφρού χρονοδιαγράμματος στη σελίδα ρυθμίσεων σημειωματαρίου για να εκτελέσετε το σημειωματάριο Python ως εργασία δέσμης.
  • Εκτέλεση διοχέτευσης: Μπορείτε να ενορχηστρώσετε σημειωματάρια Python ως δραστηριότητες σημειωματαρίου στη διοχέτευση. Το στιγμιότυπο θα δημιουργηθεί μετά την εκτέλεση της εργασίας.
  • Εκτέλεση αναφοράς: Μπορείτε να χρησιμοποιήσετε notebookutils.notebook.run() ή notebookutils.notebook.runMultiple() να αναφέρετε την εκτέλεση σημειωματαρίων Python σε ένα άλλο σημειωματάριο Python ως εργασία δέσμης. Το στιγμιότυπο θα δημιουργηθεί μετά την ολοκλήρωση της εκτέλεσης αναφοράς.
  • εκτέλεση δημόσιου API: Μπορείτε να προγραμματίσετε την εκτέλεση του σημειωματάριου python με τον σημειωματάριο εκτελεί δημόσιο API, βεβαιωθείτε ότι οι ιδιότητες γλώσσας και πυρήνα στα μετα-δεδομένα σημειωματάριου του δημόσιου ωφέλιμου φορτίου API έχουν οριστεί σωστά.

Μπορείτε να παρακολουθήσετε τις λεπτομέρειες εκτέλεσης της εργασίας σημειωματάριου Python στην καρτέλα κορδέλας Εκτέλεση ->Προβολή όλων των εκτελέσεων.

Αλληλεπίδραση δεδομένων

Μπορείτε να αλληλεπιδράσετε με lakehouse, αποθήκες, τελικά σημεία SQL και ενσωματωμένους φακέλους πόρων στο σημειωματάριο Python.

Note

  • Ο χρόνος εκτέλεσης του Python Notebook έρχεται προεγκατεστημένος με βιβλιοθήκες delta-rs και duckdb για υποστήριξη τόσο της ανάγνωσης όσο και της εγγραφής δεδομένων Delta Lake. Ωστόσο, σημειώστε ότι ορισμένες δυνατότητες του Delta Lake ενδέχεται να μην υποστηρίζονται πλήρως αυτήν τη στιγμή. Για περισσότερες λεπτομέρειες και τις πιο πρόσφατες ενημερώσεις, ανατρέξτε στους επίσημους ιστότοπους delta-rs και duckdb .
  • Προς το παρόν δεν υποστηρίζουμε deltalake(delta-rs) έκδοση 1.0.0 ή νεότερη. Μείνετε συντονισμένοι.

Αλληλεπίδραση Lakehouse

Μπορείτε να ορίσετε ένα Lakehouse ως προεπιλογή ή μπορείτε επίσης να προσθέσετε πολλά Lakehouse για να τα εξερευνήσετε και να τα χρησιμοποιήσετε σε σημειωματάρια.

Εάν δεν είστε εξοικειωμένοι με την ανάγνωση των αντικειμένων δεδομένων, όπως ο πίνακας δέλτα, δοκιμάστε να σύρετε και να αποθέσετε το αρχείο και τον πίνακα δέλτα στον καμβά σημειωματαρίου ή χρησιμοποιήστε τη Φόρτωση δεδομένων στο αναπτυσσόμενο μενού του αντικειμένου. Το σημειωματάριο εισάγει αυτόματα τμήμα κώδικα στο κελί κώδικα και δημιουργεί κώδικα για την ανάγνωση του αντικειμένου δεδομένων προορισμού.

Note

Εάν αντιμετωπίσετε OOM κατά τη φόρτωση μεγάλου όγκου δεδομένων, δοκιμάστε να χρησιμοποιήσετε το dataframe DuckDB, Polars ή PyArrow αντί για pandas.

Μπορείτε να βρείτε τη λειτουργία εγγραφής Lakehouse στο τμήματος κώδικα Αναζήτηση ->Εγγραφή δεδομένων σεπίνακα δέλτα .

Στιγμιότυπο οθόνης που εμφανίζει την επιχείρηση εγγραφής lakehouse.

Αλληλεπίδραση αποθήκης και συνδυασμός προγραμματισμού με το T-SQL

Μπορείτε να προσθέσετε Αποθήκες δεδομένων ή τελικά σημεία SQL από την Εξερεύνηση Αποθήκης του Notebook. Παρομοίως, μπορείτε να σύρετε και αποθέσετε τους πίνακες στον καμβά σημειωματάριου ή να χρησιμοποιήσετε τις λειτουργίες συντόμευσης στο αναπτυσσόμενο μενού πίνακα. Το σημειωματάριο δημιουργεί αυτόματα τμήμα κώδικα για εσάς. Μπορείτε να χρησιμοποιήσετε τα βοηθητικά προγράμματα notebookutils.data για να δημιουργήσετε μια σύνδεση με τις Αποθήκες και να υποβάλετε ερωτήματα στα δεδομένα χρησιμοποιώντας μια πρόταση T-SQL στο περιβάλλον Python.

Στιγμιότυπο οθόνης που εμφανίζει συντομεύσεις πίνακα αποθήκης.

Note

Τα τελικά σημεία SQL είναι μόνο για ανάγνωση εδώ.

Φάκελος πόρων σημειωματάριου

Ο φάκελος Ενσωματωμένοι πόροι σημειωματαρίου είναι εγγενώς διαθέσιμος στο Σημειωματάριο Python. Μπορείτε εύκολα να αλληλεπιδράσετε με τα αρχεία στον ενσωματωμένο φάκελο πόρων χρησιμοποιώντας κώδικα Python σαν να εργάζεστε με το τοπικό σύστημα αρχείων σας. Προς το παρόν, ο φάκελος πόρων περιβάλλοντος δεν υποστηρίζεται.

Λειτουργίες πυρήνα

Το σημειωματάριο Python υποστηρίζει δύο ενσωματωμένους πυρήνες αυτή τη στιγμή, είναι η Python 3.10 και η Python 3.11, ο προεπιλεγμένος επιλεγμένος πυρήνας είναι η Python 3.11. μπορείτε εύκολα να εναλλάσσεστε μεταξύ τους.

Μπορείτε να διακόψετε, να επανεκκινήσετε ή να αλλάξετε πυρήνα στην Κεντρική καρτέλα της κορδέλας. Η διακοπή του πυρήνα στα σημειωματάρια Python είναι ίδια με την ακύρωση του κελιού στο σημειωματάριο Spark.

Στιγμιότυπο οθόνης που εμφανίζει λειτουργίες πυρήνα.

Η μη φυσιολογική έξοδος πυρήνα προκαλεί διακοπή της εκτέλεσης κώδικα και απώλεια μεταβλητών, αλλά αυτό δεν διακόπτεται στην περίοδο λειτουργίας του σημειωματάριου.

Υπάρχουν εντολές που μπορεί να οδηγήσουν σε θάνατο του πυρήνα. Για παράδειγμα, quit(), exit().

Διαχείριση βιβλιοθήκης

Μπορείτε να χρησιμοποιήσετε εντολές%pip και %conda για ενσωματωμένες εγκαταστάσεις, οι εντολές υποστηρίζουν τόσο δημόσιες βιβλιοθήκες όσο και προσαρμοσμένες βιβλιοθήκες.

Για προσαρμοσμένες βιβλιοθήκες, μπορείτε να αποστείλετε τα αρχεία lib στο φάκελο Ενσωματωμένοι πόροι . Υποστηρίζουμε πολλούς τύπους βιβλιοθηκών, συμπεριλαμβανομένων μορφών όπως Wheel (.whl), JAR (.jar), DLL (.dll) και Python (.py). Απλώς δοκιμάστε να σύρετε και να αποθέσετε στο αρχείο και το απόσπασμα κώδικα δημιουργείται αυτόματα.

Ίσως χρειαστεί να επανεκκινήσετε τον πυρήνα για να χρησιμοποιήσετε τα ενημερωμένα πακέτα.

Για καλύτερη κατανόηση και χρήση παρόμοιων εντολών με σαφήνεια, ανατρέξτε στον παρακάτω πίνακα.

Command/Syntax Κύριος σκοπός Πώς λειτουργεί στο Jupyter Notebook Τυπική περίπτωση χρήσης Notes
%pip install package Εγκατάσταση πακέτων Python Εκτελεί pip στον πυρήνα Python του σημειωματάριου Προτεινόμενος τρόπος εγκατάστασης πακέτων Στο Python Notebook, όπως !pipκαι το ; δεν επανεκκινεί αυτόματα τον πυρήνα
!pip install package Εγκατάσταση πακέτων Python μέσω κελύφους Εκτελεί την εντολή pip ως κέλυφος Εναλλακτικός τρόπος εγκατάστασης πακέτων Στο Python Notebook, όπως %pipκαι το ; δεν επανεκκινεί αυτόματα τον πυρήνα
import sys; sys.exit(0) Επανεκκίνηση του πυρήνα σημειωματάριου Επανεκκινεί αμέσως τον πυρήνα Επανεκκίνηση μέσω προγραμματισμού του πυρήνα Διαγράφει όλες τις μεταβλητές και τις καταστάσεις. Δεν συνιστάται η άμεση χρήση
notebookutils.session.restartPython() Επανεκκίνηση του πυρήνα σημειωματάριου Κλήσεις sys.exit(0) εσωτερικά Προτεινόμενος τρόπος επανεκκίνησης του πυρήνα Επίσημο API, ασφαλές και πιο συμβατό από την άμεση χρήση sys.exit(0)

Note

  • Στο Python Notebook %pip , και !pip έχουν την ίδια συμπεριφορά: και τα δύο εγκαθιστούν πακέτα στο περιβάλλον του τρέχοντος πυρήνα και κανένα δεν θα επανεκκινήσει αυτόματα τον πυρήνα μετά την εγκατάσταση.
  • Εάν πρέπει να επανεκκινήσετε τον πυρήνα (για παράδειγμα, μετά την εγκατάσταση ορισμένων πακέτων), συνιστάται να χρησιμοποιήσετε notebookutils.session.restartPython() αντί για import sys; sys.exit(0).
    • notebookutils.session.restartPython() Το είναι ένα επίσημο API που ενσωματώνει sys.exit(0) το και είναι πιο ασφαλές και συμβατό σε περιβάλλοντα σημειωματάριου.
  • Δεν συνιστάται η άμεση χρήση sys.exit(0) εκτός εάν είναι απαραίτητο.

Παρακολούθηση χρήσης πόρων σε πραγματικό χρόνο σημειωματάριου Python

Σημαντικό

Αυτή η δυνατότητα είναι σε προεπισκόπηση.

Με το παράθυρο παρακολούθησης πόρων, μπορείτε να παρακολουθείτε κρίσιμες πληροφορίες χρόνου εκτέλεσης, όπως η διάρκεια περιόδου λειτουργίας, ο τύπος υπολογιστικής λειτουργίας και οι μετρήσεις πόρων σε πραγματικό χρόνο, συμπεριλαμβανομένης της κατανάλωσης CPU και μνήμης, απευθείας μέσα στο σημειωματάριό σας. Αυτή η δυνατότητα παρέχει μια άμεση επισκόπηση της ενεργής συνεδρίας σας και των πόρων που χρησιμοποιούνται.

Η παρακολούθηση πόρων βελτιώνει την ορατότητα στον τρόπο με τον οποίο οι φόρτοι εργασίας της Python χρησιμοποιούν τους πόρους του συστήματος. Σας βοηθά να βελτιστοποιήσετε την απόδοση, να διαχειριστείτε το κόστος και να μειώσετε τον κίνδυνο σφαλμάτων εκτός μνήμης (OOM). Παρακολουθώντας μετρήσεις σε πραγματικό χρόνο, μπορείτε να προσδιορίσετε λειτουργίες έντασης πόρων, να αναλύσετε μοτίβα χρήσης και να λάβετε τεκμηριωμένες αποφάσεις σχετικά με την κλιμάκωση ή την τροποποίηση κώδικα.

Για να ξεκινήσετε να το χρησιμοποιείτε, ορίστε τη γλώσσα του σημειωματαρίου σας σε Python και ξεκινήστε μια περίοδο λειτουργίας. Στη συνέχεια, μπορείτε να ανοίξετε την οθόνη είτε κάνοντας κλικ στους υπολογιστικούς πόρους στη γραμμή κατάστασης του σημειωματαρίου είτε επιλέγοντας Προβολή χρήσης πόρων από τη γραμμή εργαλείων. Το τμήμα παραθύρου εποπτείας πόρων θα εμφανιστεί αυτόματα, παρέχοντας μια ολοκληρωμένη εμπειρία παρακολούθησης για κώδικα Python σε σημειωματάρια Fabric.

Στιγμιότυπο οθόνης που εμφανίζει την παρακολούθηση της χρήσης πόρων σε πραγματικό χρόνο του σημειωματάριου Python.

Μαγική εντολή ρύθμισης παραμέτρων περιόδου λειτουργίας

Παρόμοια με την εξατομίκευση ενός τη ρύθμιση παραμέτρων περιόδου λειτουργίας Spark στο σημειωματάριο, μπορείτε επίσης να χρησιμοποιήσετε %%configure στο σημειωματάριο Python. Το σημειωματάριο Python υποστηρίζει την προσαρμογή μεγέθους υπολογιστικού κόμβου, τη μοντάρισμα σημείων και την προεπιλεγμένη λίμνη της περιόδου λειτουργίας σημειωματάριου. Μπορούν να χρησιμοποιηθούν σε αλληλεπιδραστικές δραστηριότητες σημειωματάριου και σημειωματάριου διοχέτευσης. Συνιστούμε να χρησιμοποιήσετε %%configure εντολή στην αρχή του σημειωματάριού σας ή πρέπει να επανεκκινήσετε την περίοδο λειτουργίας του σημειωματάριου για να τεθούν σε ισχύ οι ρυθμίσεις.

Ακολουθούν οι υποστηριζόμενες ιδιότητες στο σημειωματάριο Python %%configure:

%%configure -f
{
    "vCores": 4, // Recommended values: [4, 8, 16, 32, 64], Fabric will allocate matched memory according to the specified vCores.
    "defaultLakehouse": {  
        // Will overwrites the default lakehouse for current session
        "name": "<lakehouse-name>",
        "id": "<(optional) lakehouse-id>",
        "workspaceId": "<(optional) workspace-id-that-contains-the-lakehouse>" // Add workspace ID if it's from another workspace
    },
    "mountPoints": [
        {
            "mountPoint": "/myMountPoint",
            "source": "abfs[s]://<file_system>@<account_name>.dfs.core.windows.net/<path>"
        },
        {
            "mountPoint": "/myMountPoint1",
            "source": "abfs[s]://<file_system>@<account_name>.dfs.core.windows.net/<path1>"
        },
    ],
}

Μπορείτε να προβάλετε την ενημέρωση των υπολογιστικών πόρων στη γραμμή κατάστασης του σημειωματάριου και να παρακολουθήσετε τη χρήση της CPU και της μνήμης του υπολογιστικού κόμβου σε πραγματικό χρόνο.

Στιγμιότυπο οθόνης που εμφανίζει την ενημέρωση υπολογιστικών πόρων.

NotebookUtils

Τα Βοηθητικά προγράμματα σημειωματάριου (NotebookUtils) είναι ένα ενσωματωμένο πακέτο που σας βοηθά να εκτελείτε εύκολα συνήθεις εργασίες στο Fabric Notebook. Είναι προεγκατεστημένη στον χρόνο εκτέλεσης Python. Μπορείτε να χρησιμοποιήσετε το NotebookUtils για να εργαστείτε με συστήματα αρχείων, για να λάβετε μεταβλητές περιβάλλοντος, να αλληλουχήσετε σημειωματάρια, να αποκτήσετε πρόσβαση σε εξωτερικό χώρο αποθήκευσης και να εργαστείτε με μυστικά.

Μπορείτε να χρησιμοποιήσετε notebookutils.help() το για να παραθέσετε τα διαθέσιμα API και επίσης να λάβετε βοήθεια σχετικά με μεθόδους ή να αναφέρετε το έγγραφο NotebookUtils.

Βοηθητικά προγράμματα δεδομένων

Note

Προς το παρόν, η δυνατότητα είναι σε προεπισκόπηση.

Μπορείτε να χρησιμοποιήσετε notebookutils.data βοηθητικά προγράμματα για να δημιουργήσετε μια σύνδεση με την παρεχόμενη προέλευση δεδομένων και, στη συνέχεια, να διαβάσετε και υποβάλετε ερωτήματα σε δεδομένα χρησιμοποιώντας μια πρόταση T-SQL.

Εκτελέστε την ακόλουθη εντολή για να δείτε μια επισκόπηση των διαθέσιμων μεθόδων:

notebookutils.data.help()

Output:

Help on module notebookutils.data in notebookutils:

NAME
    notebookutils.data - Utility for read/query data from connected data sources in Fabric

FUNCTIONS
    connect_to_artifact(artifact: str, workspace: str = '', artifact_type: str = '', **kwargs)
        Establishes and returns an ODBC connection to a specified artifact within a workspace 
        for subsequent data queries using T-SQL.
        
        :param artifact: The name or ID of the artifact to connect to.
        :param workspace:  Optional; The workspace in which the provided artifact is located, if not provided,
                             use the workspace where the current notebook is located.
        :param artifactType: Optional; The type of the artifact, Currently supported type are Lakehouse, Warehouse and MirroredDatabase. 
                                If not provided, the method will try to determine the type automatically.
        :param **kwargs Optional: Additional optional configuration. Supported keys include:
            - tds_endpoint : Allow user to specify a custom TDS endpoint to use for connection.
        :return: A connection object to the specified artifact.
        
        :raises UnsupportedArtifactException: If the specified artifact type is not supported to connect.
        :raises ArtifactNotFoundException: If the specified artifact is not found within the workspace.
        
        Examples:
            sql_query = "SELECT DB_NAME()"
            with notebookutils.data.connect_to_artifact("ARTIFACT_NAME_OR_ID", "WORKSPACE_ID", "ARTIFACT_TYPE") as conn:
                df = conn.query(sql_query)
                display(df)
    
    help(method_name: str = '') -> None
        Provides help for the notebookutils.data module or the specified method.
        
        Examples:
        notebookutils.data.help()
        notebookutils.data.help("connect_to_artifact")
        :param method_name: The name of the method to get help with.

DATA
    __all__ = ['help', 'connect_to_artifact']

FILE
    /home/trusted-service-user/jupyter-env/python3.10/lib/python3.10/site-packages/notebookutils/data.py

Υποβολή ερωτημάτων για δεδομένα από το Lakehouse

conn = notebookutils.data.connect_to_artifact("lakehouse_name_or_id", "optional_workspace_id", "optional_lakehouse_type")
df = conn.query("SELECT * FROM sys.schemas;")

Υποβολή ερωτημάτων για δεδομένα από την Αποθήκη

conn = notebookutils.data.connect_to_artifact("warehouse_name_or_id", "optional_workspace_id", "optional_warehouse_type")
df = conn.query("SELECT * FROM sys.schemas;")

Υποβολή ερωτημάτων σε δεδομένα από τη βάση δεδομένων SQL

conn = notebookutils.data.connect_to_artifact("sqldb_name_or_id", "optional_workspace_id", "optional_sqldatabase_type") 
df = conn.query("SELECT * FROM sys.schemas;")

Note

Προς το παρόν, τα βοηθητικά προγράμματα Δεδομένων στο NotebookUtils είναι διαθέσιμα μόνο στο σημειωματάριο Python.

Περιήγηση σε τμήματα κώδικα

Μπορείτε να βρείτε χρήσιμα αποσπάσματα κώδικα python στην καρτέλα Επεξεργασία-Αναζήτηση>αποσπάσματος κώδικα, νέα δείγματα Python είναι πλέον διαθέσιμα. Μπορείτε να μάθετε από το τμήμα κώδικα Python για να ξεκινήσετε την εξερεύνηση του σημειωματάριου.

Στιγμιότυπο οθόνης που εμφανίζει πού μπορείτε να περιηγηθείτε σε τμήματα κώδικα python.

Η σημασιολογική σύνδεση είναι μια δυνατότητα που σας επιτρέπει να δημιουργήσετε μια σύνδεση μεταξύ σημασιολογικών μοντέλων και του Synapse Data Science στο Microsoft Fabric. Υποστηρίζεται εγγενώς στο σημειωματάριο Python. Οι μηχανικοί του BI και οι προγραμματιστές Power BI μπορούν να χρησιμοποιούν τη σύνδεση σημασιολογίας για εύκολη σύνδεση και διαχείριση μοντέλου σημασιολογίας. Διαβάστε το δημόσιο έγγραφο για να μάθετε περισσότερα σχετικά με τη Σημασιολογική σύνδεση.

Visualization

Εκτός από τη σχεδίαση γραφημάτων με βιβλιοθήκες, η ενσωματωμένη λειτουργία οπτικοποίησης σάς επιτρέπει να μετατρέπετε τα DataFrames σε οπτικοποιήσεις δεδομένων εμπλουτισμένης μορφής. Μπορείτε να χρησιμοποιήσετε τη συνάρτηση display() σε πλαίσια δεδομένων για να δημιουργήσετε την προβολή πίνακα εμπλουτισμένου πλαισίου δεδομένων και την προβολή γραφήματος.

Στιγμιότυπο οθόνης που εμφανίζει την εμπειρία απεικόνισης στο σημειωματάριο Python.

Note

Οι ρυθμίσεις παραμέτρων του γραφήματος θα διατηρηθούν στο σημειωματάριο Python, το οποίο σημαίνει ότι μετά την επανάληψη του κελιού κώδικα, εάν το σχήμα πλαισίου δεδομένων προορισμού δεν έχει αλλάξει, τα αποθηκευμένα γραφήματα εξακολουθούν να διατηρούνται.

Κώδικας intelliSense

Το σημειωματάριο Python χρησιμοποιεί επίσης την Pylance ως διακομιστή γλωσσών. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα βελτιώσετε την ανάπτυξη Python με το Pylance.

Δυνατότητες επιστήμης δεδομένων

Επισκεφθείτε τεκμηρίωση της Επιστήμης δεδομένων στο Microsoft Fabric για να μάθετε περισσότερα σχετικά με την επιστήμη των δεδομένων και την εμπειρία AI στο Fabric. Εδώ παραθέτουμε μερικές βασικές δυνατότητες της επιστήμης δεδομένων που υποστηρίζονται εγγενώς στο σημειωματάριο Python.

  • Data Wrangler: Το Data Wrangler είναι ένα εργαλείο που βασίζεται σε φορητό υπολογιστή που παρέχει μια καθηλωτική διεπαφή για ανάλυση δεδομένων εξερεύνησης. Αυτή η δυνατότητα συνδυάζει μια εμφάνιση δεδομένων τύπου πλέγματος με δυναμικά συνοπτικά στατιστικά στοιχεία, ενσωματωμένες απεικονίσεις και μια βιβλιοθήκη συνήθων λειτουργιών εκκαθάρισης δεδομένων. Παρέχει εκκαθάριση δεδομένων, μετασχηματισμό δεδομένων και ενοποίηση, το οποίο επιταχύνει την προετοιμασία δεδομένων με το Data Wrangler.

  • MLflow: Ένα πείραμα μηχανικής μάθησης είναι η κύρια μονάδα οργάνωσης και ελέγχου για όλες τις σχετικές εκτελέσεις μηχανικής μάθησης. Μια εκτέλεση αντιστοιχεί σε μία μόνο εκτέλεση κώδικα μοντέλου.

  • αυτόματης καταγραφής Fabric: Η επιστήμη δεδομένων Synapse στο Microsoft Fabric περιλαμβάνει αυτόματη καταγραφή, η οποία μειώνει σημαντικά την ποσότητα κώδικα που απαιτείται για την αυτόματη καταγραφή των παραμέτρων, των μετρικών και των στοιχείων ενός μοντέλου εκμάθησης μηχανής κατά τη διάρκεια της εκπαίδευσης.

    Η αυτόματη καταχώρηση επεκτείνει τις δυνατότητες παρακολούθησης ροής ML. Η αυτόματη καταγραφή μπορεί να καταγράψει διάφορα μετρικά, όπως την ακρίβεια, την απώλεια, τη βαθμολογία F1 και τα προσαρμοσμένα μετρικά που καθορίζετε. Με τη χρήση της αυτόματης καταγραφής, οι προγραμματιστές και οι επιστήμονες δεδομένων μπορούν εύκολα να παρακολουθούν και να συγκρίνουν τις επιδόσεις διαφορετικών μοντέλων και πειραμάτων χωρίς μη αυτόματη παρακολούθηση.

  • Copilot: Το Copilot για σημειωματάρια Data Science και Data Engineering είναι ένας βοηθός AI που σας βοηθά να αναλύετε και να οπτικοποιείτε δεδομένα. Λειτουργεί με πίνακες lakehouse, σύνολα δεδομένων Power BI και πλαίσια δεδομένων pandas/spark, παρέχοντας απαντήσεις και τμήματα κώδικα απευθείας στο σημειωματάριο. Μπορείτε να χρησιμοποιήσετε τον πίνακα συνομιλίας Copilot και τα μαγικά Char στο σημειωματάριο και η τεχνητή νοημοσύνη παρέχει απαντήσεις ή κώδικα για αντιγραφή στο σημειωματάριό σας.

Γνωστοί περιορισμοί

  • Η εμπειρία ζωντανής πισίνας δεν είναι εγγυημένη για κάθε εκτέλεση σημειωματάριου python. Ο χρόνος έναρξης περιόδου λειτουργίας μπορεί να χρειαστεί έως και 3 λεπτά εάν η εκτέλεση του σημειωματάριου δεν μεταβεί στο δυναμικό χώρο συγκέντρωσης. Καθώς αυξάνεται η χρήση του σημειωματάριου Python, οι έξυπνες μέθοδοι συγκέντρωσης αυξάνουν σταδιακά την εκχώρηση του δυναμικού χώρου συγκέντρωσης ώστε να ικανοποιεί τη ζήτηση.

  • Η ενοποίηση περιβάλλοντος δεν είναι διαθέσιμη στο σημειωματάριο Python.

  • Το χρονικό όριο περιόδου λειτουργίας δεν είναι διαθέσιμο προς το παρόν.

  • Το Copilot μπορεί να δημιουργήσει μια πρόταση Spark, η οποία μπορεί να μην είναι εκτελέσιμη στο σημειωματάριο Python.

  • Προς το παρόν, το Copilot στο σημειωματάριο Python δεν υποστηρίζεται πλήρως σε πολλές περιοχές. Η διαδικασία ανάπτυξης παραμένει σε συνεχή βάση, καθώς συνεχίζουμε να προσφέρουμε υποστήριξη σε περισσότερες περιοχές.