Ανάγνωση στα Αγγλικά

Κοινή χρήση μέσω


Εκμάθηση: Χρήση σημειωματάριου με Apache Spark για υποβολή ερωτήματος σε βάση δεδομένων KQL

Τα σημειωματάρια είναι ευανάγνωστα έγγραφα που περιέχουν περιγραφές ανάλυσης δεδομένων και αποτελέσματα και εκτελέσιμα έγγραφα που μπορούν να εκτελεστούν για την εκτέλεση ανάλυσης δεδομένων. Σε αυτό το άρθρο, θα μάθετε πώς μπορείτε να χρησιμοποιήσετε ένα σημειωματάριο Microsoft Fabric για την ανάγνωση και εγγραφή δεδομένων σε μια βάση δεδομένων KQL χρησιμοποιώντας το Apache Spark. Αυτό το εκπαιδευτικό βοήθημα χρησιμοποιεί προκαθορισμένα σύνολα δεδομένων και σημειωματάρια τόσο στην ευφυΐα σε πραγματικό χρόνο όσο και στα περιβάλλοντα διαχείρισης δεδομένων στο Microsoft Fabric. Για περισσότερες πληροφορίες σχετικά με τα σημειωματάρια, ανατρέξτε στο θέμα Τρόπος χρήσης σημειωματάριων Microsoft Fabric.

Πιο συγκεκριμένα, θα μάθετε πώς μπορείτε να κάνετε τα εξής:

  • Δημιουργία βάσης δεδομένων KQL
  • Εισαγωγή σημειωματάριου
  • Εγγραφή δεδομένων σε μια βάση δεδομένων KQL με χρήση του Apache Spark
  • Υποβολή ερωτημάτων για δεδομένα από μια βάση δεδομένων KQL

Προαπαιτούμενα στοιχεία

1- Δημιουργία βάσης δεδομένων KQL

  1. Επιλέξτε τον χώρο εργασίας σας από την αριστερή γραμμή περιήγησης.

  2. Ακολουθήστε ένα από αυτά τα βήματα για να αρχίσετε να δημιουργείτε μια ροή συμβάντων:

    • Επιλέξτε νέου στοιχείου και, στη συνέχεια, Eventhouse . Στο πεδίο όνομα υπηρεσίας , πληκτρολογήστε nycGreenTaxiκαι, στη συνέχεια, επιλέξτε Δημιουργία. Μια βάση δεδομένων KQL δημιουργείται με το ίδιο όνομα.
    • Σε μια υπάρχουσα ενότητα συμβάντων, επιλέξτε Βάσεις δεδομένων. Στην περιοχή βάσεις δεδομένων KQL επιλέξτε , στο πεδίο όνομα βάσης δεδομένων KQL , πληκτρολογήστε nycGreenTaxiκαι, στη συνέχεια, επιλέξτε Δημιουργία.
  3. Αντιγράψτε το URI ερωτήματος από την κάρτα λεπτομερειών βάσης δεδομένων στον πίνακα εργαλείων βάσης δεδομένων και επικολλήστε το κάπου, όπως σε ένα σημειωματάριο, για χρήση σε μεταγενέστερο βήμα.

     Στιγμιότυπο οθόνης της κάρτας λεπτομερειών βάσης δεδομένων που εμφανίζει τις λεπτομέρειες της βάσης δεδομένων. Επισημαίνεται η επιλογή URI ερωτήματος με τίτλο Αντιγραφή URI.

2- Λήψη του σημειωματάριου NYC GreenTaxi

Δημιουργήσαμε ένα δείγμα σημειωματάριου που σας καθοδηγεί σε όλα τα απαραίτητα βήματα για τη φόρτωση δεδομένων στη βάση δεδομένων σας, χρησιμοποιώντας τη σύνδεση Spark.

  1. Ανοίξτε το αποθετήριο δειγμάτων Fabric στο GitHub για να κάνετε λήψη του σημειωματάριου NYC GreenTaxi KQL.

    Στιγμιότυπο οθόνης του αποθετηρίου GitHub που εμφανίζει το σημειωματάριο NYC GreenTaxi. Επισημαίνεται η επιλογή Ανεπεξέργαστα.

  2. Αποθηκεύστε το σημειωματάριο τοπικά στη συσκευή σας.

    Σημείωση

    Το σημειωματάριο πρέπει να αποθηκευτεί στη .ipynb μορφή αρχείου.

3- Εισαγωγή του σημειωματάριου

Η υπόλοιπη ροή εργασιών πραγματοποιείται στην ενότητα Διαχείριση δεδομένων του προϊόντος και χρησιμοποιεί ένα σημειωματάριο Spark για τη φόρτωση και υποβολή ερωτημάτων σε δεδομένα στη βάση δεδομένων KQL.

  1. Από τον χώρο εργασίας σας, επιλέξτε Εισαγωγή>Σημειωματάριο>Από αυτόν τον υπολογιστή>Αποστολή, στη συνέχεια, επιλέξτε το σημειωματάριο NYC GreenTaxi που κατεβάσατε σε ένα προηγούμενο βήμα.

    Στιγμιότυπο οθόνης του παραθύρου

  2. Όταν ολοκληρωθεί η εισαγωγή, ανοίξτε το σημειωματάριο από τον χώρο εργασίας σας.

4- Λήψη δεδομένων

Για να υποβάλετε ερώτημα στη βάση δεδομένων σας χρησιμοποιώντας τη σύνδεση Spark, πρέπει να δώσετε πρόσβαση ανάγνωσης και εγγραφής στο κοντέινερ αντικειμένων blob NYC GreenTaxi.

Επιλέξτε το κουμπί αναπαραγωγής για να εκτελέσετε τα ακόλουθα κελιά ή επιλέξτε το κελί και πατήστε Shift+ Enter. Επαναλάβετε αυτό το βήμα για κάθε κελί κώδικα.

Σημείωση

Περιμένετε να εμφανιστεί το σημάδι ελέγχου ολοκλήρωσης πριν εκτελέσετε το επόμενο κελί.

  1. Εκτελέστε το ακόλουθο κελί για να ενεργοποιήσετε την πρόσβαση στο κοντέινερ αντικειμένων blob NYC GreenTaxi.

    Στιγμιότυπο οθόνης του πρώτου κελιού κώδικα που εμφανίζει πληροφορίες πρόσβασης στον χώρο αποθήκευσης.

  2. Στο KustoURI, επικολλήστε το URI ερωτήματος που αντιγράψατε προηγουμένως αντί για το κείμενο κράτησης θέσης.

  3. Αλλάξτε το όνομα της βάσης δεδομένων κράτησης θέσης σε nycGreenTaxi.

  4. Αλλάξτε το όνομα του πίνακα κράτησης θέσης σε GreenTaxiData.

    Στιγμιότυπο οθόνης του δεύτερου κελιού κώδικα που εμφανίζει τις πληροφορίες βάσης δεδομένων προορισμού. Επισημαίνονται το URI του ερωτήματος, το όνομα της βάσης δεδομένων και το όνομα του πίνακα.

  5. Εκτελέστε το κελί.

  6. Εκτελέστε το επόμενο κελί για να γράψετε δεδομένα στη βάση δεδομένων σας. Μπορεί να χρειαστούν μερικά λεπτά για να ολοκληρωθεί αυτό το βήμα.

    Στιγμιότυπο οθόνης τρίτου κελιού κώδικα που εμφανίζει αντιστοίχιση πίνακα και εντολή πρόσληψης.

Η βάση δεδομένων σας έχει πλέον δεδομένα φορτωμένα σε έναν πίνακα με την ονομασία GreenTaxiData.

5- Εκτέλεση του σημειωματάριου

Εκτελέστε διαδοχικά τα υπόλοιπα δύο κελιά για να υποβάλετε ερωτήματα για δεδομένα από τον πίνακά σας. Τα αποτελέσματα εμφανίζουν τους 20 κορυφαίους και χαμηλότερους ναύλους ταξί και τις αποστάσεις που καταγράφονται ανά έτος.

Στιγμιότυπο οθόνης του τέταρτου και πέμπτου κελιού κώδικα που εμφανίζει τα αποτελέσματα του ερωτήματος.

6- Εκκαθάριση πόρων

Εκκαθαρίστε τα στοιχεία που δημιουργήθηκαν μεταβαίνοντας στον χώρο εργασίας στον οποίο δημιουργήθηκαν.

  1. Στον χώρο εργασίας σας, τοποθετήστε τον δείκτη επάνω στο σημειωματάριο που θέλετε να διαγράψετε, επιλέξτε το μενού Περισσότερα [...] >Διαγράψτε το.

    Στιγμιότυπο οθόνης του χώρου εργασίας που εμφανίζει το αναπτυσσόμενο μενού του σημειωματάριου NYC GreenTaxi. Επισημαίνεται η επιλογή με τίτλο Διαγραφή.

  2. Επιλέξτε Διαγραφή. Δεν μπορείτε να ανακτήσετε το σημειωματάριό σας αφού το διαγράψετε.