Κοινοποίηση μέσω


Εξερεύνηση δεδομένων στη βάση δεδομένων κατοπτρισμού με σημειωματάρια

Μπορείτε να εξερευνήσετε τα δεδομένα που αναπαράγονται από τη βάση δεδομένων κατοπτρισμού με ερωτήματα Spark σε σημειωματάρια.

Τα σημειωματάρια είναι ένα ισχυρό στοιχείο κώδικα για να αναπτύξετε εργασίες Apache Spark και πειράματα μηχανικής εκμάθησης στα δεδομένα σας. Μπορείτε να χρησιμοποιήσετε σημειωματάρια στο Fabric Lakehouse για να εξερευνήσετε τα τραπέζια με καθρέφτες.

Προαπαιτούμενα

Δημιουργία συντόμευσης

Πρέπει πρώτα να δημιουργήσετε μια συντόμευση από τους κατοπτρικούς πίνακές σας στο Lakehouse και, στη συνέχεια, να δημιουργήσετε σημειωματάρια με ερωτήματα Spark στο Lakehouse σας.

  1. Στην πύλη Fabric, ανοίξτε το Data Engineering.

  2. Εάν δεν έχετε δημιουργήσει ήδη ένα Lakehouse, επιλέξτε Lakehouse και δημιουργήστε ένα νέο Lakehouse δίνοντάς του ένα όνομα.

  3. Επιλέξτε Λήψη δεδομένων ->Νέα συντόμευση.

  4. Επιλέξτε Microsoft OneLake.

  5. Μπορείτε να δείτε όλες τις κατοπτρισμένες βάσεις δεδομένων σας στον χώρο εργασίας Fabric.

  6. Επιλέξτε τη βάση δεδομένων κατοπτρισμού που θέλετε να προσθέσετε στο Lakehouse σας, ως συντόμευση.

  7. Επιλέξτε τους επιθυμητούς πίνακες από τη βάση δεδομένων ειδώλου.

  8. Επιλέξτε Επόμενο και, στη συνέχεια, Δημιουργία.

  9. Στον Explorer, μπορείτε πλέον να δείτε επιλεγμένα δεδομένα πίνακα στο Lakehouse σας. Στιγμιότυπο οθόνης από την πύλη Fabric, που δείχνει τον Lakehouse Explorer να εμφανίζει τους πίνακες και τα δεδομένα της βάσης δεδομένων κατοπτρισμού.

    Φιλοδώρημα

    Μπορείτε να προσθέσετε άλλα δεδομένα απευθείας στο Lakehouse ή να φέρετε συντομεύσεις όπως S3, ADLS Gen2. Μπορείτε να πλοηγηθείτε στο τελικό σημείο ανάλυσης SQL του Lakehouse και να ενώσετε τα δεδομένα σε όλες αυτές τις πηγές με κατοπτρισμένα δεδομένα απρόσκοπτα.

  10. Για να εξερευνήσετε αυτά τα δεδομένα στο Spark, επιλέξτε τις ... κουκκίδες δίπλα σε οποιονδήποτε πίνακα. Επιλέξτε Νέο σημειωματάριο ή Υπάρχον σημειωματάριο για να ξεκινήσει η ανάλυση. Στιγμιότυπο οθόνης από την πύλη Fabric που εμφανίζει το μενού περιβάλλοντος για να ανοίξετε έναν κατοπτριζόμενο πίνακα βάσης δεδομένων σε ένα σημειωματάριο.

  11. Το σημειωματάριο θα ανοίξει αυτόματα και θα φορτώσει το πλαίσιο δεδομένων με ένα SELECT ... LIMIT 1000 ερώτημα Spark SQL.

    • Οι νέοι φορητοί υπολογιστές μπορεί να χρειαστούν έως και δύο λεπτά για να φορτωθούν πλήρως. Μπορείτε να αποφύγετε αυτήν την καθυστέρηση χρησιμοποιώντας ένα υπάρχον σημειωματάριο με ενεργή περίοδο λειτουργίας. Στιγμιότυπο οθόνης από την πύλη Fabric που εμφανίζει δεδομένα από έναν κατοπτριζόμενο πίνακα βάσης δεδομένων σε ένα νέο σημειωματάριο με ένα ερώτημα Spark SQL.