Κοινοποίηση μέσω


Εκμάθηση Lakehouse: Πρόσληψη δεδομένων στο lakehouse

Σε αυτό το εκπαιδευτικό βοήθημα, θα αποκτήσετε πιο διαστατικούς πίνακες και πίνακες δεδομένων από τους εισαγωγείς του Wide World (WWI) στο lakehouse.

Προαπαιτούμενα στοιχεία

Λήψη δεδομένων

Σε αυτή την ενότητα, θα χρησιμοποιήσετε τη δραστηριότητα Αντιγραφή δεδομένων της διοχέτευσης Data Factory για την πρόσληψη δείγματος δεδομένων από έναν λογαριασμό χώρου αποθήκευσης Azure στην ενότητα Αρχεία της λίμνης που δημιουργήσατε προηγουμένως.

  1. Επιλέξτε Χώροι εργασίας στο αριστερό παράθυρο περιήγησης και, στη συνέχεια, επιλέξτε τον νέο χώρο εργασίας σας από το μενού Χώροι εργασίας. Εμφανίζεται η προβολή στοιχείων του χώρου εργασίας σας.

  2. Από την επιλογή Νέο στοιχείο στην κορδέλα του χώρου εργασίας, επιλέξτε Διοχέτευση.

  3. Στο παράθυρο διαλόγου Νέα διοχέτευση, καθορίστε το όνομα ως IngestDataFromSourceToLakehouse και επιλέξτε Δημιουργία.

  4. Από τη διοχέτευση που μόλις δημιουργήσατε, επιλέξτε Δραστηριότητα διοχέτευσης για να προσθέσετε μια δραστηριότητα στη διοχέτευση και επιλέξτε Αντιγραφή δεδομένων. Αυτή η ενέργεια προσθέτει δραστηριότητα αντιγραφής δεδομένων στον καμβά διοχέτευσης.

    Στιγμιότυπο οθόνης που δείχνει πού μπορείτε να επιλέξετε Δραστηριότητα διοχέτευσης και Αντιγραφή δεδομένων.

  5. Επιλέξτε τη δραστηριότητα αντιγραφής δεδομένων που προστέθηκε πρόσφατα από τον καμβά. Οι ιδιότητες δραστηριότητας εμφανίζονται σε ένα τμήμα παραθύρου κάτω από τον καμβά (ίσως χρειαστεί να επεκτείνετε το παράθυρο προς τα επάνω σύροντας το επάνω άκρο). Από την καρτέλα Γενικά στο παράθυρο ιδιοτήτων, πληκτρολογήστε Αντιγραφή δεδομένων στο Lakehouse στο πεδίο Όνομα . Αφήστε τις υπόλοιπες ιδιότητες στις προεπιλεγμένες τιμές τους.

    Στιγμιότυπο οθόνης που δείχνει πού μπορείτε να προσθέσετε το όνομα της δραστηριότητας αντιγραφής στην καρτέλα Γενικά.

  6. Από την καρτέλα Προέλευση της επιλεγμένης δραστηριότητας αντιγραφής δεδομένων, ανοίξτε το πεδίο Σύνδεση και επιλέξτε Αναζήτηση όλων. Επιλέξτε αναδυόμενο παράθυρο προέλευσης δεδομένων, αναζητήστε και επιλέξτε blob Azure. Για αυτό το πρόγραμμα εκμάθησης, όλα τα δείγματα δεδομένων είναι διαθέσιμα σε ένα δημόσιο κοντέινερ του χώρου αποθήκευσης αντικειμένων blob Azure. Μπορείτε να συνδεθείτε σε αυτό το κοντέινερ για να αντιγράψετε δεδομένα από αυτό.

  7. Εισαγάγετε τις ακόλουθες λεπτομέρειες στο παράθυρο Ρυθμίσεις σύνδεσης και επιλέξτε Σύνδεση για να δημιουργήσετε τη σύνδεση με την προέλευση δεδομένων.

    Ιδιότητα Τιμή
    Όνομα λογαριασμού ή διεύθυνση URL https://fabrictutorialdata.blob.core.windows.net/sampledata/
    Connection Δημιουργία νέας σύνδεσης
    Όνομα σύνδεσης wwisampledata
    Είδος ελέγχου ταυτότητας Ανώνυμο

    Στιγμιότυπο οθόνης που δείχνει πού μπορείτε να επιλέξετε σύνδεση αποθήκευσης blob.

  8. Μόλις δημιουργηθεί η νέα σύνδεση, επιστρέψτε στην καρτέλα Προέλευση της δραστηριότητας αντιγραφής δεδομένων και η σύνδεση που δημιουργήθηκε πρόσφατα επιλέγεται από προεπιλογή. Καθορίστε τις ακόλουθες ιδιότητες πριν μεταβείτε στις ρυθμίσεις προορισμού.

    Ιδιότητα Τιμή
    Connection wwisampledata
    Τύπος διαδρομής αρχείου Διαδρομή αρχείου
    Διαδρομή αρχείου Όνομα περιέκτη (πρώτο πλαίσιο κειμένου): sampledata
    Όνομα καταλόγου (δεύτερο πλαίσιο κειμένου): WideWorldImportersDW/parquet
    Αναδρομικά Επιλεγμένο
    Μορφή αρχείου Binary

    Στιγμιότυπο οθόνης που εμφανίζει τις ρυθμίσεις σύνδεσης αποθήκευσης αντικειμένων blob.

  9. Από την καρτέλα Προορισμός της επιλεγμένης δραστηριότητας αντιγραφής δεδομένων, καθορίστε τις ακόλουθες ιδιότητες:

    Ιδιότητα Τιμή
    Connection Wwilakehouse (Επιλέξτε το Lakehouse σας αν το ονομάσατε διαφορετικά)
    Ριζικός φάκελος Αρχεία
    Διαδρομή αρχείου Όνομα καταλόγου (πρώτο πλαίσιο κειμένου): wwi-raw-data
    Μορφή αρχείου Binary

    Στιγμιότυπο οθόνης της καρτέλας προορισμού, που δείχνει πού μπορείτε να εισαγάγετε συγκεκριμένες λεπτομέρειες.

  10. Έχετε ρυθμίσει τις παραμέτρους της δραστηριότητας αντιγραφής δεδομένων. Επιλέξτε το εικονίδιο Αποθήκευση στην επάνω κορδέλα (κάτω από την Αρχική σελίδα) για να αποθηκεύσετε τις αλλαγές σας και επιλέξτε Εκτέλεση για να εκτελέσετε τη διοχέτευση και τη δραστηριότητά της. Μπορείτε επίσης να προγραμματίσετε αγωγούς για την ανανέωση δεδομένων σε καθορισμένα χρονικά διαστήματα για να ικανοποιήσετε τις απαιτήσεις της επιχείρησής σας. Για αυτό το σεμινάριο, εκτελούμε τη διοχέτευση μόνο μία φορά επιλέγοντας Εκτέλεση.

  11. Αυτή η ενέργεια ενεργοποιεί την αντιγραφή δεδομένων από την υποκείμενη προέλευση δεδομένων στο καθορισμένο λιμναίο σπίτι και ενδέχεται να χρειαστεί έως και ένα λεπτό για να ολοκληρωθεί. Μπορείτε να παρακολουθείτε την εκτέλεση της διοχέτευσης και τη δραστηριότητά της στην καρτέλα Έξοδος. Η κατάσταση δραστηριότητας αλλάζει από Σε> ουράσε εξέλιξη>Με επιτυχία.

    Στιγμιότυπο οθόνης που δείχνει πού να επιλέξετε Αποθήκευση και εκτέλεση της διοχέτευσης.

  12. Αφού η δραστηριότητα αντιγραφής είναι επιτυχής, ανοίξτε το lakehouse (wwilakehouse) για να προβάλετε τα δεδομένα. Ανανεώστε την ενότητα Αρχεία για να δείτε τα δεδομένα που έχουν ληφθεί. Ένας νέος φάκελος wwi-raw-data εμφανίζεται στην ενότητα αρχείων και τα δεδομένα από πίνακες αντικειμένων blob Azure αντιγράφονται εκεί.

    Στιγμιότυπο οθόνης που εμφανίζει δεδομένα blob που έχουν αντιγραφεί στο lakehouse προορισμού.

Επόμενο βήμα