Bagikan melalui


Menjelajahi data di database cermin Anda dengan buku catatan

Anda dapat menjelajahi data yang direplikasi dari database cermin Anda dengan kueri Spark di buku catatan.

Notebook adalah item kode yang kuat bagi Anda untuk mengembangkan pekerjaan Apache Spark dan eksperimen pembelajaran mesin pada data Anda. Anda dapat menggunakan notebook di Fabric Lakehouse untuk menjelajahi tabel cermin Anda.

Prasyarat

Membuat pintasan

Pertama-tama Anda perlu membuat pintasan dari tabel cermin Anda ke Lakehouse, lalu membuat buku catatan dengan kueri Spark di Lakehouse Anda.

  1. Di portal Fabric, buka Rekayasa Data.

  2. Jika Anda belum memiliki Lakehouse yang dibuat, pilih Lakehouse dan buat Lakehouse baru dengan memberinya nama.

  3. Pilih Dapatkan Data ->Pintasan baru.

  4. Pilih Microsoft OneLake.

  5. Anda dapat melihat semua database cermin Anda di ruang kerja Fabric.

  6. Pilih database cermin yang ingin Anda tambahkan ke Lakehouse Anda, sebagai pintasan.

  7. Pilih tabel yang diinginkan dari database cermin.

  8. Pilih Berikutnya, lalu Buat.

  9. Di Explorer, Anda sekarang dapat melihat data tabel yang dipilih di Lakehouse Anda. Cuplikan layar dari portal Fabric, memperlihatkan Lakehouse Explorer yang menampilkan tabel dan data database cermin.

    Tip

    Anda dapat menambahkan data lain di Lakehouse secara langsung atau membawa pintasan seperti S3, ADLS Gen2. Anda dapat menavigasi ke titik akhir analitik SQL Lakehouse dan menggabungkan data di semua sumber ini dengan data yang dicerminkan dengan mulus.

  10. Untuk menjelajahi data ini di Spark, pilih titik di ... samping tabel apa pun. Pilih Buku catatan baru atau Buku catatan yang Sudah Ada untuk memulai analisis. Cuplikan layar dari portal Fabric memperlihatkan menu konteks untuk membuka tabel database cermin di buku catatan.

  11. Notebook akan terbuka secara otomatis dan memuat dataframe dengan SELECT ... LIMIT 1000 kueri Spark SQL.

    • Notebook baru dapat memakan waktu hingga dua menit untuk dimuat sepenuhnya. Anda dapat menghindari penundaan ini dengan menggunakan notebook yang sudah ada dengan sesi aktif. Cuplikan layar dari portal Fabric memperlihatkan data dari tabel database cermin di buku catatan baru dengan kueri Spark SQL.