Menjelajahi data di database cermin Anda dengan buku catatan
Anda dapat menjelajahi data yang direplikasi dari database cermin Anda dengan kueri Spark di buku catatan.
Notebook adalah item kode yang kuat bagi Anda untuk mengembangkan pekerjaan Apache Spark dan eksperimen pembelajaran mesin pada data Anda. Anda dapat menggunakan notebook di Fabric Lakehouse untuk menjelajahi tabel cermin Anda.
Prasyarat
- Selesaikan tutorial untuk membuat database cermin dari database sumber Anda.
Membuat pintasan
Pertama-tama Anda perlu membuat pintasan dari tabel cermin Anda ke Lakehouse, lalu membuat buku catatan dengan kueri Spark di Lakehouse Anda.
Di portal Fabric, buka Rekayasa Data.
Jika Anda belum memiliki Lakehouse yang dibuat, pilih Lakehouse dan buat Lakehouse baru dengan memberinya nama.
Pilih Dapatkan Data ->Pintasan baru.
Pilih Microsoft OneLake.
Anda dapat melihat semua database cermin Anda di ruang kerja Fabric.
Pilih database cermin yang ingin Anda tambahkan ke Lakehouse Anda, sebagai pintasan.
Pilih tabel yang diinginkan dari database cermin.
Pilih Berikutnya, lalu Buat.
Di Explorer, Anda sekarang dapat melihat data tabel yang dipilih di Lakehouse Anda.
Tip
Anda dapat menambahkan data lain di Lakehouse secara langsung atau membawa pintasan seperti S3, ADLS Gen2. Anda dapat menavigasi ke titik akhir analitik SQL Lakehouse dan menggabungkan data di semua sumber ini dengan data yang dicerminkan dengan mulus.
Untuk menjelajahi data ini di Spark, pilih titik di
...
samping tabel apa pun. Pilih Buku catatan baru atau Buku catatan yang Sudah Ada untuk memulai analisis.Notebook akan terbuka secara otomatis dan memuat dataframe dengan
SELECT ... LIMIT 1000
kueri Spark SQL.