Buka Akses: Gunakan alur untuk menyerap data ke OneLake dan menganalisis dengan Azure Databricks

Penting

Microsoft Fabric saat ini dalam PRATINJAU. Informasi ini berkaitan dengan produk prarilis yang mungkin dimodifikasi secara substansial sebelum dirilis. Microsoft tidak memberikan jaminan, dinyatakan atau tersirat, sehubungan dengan informasi yang diberikan di sini.

Dalam panduan ini, Anda akan:

  • Membuat alur di ruang kerja dan menyerap data ke oneLake dalam format delta
  • Menganalisis tabel delta di OneLake menggunakan Azure Databricks

Prasyarat

  • Ruang kerja dengan item lakehouse.
  • Ruang kerja Azure Databricks premium. Hanya ruang kerja Azure Databricks premium yang mendukung Microsoft Azure Active Directory passthrough kredensial. Saat membuat kluster Anda, aktifkan Azure Data Lake Storage passthrough kredensial di Opsi Tingkat Lanjut.
  • Himpunan data sampel.

Langkah-langkah

  1. Navigasi ke lakehouse Anda di layanan Power BI dan pilih Dapatkan Data lalu pilih Alur data baru.

    Cuplikan layar memperlihatkan cara menavigasi ke opsi alur data baru dari dalam UI.

  2. Di perintah Alur Baru, masukkan nama untuk alur baru lalu pilih Buat.

  3. Untuk latihan ini, pilih Taksi NYC - Data sampel hijau sebagai sumber data. Pilih Berikutnya setelah himpunan data sampel dipilih.

    Cuplikan layar memperlihatkan cara memilih himpunan data sampel NYC.

  4. Pilih Berikutnya lagi di layar pratinjau.

  5. Untuk tujuan data, pilih nama lakehouse tempat Anda ingin menyimpan data di OneLake sebagai tabel delta. Anda dapat memilih lakehouse yang ada atau membuat lakehouse baru.

    Cuplikan layar memperlihatkan cara memilih lakehouse tujuan.

  6. Pilih tempat Anda ingin menyimpan output. Pilih Tabel sebagai folder Akar dan masukkan 'nycsample' sebagai nama tabel.

  7. Di layar Tinjau + Simpan, pilih Segera mulai transfer data lalu pilih Simpan + Jalankan.

    Cuplikan layar memperlihatkan cara memasukkan nama tabel.

  8. Setelah pekerjaan selesai, navigasikan ke lakehouse Anda dan lihat tabel delta yang tercantum di bawah /Tables.

  9. Salin jalur abfs ke tabel delta Anda dengan mengklik kanan nama tabel dalam tampilan Explorer dan memilih Properti.

  10. Buka buku catatan Azure Databricks Anda. Baca tabel delta di OneLake.

    olsPath = "abfss://<replace with workspace name>@onelake.dfs.fabric.microsoft.com/<replace with item name>.Lakehouse/Tables/nycsample" 
    df=spark.read.format('delta').option("inferSchema","true").load(olsPath)
    df.show(5)
    
  11. Perbarui data dalam tabel delta di OneLake dengan memperbarui nilai bidang dalam tabel delta.

    %sql
    update delta.`abfss://<replace with workspace name>@onelake.dfs.fabric.microsoft.com/<replace with item name>.Lakehouse/Tables/nycsample` set vendorID = 99999 where vendorID = 1;
    

Ringkasan

Dalam panduan ini, Anda menyerap data ke OneLake menggunakan pengalaman alur dan membuat tabel delta. Tabel delta di OneLake kemudian dibaca dan dimodifikasi melalui Azure Databricks.