Tutorial Lakehouse: Membuat lakehouse, menyerap data sampel, dan membuat laporan

Dalam tutorial ini, Anda membangun lakehouse, menyerap data sampel ke dalam tabel delta, menerapkan transformasi jika diperlukan, lalu membuat laporan.

Prasyarat

Membuat lakehouse

  1. Di layanan Power BI, pilih Ruang Kerja dari menu sebelah kiri.

  2. Untuk membuka ruang kerja Anda, masukkan namanya di kotak teks pencarian yang terletak di bagian atas dan pilih dari hasil pencarian.

  3. Dari pengalih pengalaman yang terletak di kiri bawah, pilih Rekayasa Data.

    Cuplikan layar memperlihatkan tempat memilih pengalih pengalaman dan Rekayasa Data.

  4. Di tab Rekayasa Data, pilih Lakehouse untuk membuat lakehouse.

  5. Dalam kotak dialog New lakehouse , masukkan wwilakehouse di bidang Nama .

    Cuplikan layar kotak dialog New lakehouse.

  6. Pilih Buat untuk membuat dan membuka lakehouse baru.

Menyerap data sampel

Catatan

Jika Anda tidak memiliki OneDrive yang dikonfigurasi, daftar untuk uji coba gratis Microsoft 365: Uji Coba Gratis - Coba Microsoft 365 selama sebulan.

  1. Unduh file dimension_customer.csv dari repositori sampel Fabric.

  2. Di penjelajah Lakehouse, Anda melihat opsi untuk memuat data ke lakehouse. Pilih Aliran Data Baru Gen2.

    Cuplikan layar memperlihatkan tempat memilih opsi Aliran Data Baru Gen2 untuk memuat data ke lakehouse Anda.

  3. Pada panel aliran data baru, pilih Impor dari file Teks/CSV.

  4. Pada panel Koneksi ke sumber data, pilih tombol radio Unggah file. Seret dan letakkan file dimension_customer.csv yang Anda unduh di langkah 1. Setelah file diunggah, pilih Berikutnya.

    Cuplikan layar memperlihatkan tempat memilih Unggah file dan tempat untuk menyeret file yang diunduh sebelumnya.

  5. Dari halaman Pratinjau data file, pratinjau data dan pilih Buat untuk melanjutkan dan kembali ke kanvas aliran data.

  6. Di panel Pengaturan kueri, perbarui bidang Nama ke dimension_customer.

    Catatan

    Fabric menambahkan spasi dan angka di akhir nama tabel secara default. Nama tabel harus huruf kecil dan tidak boleh berisi spasi. Ganti namanya dengan tepat dan hapus spasi apa pun dari nama tabel.

    Cuplikan layar panel pengaturan kueri, memperlihatkan tempat memasukkan nama dan memilih tujuan data.

  7. Dalam tutorial ini, Anda telah mengaitkan data pelanggan ke lakehouse. Jika Anda memiliki item data lain yang ingin Anda kaitkan dengan lakehouse dapat menambahkannya dengan langkah-langkah berikut:

    • Dari item menu, pilih Tambahkan tujuan data dan pilih Lakehouse. Dari layar Koneksi ke tujuan data, masuk ke akun Anda jika perlu dan pilih Berikutnya.

    • Navigasi ke wwilakehouse di ruang kerja Anda.

    • Jika tabel dimension_customer tidak ada, pilih pengaturan Tabel baru dan masukkan nama tabel dimension_customer. Jika tabel sudah ada, pilih pengaturan Tabel yang sudah ada dan pilih dimension_customer dari daftar tabel di penjelajah objek. Pilih Selanjutnya.

      Cuplikan layar memperlihatkan cara memilih tabel tujuan.

    • Pada panel Pilih pengaturan tujuan, pilih Ganti sebagai Metode pembaruan. Pilih Simpan pengaturan untuk kembali ke kanvas aliran data.

  8. Dari kanvas aliran data, Anda dapat dengan mudah mengubah data berdasarkan kebutuhan bisnis Anda. Untuk kesederhanaan, kami tidak membuat perubahan apa pun dalam tutorial ini. Untuk melanjutkan, pilih Terbitkan di kanan bawah layar.

    Cuplikan layar panel Pengaturan kueri yang berisi tombol Terbitkan.

  9. Lingkaran berputar di samping nama aliran data menunjukkan penerbitan sedang berlangsung dalam tampilan item. Saat penerbitan selesai, pilih ... dan pilih Properti. Ganti nama aliran data menjadi Load Lakehouse Table dan pilih Simpan.

  10. Pilih opsi Refresh sekarang di samping nama aliran data untuk merefresh aliran data. Ini menjalankan aliran data dan memindahkan data dari file sumber ke tabel lakehouse. Saat sedang berlangsung, Anda akan melihat lingkaran berputar di bawah Kolom yang disegarkan dalam tampilan item.

    Cuplikan layar memperlihatkan tempat menemukan ikon Refresh sekarang.

  11. Setelah aliran data disegarkan, pilih lakehouse baru Anda di panel navigasi kiri untuk melihat tabel delta dimension_customer .

    Cuplikan layar panel navigasi tempat lakehouse dibuka.

  12. Pilih tabel untuk mempratinjau datanya. Anda juga dapat menggunakan titik akhir analitik SQL lakehouse untuk mengkueri data dengan pernyataan SQL. Pilih titik akhir analitik SQL dari menu drop-down Lakehouse di kanan atas layar.

    Cuplikan layar tabel delta, memperlihatkan tempat untuk memilih titik akhir analitik SQL.

  13. Pilih tabel dimension_customer untuk mempratinjau datanya atau pilih Kueri SQL baru untuk menulis pernyataan SQL Anda.

    Cuplikan layar titik akhir analitik SQL, memperlihatkan tempat untuk memilih Kueri SQL Baru.

  14. Contoh kueri berikut mengagregasi jumlah baris berdasarkan kolom BuyingGroup dari tabel dimension_customer . File kueri SQL disimpan secara otomatis untuk referensi di masa mendatang, dan Anda dapat mengganti nama atau menghapus file-file ini berdasarkan kebutuhan Anda.

    Untuk menjalankan skrip, pilih ikon Jalankan di bagian atas file skrip.

    SELECT BuyingGroup, Count(*) AS Total
    FROM dimension_customer
    GROUP BY BuyingGroup
    

Membuat laporan

  1. Sebelumnya semua tabel dan tampilan lakehouse secara otomatis ditambahkan ke model semantik. Dengan pembaruan terbaru, untuk lakehouse baru, Anda harus menambahkan tabel Anda secara manual ke model semantik. Dari tab Pelaporan lakehouse, pilih Kelola model semantik default dan pilih tabel yang ingin Anda tambahkan ke model semantik. Dalam hal ini, pilih tabel dimension_customer .

    Cuplikan layar tempat Anda dapat memilih tabel untuk ditambahkan ke model semantik.

  2. Untuk memastikan bahwa tabel dalam model semantik selalu sinkron, beralihlah ke tampilan titik akhir analitik SQL dan buka panel pengaturan lakehouse. Pilih Pengaturan model semantik Power BI default dan aktifkan Sinkronkan model semantik Power BI default. Untuk informasi selengkapnya, lihat Model semantik Power BI default

    Cuplikan layar memperlihatkan cara mengaktifkan sinkronisasi data ke model semantik default

  3. Setelah tabel ditambahkan, model semantik dengan nama yang sama dengan lakehouse dibuat.

    Cuplikan layar memperlihatkan model semantik default yang dibuat saat lakehouse baru dibuat.

  4. Dari panel model semantik, Anda bisa menampilkan semua tabel. Anda memiliki opsi untuk membuat laporan baik dari awal, laporan paginasi, atau biarkan Power BI membuat laporan secara otomatis berdasarkan data Anda. Untuk tutorial ini, di bawah Jelajahi data ini, pilih Buat laporan secara otomatis. Dalam tutorial berikutnya, kami membuat laporan dari awal.

    Cuplikan layar halaman detail model semantik, memperlihatkan tempat untuk memilih Buat laporan.

  5. Karena tabel adalah dimensi dan tidak ada ukuran di dalamnya, Power BI membuat ukuran untuk jumlah baris dan menggabungkannya di berbagai kolom, dan membuat bagan yang berbeda seperti yang diperlihatkan dalam gambar berikut. Anda bisa menyimpan laporan ini untuk masa mendatang dengan memilih Simpan dari pita atas. Anda dapat membuat lebih banyak perubahan pada laporan ini untuk memenuhi persyaratan Anda dengan menyertakan atau mengecualikan tabel atau kolom lain.

    Cuplikan layar halaman Ringkasan cepat menampilkan empat bagan batang yang berbeda.

Langkah selanjutnya