Bagikan melalui


Mulai cepat: Membuat aliran data pertama Anda untuk mendapatkan dan mengubah data

Aliran data adalah teknologi persiapan data berbasis cloud, layanan mandiri. Dalam artikel ini, Anda membuat aliran data pertama, mendapatkan data untuk aliran data Anda, lalu mengubah data dan menerbitkan aliran data.

Prasyarat

Prasyarat berikut diperlukan sebelum Anda memulai:

  • Akun penyewa Microsoft Fabric dengan langganan aktif. Buat akun gratis.
  • Pastikan Anda memiliki Ruang Kerja yang diaktifkan Microsoft Fabric: Membuat ruang kerja.

Membuat aliran data

Di bagian ini, Anda membuat aliran data pertama Anda.

  1. Beralih ke pengalaman Pabrik data.

  2. Navigasi ke ruang kerja Microsoft Fabric Anda.

    Cuplikan layar jendela ruang kerja tempat Anda menavigasi ke ruang kerja Anda.

  3. Pilih Baru, lalu pilih Aliran Data Gen2.

    Cuplikan layar dengan pilihan Dataflow Gen2 ditekankan.

Dapatkan data

Mari kita mendapatkan beberapa data! Dalam contoh ini, Anda mendapatkan data dari layanan OData. Gunakan langkah-langkah berikut untuk mendapatkan data dalam aliran data Anda.

  1. Di editor aliran data, pilih Dapatkan data lalu pilih Lainnya.

    Cuplikan layar dengan opsi Dapatkan Data dipilih dan Lebih banyak ditekankan di kotak drop-down.

  2. Di Pilih sumber data, pilih Tampilkan lainnya.

    Cuplikan layar Dapatkan sumber data dengan Tampilan lebih ditekankan.

  3. Di Sumber baru, pilih >sebagai sumber data.

    Cuplikan layar Dapatkan sumber data dengan kategori Lain dan konektor OData ditekankan.

  4. Masukkan URL https://services.odata.org/v4/northwind/northwind.svc/, lalu pilih Berikutnya.

    Cuplikan layar sumber data OData tempat Anda memasukkan URL data.

  5. Pilih tabel Pesanan dan Pelanggan , lalu pilih Buat.

    Cuplikan layar navigator Power Query dengan tabel Pelanggan dan Pesanan ditekankan.

Anda dapat mempelajari selengkapnya tentang mendapatkan pengalaman dan fungsionalitas data di Mendapatkan gambaran umum data.

Menerapkan transformasi dan menerbitkan

Anda memuat data Anda ke aliran data pertama Anda sekarang. Selamat! Sekarang saatnya untuk menerapkan beberapa transformasi untuk membawa data ini ke dalam bentuk yang diinginkan.

Anda melakukan tugas ini dari editor Power Query. Anda bisa menemukan gambaran umum terperinci tentang editor Power Query di antarmuka pengguna Power Query.

Ikuti langkah-langkah ini untuk menerapkan transformasi dan menerbitkan:

  1. Pastikan bahwa alat Pembuatan Profil Data diaktifkan dengan menavigasi ke Opsi>.

    Cuplikan layar opsi Global dengan pilihan Profil kolom ditekankan.

    Pastikan juga Anda mengaktifkan tampilan diagram menggunakan opsi di bawah tab Tampilkan di pita editor Power Query, atau dengan memilih ikon tampilan diagram di sisi kanan bawah jendela Power Query.

    Cuplikan layar tampilan keseluruhan tampilan diagram Power Query.

  2. Dalam tabel Pesanan, Anda menghitung jumlah total pesanan per pelanggan. Untuk mencapai tujuan ini, pilih kolom CustomerID di pratinjau data lalu pilih Kelompokkan Menurut di bawah tab Transformasi di pita.

    Cuplikan layar memperlihatkan tabel Pesanan dipilih, dan Kelompokkan menurut yang ditekankan di tab Transformasi.

  3. Anda melakukan hitungan baris sebagai agregasi dalam Kelompokkan Menurut. Anda dapat mempelajari selengkapnya tentang kemampuan Kelompokkan Menurut di Mengelompokkan atau meringkas baris.

    Cuplikan layar Kelompokkan menurut, dengan operasi Hitung baris dipilih.

  4. Setelah mengelompokkan data dalam tabel Pesanan, kita akan mendapatkan tabel dua kolom dengan CustomerID dan Menghitung sebagai kolom.

    Cuplikan layar dari dua tabel kolom.

  5. Selanjutnya, Anda ingin menggabungkan data dari tabel Pelanggan dengan Jumlah Pesanan per pelanggan. Untuk menggabungkan data, pilih kueri Pelanggan di Tampilan Diagram dan gunakan menu "⋮" untuk mengakses kueri Gabungkan sebagai transformasi baru .

    Cuplikan layar editor aliran data, dengan elipsis vertikal tabel Pelanggan dan Gabungkan kueri sebagai baru ditekankan.

  6. Konfigurasikan operasi Gabungkan seperti yang ditunjukkan pada cuplikan layar berikut dengan memilih CustomerID sebagai kolom yang cocok di kedua tabel. Lalu pilih Ok.

    Cuplikan layar jendela Gabungkan.

    Cuplikan layar jendela Gabungkan, dengan tabel Kiri untuk digabungkan diatur ke tabel Pelanggan dan tabel Kanan untuk penggabungan diatur ke tabel Pesanan. Kolom CustomerID dipilih untuk tabel Pelanggan dan Pesanan. Selain itu, Jenis Gabungan diatur ke Kiri luar. Semua pilihan lainnya diatur ke nilai defaultnya.

  7. Setelah melakukan operasi Gabungkan kueri sebagai baru , Anda mendapatkan kueri baru dengan semua kolom dari tabel Pelanggan dan satu kolom dengan data berlapis dari tabel Pesanan.

    Cuplikan layar editor aliran data dengan kueri Gabungkan baru ditambahkan ke sebelah kanan tabel Pelanggan dan Pesanan.

  8. Dalam contoh ini, Anda hanya tertarik dengan subkumpulan kolom dalam tabel Pelanggan. Anda memilih kolom tersebut dengan menggunakan tampilan skema. Aktifkan tampilan skema dalam tombol alihkan di sudut kanan bawah editor aliran data.

    Cuplikan layar editor aliran data dengan tombol tampilan skema yang ditekankan di sudut kanan bawah.

  9. Tampilan skema menyediakan tampilan terfokus ke dalam informasi skema tabel, termasuk nama kolom dan jenis data. Tampilan skema memiliki sekumpulan alat skema yang tersedia melalui tab pita kontekstual. Dalam skenario ini, Anda memilih kolom CustomerID, CompanyName, dan Orders (2), lalu pilih tombol Hapus kolom , lalu pilih Hapus kolom lain di tab Alat skema.

    Cuplikan layar tampilan skema memperlihatkan semua nama kolom yang tersedia, dengan kolom CustomerID, CompanyName, dan Orders (2) ditekankan.

    Cuplikan layar menu alat skema dengan Hapus kolom lain yang ditekankan.

  10. Kolom Pesanan (2) berisi informasi berlapis yang dihasilkan dari operasi penggabungan yang Anda lakukan beberapa langkah yang lalu. Sekarang, beralih kembali ke tampilan data dengan memilih tombol Tampilkan tampilan data di samping tombol Perlihatkan tampilan skema di sudut kanan bawah UI. Kemudian gunakan transformasi Perluas Kolom di header kolom Pesanan (2) untuk memilih kolom Hitung .

    Cuplikan layar untuk menggunakan tampilan data.

  11. Sebagai operasi akhir, Anda ingin memberi peringkat pelanggan Anda berdasarkan jumlah pesanan mereka. Pilih kolom Hitung lalu pilih tombol Peringkatkan kolom di bawah tab Tambahkan Kolom di pita.

    Cuplikan layar editor aliran data dengan kolom Hitung dipilih.

  12. Pertahankan pengaturan default di Kolom Peringkat. Lalu pilih OK untuk menerapkan transformasi ini.

    Cuplikan layar jendela Peringkat dengan semua pengaturan default ditampilkan.

  13. Sekarang ganti nama kueri yang dihasilkan sebagai Pelanggan Berpangkat menggunakan panel Pengaturan kueri di sisi kanan layar.

    Cuplikan layar editor aliran data dengan nama Pelanggan Berpangkat yang ditekankan di bawah properti pengaturan kueri.

  14. Setelah selesai mengubah dan menggabungkan data, Anda dapat mengonfigurasi pengaturan tujuan outputnya. Pilih Pilih tujuan data di bagian bawah panel Pengaturan kueri.

    Cuplikan layar editor aliran data dengan lokasi pilihan Tujuan data ditekankan.

  15. Untuk langkah ini, Anda dapat mengonfigurasi output ke lakehouse jika Anda memilikinya, atau melewati langkah ini jika tidak. Dalam pengalaman ini, Anda dapat mengonfigurasi lakehouse dan tabel tujuan untuk hasil kueri Anda, selain metode pembaruan (Tambahkan atau Ganti).

    Cuplikan layar jendela Sambungkan ke tujuan data dengan lakehouse dipilih.

    Cuplikan layar jendela Pilih pengaturan tujuan.

  16. Aliran data Anda sekarang siap untuk diterbitkan. Tinjau kueri dalam tampilan diagram, lalu pilih Terbitkan.

    Cuplikan layar editor aliran data dengan tombol Terbitkan di sisi kanan bawah yang ditekankan.

    Anda sekarang dikembalikan ke ruang kerja. Ikon spinner di samping nama aliran data Anda menunjukkan penerbitan sedang berlangsung. Setelah penerbitan selesai, aliran data Anda siap untuk di-refresh!

    Penting

    Ketika Dataflow Gen2 pertama dibuat di ruang kerja, item Lakehouse dan Warehouse disediakan bersama dengan titik akhir analitik SQL terkait dan model semantik. Item ini dibagikan oleh semua aliran data di ruang kerja dan diperlukan agar Dataflow Gen2 beroperasi, tidak boleh dihapus, dan tidak dimaksudkan untuk digunakan langsung oleh pengguna. Item adalah detail implementasi Dataflow Gen2. Item tidak terlihat di ruang kerja, tetapi mungkin dapat diakses dalam pengalaman lain seperti pengalaman Notebook, titik akhir analitik SQL, Lakehouse, dan Gudang. Anda dapat mengenali item dengan awalannya dalam nama. Awalan item adalah 'DataflowsStaging'.

  17. Di ruang kerja Anda, pilih ikon Jadwalkan Refresh .

    Cuplikan layar ruang kerja dengan ikon refresh jadwal ditekankan.

  18. Aktifkan refresh terjadwal, pilih Tambahkan waktu lain, dan konfigurasikan refresh seperti yang ditunjukkan pada cuplikan layar berikut.

    Cuplikan layar memperlihatkan cara memilih waktu lain.

    Cuplikan layar opsi refresh terjadwal, dengan refresh terjadwal diaktifkan, frekuensi refresh diatur ke Harian, Zona waktu diatur ke waktu universal terkoordinasi, dan Waktu diatur ke pukul 04.00. Tombol Aktifkan, tambahkan pilihan waktu lain, pemilik aliran data, dan tombol terapkan semuanya ditekankan.

Membersihkan sumber daya

Jika Anda tidak akan terus menggunakan aliran data ini, hapus aliran data menggunakan langkah-langkah berikut:

  1. Navigasi ke ruang kerja Microsoft Fabric Anda.

    Cuplikan layar jendela ruang kerja tempat Anda menavigasi ke ruang kerja Anda.

  2. Pilih elipsis vertikal di samping nama aliran data Anda lalu pilih Hapus.

    Cuplikan layar dengan tiga titik vertikal dan opsi hapus di menu drop-down ditekankan.

  3. Pilih Hapus untuk mengonfirmasi penghapusan aliran data Anda.

    Cuplikan layar jendela Hapus aliran data, dengan tombol Hapus ditekankan.

Aliran data dalam sampel ini menunjukkan kepada Anda cara memuat dan mengubah data di Dataflow Gen2. Anda mempelajari cara untuk:

  • Buat Aliran Data Gen2.
  • Ubah data.
  • Mengonfigurasi pengaturan tujuan untuk data yang diubah.
  • Jalankan dan jadwalkan alur data Anda.

Lanjutkan ke artikel berikutnya untuk mempelajari cara membuat alur data pertama Anda.