Bagikan melalui


Mulai cepat: Membuat aliran data pertama Anda untuk mendapatkan dan mengubah data

Aliran data adalah teknologi persiapan data berbasis cloud, layanan mandiri. Dalam artikel ini, Anda membuat aliran data pertama, mendapatkan data untuk aliran data Anda, lalu mengubah data dan menerbitkan aliran data.

Prasyarat

Prasyarat berikut diperlukan sebelum Anda memulai:

  • Akun penyewa Microsoft Fabric dengan langganan aktif. Buat akun gratis.
  • Pastikan Anda memiliki Ruang Kerja yang diaktifkan Microsoft Fabric: Membuat ruang kerja.

Membuat aliran data

Di bagian ini, Anda membuat aliran data pertama Anda.

  1. Navigasi ke ruang kerja Microsoft Fabric Anda.

    Cuplikan layar jendela ruang kerja tempat Anda menavigasi ke ruang kerja Anda.

  2. Pilih +Item baru, lalu pilih Aliran Data Gen2.

    Cuplikan layar dengan pilihan Dataflow Gen2 ditekankan.

Dapatkan data

Mari kita mendapatkan beberapa data! Dalam contoh ini, Anda mendapatkan data dari layanan OData. Gunakan langkah-langkah berikut untuk mendapatkan data dalam aliran data Anda.

  1. Di editor aliran data, pilih Dapatkan data lalu pilih Lainnya.

    Cuplikan layar dengan opsi Dapatkan Data dipilih dan Lebih banyak ditekankan di kotak drop-down.

  2. Di Pilih sumber data, pilih Tampilkan lainnya.

    Cuplikan layar Dapatkan sumber data dengan Tampilan lebih ditekankan.

  3. Di Sumber baru, pilih >sebagai sumber data.

    Cuplikan layar Dapatkan sumber data dengan kategori Lain dan konektor OData ditekankan.

  4. Masukkan URL https://services.odata.org/v4/northwind/northwind.svc/, lalu pilih Berikutnya.

    Cuplikan layar sumber data OData tempat Anda memasukkan URL data.

  5. Pilih tabel Pesanan dan Pelanggan , lalu pilih Buat.

    Cuplikan layar navigator Power Query dengan tabel Pelanggan dan Pesanan ditekankan.

Anda dapat mempelajari selengkapnya tentang pengalaman dan fungsionalitas pengambilan data dalam gambaran umum pengambilan data.

Menerapkan transformasi dan menerbitkan

Anda memuat data ke dalam aliran data pertama Anda. Selamat! Sekarang saatnya untuk menerapkan beberapa transformasi untuk membawa data ini ke dalam bentuk yang kita butuhkan.

Anda mengubah data di editor Power Query. Anda bisa menemukan gambaran umum terperinci tentang editor Power Query di antarmuka pengguna Power Query, tetapi bagian ini membawa Anda melalui langkah-langkah dasar:

  1. Pastikan alat Pembuatan Profil Data diaktifkan. BukaOpsi Global>>, lalu pilih semua opsi di bawah Profil kolom.

    Cuplikan layar opsi Global dengan pilihan Profil kolom ditekankan.

    Pastikan juga Anda mengaktifkan tampilan diagram menggunakan konfigurasi Tata Letak di bawah tab Tampilan di pita editor Power Query, atau dengan memilih ikon tampilan diagram di sisi kanan bawah jendela Power Query.

    Cuplikan layar tampilan keseluruhan tampilan diagram Power Query.

  2. Dalam tabel Pesanan, hitung jumlah total pesanan per pelanggan: Pilih kolom CustomerID di pratinjau data lalu pilih Kelompokkan Menurut di bawah tab Transformasi di pita.

    Cuplikan layar memperlihatkan tabel Pesanan dipilih, dan Kelompokkan menurut yang ditekankan di tab Transformasi.

  3. Anda melakukan hitungan baris sebagai agregasi dalam Kelompokkan Menurut. Anda bisa mempelajari selengkapnya tentang kemampuan Kelompokkan Menurut di Mengelompokkan atau meringkas baris.

    Cuplikan layar Kelompokkan menurut, dengan operasi Hitung baris dipilih.

  4. Setelah mengelompokkan data dalam tabel Pesanan, kita akan mendapatkan tabel dua kolom dengan CustomerID dan Menghitung sebagai kolom.

    Cuplikan layar dari dua tabel kolom.

  5. Selanjutnya, Anda ingin menggabungkan data dari tabel Pelanggan dengan Jumlah Pesanan per pelanggan: Pilih kueri Pelanggan di Tampilan Diagram dan gunakan menu "⋮" untuk mengakses transformasi Gabungkan kueri sebagai baru.

    Cuplikan layar editor aliran data, dengan elipsis vertikal tabel Pelanggan dan Gabungkan kueri sebagai baru ditekankan.

  6. Konfigurasikan operasi Gabungkan dengan memilih CustomerID sebagai kolom yang cocok di kedua tabel. Lalu pilih Ok.

    Cuplikan layar jendela Gabungkan.

    Cuplikan layar jendela Gabungkan, dengan tabel Kiri untuk digabungkan diatur ke tabel Pelanggan dan tabel Kanan untuk penggabungan diatur ke tabel Pesanan. Kolom CustomerID dipilih untuk tabel Pelanggan dan Pesanan. Selain itu, Jenis Gabungan diatur ke Kiri luar. Semua pilihan lainnya diatur ke nilai defaultnya.

  7. Sekarang ada kueri baru dengan semua kolom dari tabel Pelanggan dan satu kolom dengan data berlapis dari tabel Pesanan.

    Cuplikan layar editor aliran data dengan kueri Gabungkan baru ditambahkan ke sebelah kanan tabel Pelanggan dan Pesanan.

  8. Mari kita fokus hanya pada beberapa kolom dari tabel Pelanggan. Untuk melakukan ini, aktifkan tampilan skema dengan memilih tombol tampilan skema di sudut kanan bawah editor aliran data.

    Cuplikan layar editor aliran data dengan tombol tampilan skema yang ditekankan di sudut kanan bawah.

  9. Dalam tampilan skema, Anda akan melihat semua kolom dalam tabel Anda. Pilih CustomerID, CompanyName, dan Orders (2). Lalu, buka tab Alat skema , pilih Hapus kolom, dan pilih Hapus kolom lain. Ini hanya menyimpan kolom yang Anda inginkan.

    Cuplikan layar tampilan skema memperlihatkan semua nama kolom yang tersedia, dengan kolom CustomerID, CompanyName, dan Orders (2) ditekankan.

    Cuplikan layar menu alat skema dengan Hapus kolom lain yang ditekankan.

  10. Kolom Pesanan (2) menyimpan detail tambahan dari langkah penggabungan. Untuk melihat dan menggunakan data ini, pilih tombol Perlihatkan tampilan data di sudut kanan bawah, di samping Tampilkan tampilan skema. Kemudian, di header kolom Pesanan (2), pilih ikon Perluas Kolom dan pilih kolom Hitung . Ini menambahkan jumlah pesanan untuk setiap pelanggan ke tabel Anda.

    Cuplikan layar untuk menggunakan tampilan data.

  11. Sekarang mari kita peringkat pelanggan Anda dengan berapa banyak pesanan yang telah mereka buat. Pilih kolom Hitung , lalu masuk ke tab Tambahkan Kolom dan pilih Kolom peringkat. Ini menambahkan kolom baru yang menunjukkan peringkat setiap pelanggan berdasarkan jumlah pesanan mereka.

    Cuplikan layar editor aliran data dengan kolom Hitung dipilih.

  12. Pertahankan pengaturan default di Kolom Peringkat. Lalu pilih OK untuk menerapkan transformasi ini.

    Cuplikan layar jendela Peringkat dengan semua pengaturan default ditampilkan.

  13. Sekarang ganti nama kueri yang dihasilkan sebagai Pelanggan Berpangkat menggunakan panel Pengaturan kueri di sisi kanan layar.

    Cuplikan layar editor aliran data dengan nama Pelanggan Tertinggi yang ditonjolkan di bagian properti pengaturan kueri.

  14. Anda siap untuk mengatur ke mana data Anda pergi. Di panel Pengaturan kueri , gulir ke bawah dan pilih Pilih tujuan data.

    Cuplikan layar editor aliran data dengan lokasi pilihan Tujuan data ditekankan.

  15. Anda dapat mengirim hasil Anda ke lakehouse, jika Anda memilikinya, atau langsung lewati langkah ini jika tidak. Di sini, Anda dapat memilih lakehouse dan tabel mana yang akan digunakan untuk data Anda, dan memilih apakah akan menambahkan data baru (Tambahkan) atau mengganti apa yang ada di sana (Ganti).

    Cuplikan layar jendela Sambungkan ke tujuan data dengan lakehouse dipilih.

    Cuplikan layar jendela Pilih pengaturan tujuan.

  16. Aliran data Anda sekarang siap untuk diterbitkan. Tinjau kueri dalam tampilan diagram, lalu pilih Terbitkan.

    Cuplikan layar editor aliran data dengan tombol Terbitkan di sisi kanan bawah yang ditekankan.

    Pilih Terbitkan di sudut kanan bawah untuk menyimpan aliran data Anda. Anda akan kembali ke ruang kerja Anda, di mana ikon spinner di samping nama aliran data menunjukkan bahwa aliran data tersebut sedang dipublikasikan. Ketika spinner menghilang, aliran data Anda siap untuk di-refresh!

    Penting

    Pertama kali Anda membuat Dataflow Gen2 di ruang kerja, Fabric menyiapkan beberapa item latar belakang (Lakehouse dan Warehouse) yang membantu aliran data Anda berjalan. Item ini dibagikan oleh semua aliran data di ruang kerja, dan Anda tidak boleh menghapusnya. Mereka tidak dimaksudkan untuk digunakan secara langsung dan biasanya tidak terlihat di ruang kerja Anda, tetapi Anda mungkin melihatnya di tempat lain seperti Notebook atau analitik SQL. Cari nama yang dimulai dengan DataflowStaging untuk menemukannya.

  17. Di ruang kerja Anda, pilih ikon Jadwalkan Refresh .

    Cuplikan layar ruang kerja dengan ikon refresh jadwal ditekankan.

  18. Aktifkan refresh terjadwal, pilih Tambahkan waktu lain, dan konfigurasikan refresh seperti yang ditunjukkan pada cuplikan layar berikut.

    Cuplikan layar memperlihatkan cara memilih waktu lain.

    Cuplikan layar opsi refresh terjadwal, dengan refresh terjadwal diaktifkan, frekuensi refresh diatur ke Harian, Zona waktu diatur ke waktu universal terkoordinasi, dan Waktu diatur ke pukul 04.00. Tombol Aktifkan, tambahkan pilihan waktu lain, pemilik aliran data, dan tombol terapkan semuanya ditekankan.

Membersihkan sumber daya

Jika Anda tidak akan terus menggunakan aliran data ini, hapus aliran data menggunakan langkah-langkah berikut:

  1. Navigasi ke ruang kerja Microsoft Fabric Anda.

    Cuplikan layar jendela ruang kerja tempat Anda menavigasi ke ruang kerja Anda.

  2. Pilih elipsis vertikal di samping nama aliran data Anda lalu pilih Hapus.

    Cuplikan layar dengan tiga titik vertikal dan opsi hapus di menu drop-down ditekankan.

  3. Pilih Hapus untuk mengonfirmasi penghapusan aliran data Anda.

    Cuplikan layar jendela Hapus aliran data, dengan tombol Hapus ditekankan.

Aliran data dalam sampel ini menunjukkan kepada Anda cara memuat dan mengubah data di Dataflow Gen2. Anda mempelajari cara untuk:

  • Buat Aliran Data Gen2.
  • Ubah data.
  • Mengonfigurasi pengaturan tujuan untuk data yang diubah.
  • Jalankan dan jadwalkan pipeline Anda.

Lanjutkan ke artikel berikutnya untuk belajar membuat alur kerja pertama Anda.