Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Aliran data adalah teknologi persiapan data berbasis cloud, layanan mandiri. Dalam artikel ini, Anda membuat aliran data pertama, mendapatkan data untuk aliran data Anda, lalu mengubah data dan menerbitkan aliran data.
Prasyarat
Prasyarat berikut diperlukan sebelum Anda memulai:
- Akun penyewa Microsoft Fabric dengan langganan aktif. Buat akun gratis.
- Pastikan Anda memiliki Ruang Kerja yang diaktifkan Microsoft Fabric: Membuat ruang kerja.
Membuat aliran data
Di bagian ini, Anda membuat aliran data pertama Anda.
Dapatkan data
Mari kita mendapatkan beberapa data! Dalam contoh ini, Anda mendapatkan data dari layanan OData. Gunakan langkah-langkah berikut untuk mendapatkan data dalam aliran data Anda.
Di editor aliran data, pilih Dapatkan data lalu pilih Lainnya.
Di Pilih sumber data, pilih Tampilkan lainnya.
Di Sumber baru, pilih >sebagai sumber data.
Masukkan URL
https://services.odata.org/v4/northwind/northwind.svc/, lalu pilih Berikutnya.
Pilih tabel Pesanan dan Pelanggan , lalu pilih Buat.
Anda dapat mempelajari selengkapnya tentang pengalaman dan fungsionalitas pengambilan data dalam gambaran umum pengambilan data.
Menerapkan transformasi dan menerbitkan
Anda memuat data ke dalam aliran data pertama Anda. Selamat! Sekarang saatnya untuk menerapkan beberapa transformasi untuk membawa data ini ke dalam bentuk yang kita butuhkan.
Anda mengubah data di editor Power Query. Anda bisa menemukan gambaran umum terperinci tentang editor Power Query di antarmuka pengguna Power Query, tetapi bagian ini membawa Anda melalui langkah-langkah dasar:
Pastikan alat Pembuatan Profil Data diaktifkan. BukaOpsi Global>>, lalu pilih semua opsi di bawah Profil kolom.
Pastikan juga Anda mengaktifkan tampilan diagram menggunakan konfigurasi Tata Letak di bawah tab Tampilan di pita editor Power Query, atau dengan memilih ikon tampilan diagram di sisi kanan bawah jendela Power Query.
Dalam tabel Pesanan, hitung jumlah total pesanan per pelanggan: Pilih kolom CustomerID di pratinjau data lalu pilih Kelompokkan Menurut di bawah tab Transformasi di pita.
Anda melakukan hitungan baris sebagai agregasi dalam Kelompokkan Menurut. Anda bisa mempelajari selengkapnya tentang kemampuan Kelompokkan Menurut di Mengelompokkan atau meringkas baris.
Setelah mengelompokkan data dalam tabel Pesanan, kita akan mendapatkan tabel dua kolom dengan CustomerID dan Menghitung sebagai kolom.
Selanjutnya, Anda ingin menggabungkan data dari tabel Pelanggan dengan Jumlah Pesanan per pelanggan: Pilih kueri Pelanggan di Tampilan Diagram dan gunakan menu "⋮" untuk mengakses transformasi Gabungkan kueri sebagai baru.
Konfigurasikan operasi Gabungkan dengan memilih CustomerID sebagai kolom yang cocok di kedua tabel. Lalu pilih Ok.
Cuplikan layar jendela Gabungkan, dengan tabel Kiri untuk digabungkan diatur ke tabel Pelanggan dan tabel Kanan untuk penggabungan diatur ke tabel Pesanan. Kolom CustomerID dipilih untuk tabel Pelanggan dan Pesanan. Selain itu, Jenis Gabungan diatur ke Kiri luar. Semua pilihan lainnya diatur ke nilai defaultnya.
Sekarang ada kueri baru dengan semua kolom dari tabel Pelanggan dan satu kolom dengan data berlapis dari tabel Pesanan.
Mari kita fokus hanya pada beberapa kolom dari tabel Pelanggan. Untuk melakukan ini, aktifkan tampilan skema dengan memilih tombol tampilan skema di sudut kanan bawah editor aliran data.
Dalam tampilan skema, Anda akan melihat semua kolom dalam tabel Anda. Pilih CustomerID, CompanyName, dan Orders (2). Lalu, buka tab Alat skema , pilih Hapus kolom, dan pilih Hapus kolom lain. Ini hanya menyimpan kolom yang Anda inginkan.
Kolom Pesanan (2) menyimpan detail tambahan dari langkah penggabungan. Untuk melihat dan menggunakan data ini, pilih tombol Perlihatkan tampilan data di sudut kanan bawah, di samping Tampilkan tampilan skema. Kemudian, di header kolom Pesanan (2), pilih ikon Perluas Kolom dan pilih kolom Hitung . Ini menambahkan jumlah pesanan untuk setiap pelanggan ke tabel Anda.
Sekarang mari kita peringkat pelanggan Anda dengan berapa banyak pesanan yang telah mereka buat. Pilih kolom Hitung , lalu masuk ke tab Tambahkan Kolom dan pilih Kolom peringkat. Ini menambahkan kolom baru yang menunjukkan peringkat setiap pelanggan berdasarkan jumlah pesanan mereka.
Pertahankan pengaturan default di Kolom Peringkat. Lalu pilih OK untuk menerapkan transformasi ini.
Sekarang ganti nama kueri yang dihasilkan sebagai Pelanggan Berpangkat menggunakan panel Pengaturan kueri di sisi kanan layar.
Anda siap untuk mengatur ke mana data Anda pergi. Di panel Pengaturan kueri , gulir ke bawah dan pilih Pilih tujuan data.
Anda dapat mengirim hasil Anda ke lakehouse, jika Anda memilikinya, atau langsung lewati langkah ini jika tidak. Di sini, Anda dapat memilih lakehouse dan tabel mana yang akan digunakan untuk data Anda, dan memilih apakah akan menambahkan data baru (Tambahkan) atau mengganti apa yang ada di sana (Ganti).
Aliran data Anda sekarang siap untuk diterbitkan. Tinjau kueri dalam tampilan diagram, lalu pilih Terbitkan.
Pilih Terbitkan di sudut kanan bawah untuk menyimpan aliran data Anda. Anda akan kembali ke ruang kerja Anda, di mana ikon spinner di samping nama aliran data menunjukkan bahwa aliran data tersebut sedang dipublikasikan. Ketika spinner menghilang, aliran data Anda siap untuk di-refresh!
Penting
Pertama kali Anda membuat Dataflow Gen2 di ruang kerja, Fabric menyiapkan beberapa item latar belakang (Lakehouse dan Warehouse) yang membantu aliran data Anda berjalan. Item ini dibagikan oleh semua aliran data di ruang kerja, dan Anda tidak boleh menghapusnya. Mereka tidak dimaksudkan untuk digunakan secara langsung dan biasanya tidak terlihat di ruang kerja Anda, tetapi Anda mungkin melihatnya di tempat lain seperti Notebook atau analitik SQL. Cari nama yang dimulai dengan
DataflowStaginguntuk menemukannya.Di ruang kerja Anda, pilih ikon Jadwalkan Refresh .
Aktifkan refresh terjadwal, pilih Tambahkan waktu lain, dan konfigurasikan refresh seperti yang ditunjukkan pada cuplikan layar berikut.
Cuplikan layar opsi refresh terjadwal, dengan refresh terjadwal diaktifkan, frekuensi refresh diatur ke Harian, Zona waktu diatur ke waktu universal terkoordinasi, dan Waktu diatur ke pukul 04.00. Tombol Aktifkan, tambahkan pilihan waktu lain, pemilik aliran data, dan tombol terapkan semuanya ditekankan.
Membersihkan sumber daya
Jika Anda tidak akan terus menggunakan aliran data ini, hapus aliran data menggunakan langkah-langkah berikut:
Navigasi ke ruang kerja Microsoft Fabric Anda.
Pilih elipsis vertikal di samping nama aliran data Anda lalu pilih Hapus.
Pilih Hapus untuk mengonfirmasi penghapusan aliran data Anda.
Konten terkait
Aliran data dalam sampel ini menunjukkan kepada Anda cara memuat dan mengubah data di Dataflow Gen2. Anda mempelajari cara untuk:
- Buat Aliran Data Gen2.
- Ubah data.
- Mengonfigurasi pengaturan tujuan untuk data yang diubah.
- Jalankan dan jadwalkan pipeline Anda.
Lanjutkan ke artikel berikutnya untuk belajar membuat alur kerja pertama Anda.