Transformasi jendela dalam pemetaan aliran data

Azure Data Factory Azure Synapse Analytics

Tip

Data Factory di Microsoft Fabric adalah generasi Azure Data Factory berikutnya, dengan arsitektur yang lebih sederhana, AI bawaan, dan fitur baru. Jika Anda baru menggunakan integrasi data, mulailah dengan Fabric Data Factory. Beban kerja ADF yang ada dapat ditingkatkan ke Fabric untuk mengakses kemampuan baru di seluruh ilmu data, analitik real time, dan pelaporan.

Aliran data tersedia di alur Azure Data Factory dan alur Azure Synapse Analytics. Artikel ini berlaku untuk memetakan aliran data. Jika Anda baru mengenal transformasi, lihat artikel pengantar Mengubah data menggunakan aliran data pemetaan.

Tip

Jika Anda baru menggunakan integrasi data, mulailah dengan Fabric Data Factory, generasi Azure Data Factory berikutnya. Transformasi Jendela saat ini tidak didukung di Dataflow Gen2. Untuk daftar transformasi yang didukung dan yang setara, lihat Panduan untuk Dataflow Gen2 untuk memetakan pengguna aliran data.

Transformasi Jendela adalah tempat Anda menentukan agregasi kolom berbasis jendela di aliran data Anda. Di Penyusun Ekspresi, Anda dapat menentukan berbagai jenis agregasi yang didasarkan pada data atau jendela waktu (klausa SQL OVER) seperti LEAD, LAG, NTILE, CUMEDIST, dan RANK. Bidang baru dihasilkan dalam output Anda yang menyertakan agregasi ini. Anda juga dapat menyertakan bidang pengelompokan opsional.

Cuplikan layar memperlihatkan Windowing dipilih dari menu.

Selesai

Atur pemartisian data kolom untuk transformasi jendela Anda. SQL yang setara adalah Partition By dalam klausul Over di SQL. Jika Anda ingin membuat perhitungan atau membuat ekspresi yang akan digunakan untuk pemartisian, Anda bisa melakukannya dengan mengarahkan mouse ke atas nama kolom dan memilih Kolom komputasi.

Cuplikan layar memperlihatkan Pengaturan Windowing dengan tab Atas dipilih.

Urutkan

Bagian lain dari klausa Over adalah menetapkan Order By. Klausa ini mengatur urutan pengurutan data. Anda juga bisa membuat ekspresi untuk nilai hitung di bidang kolom ini untuk pengurutan.

Cuplikan layar memperlihatkan Pengaturan Windowing dengan tab Urutkan dipilih.

Rentang Menurut

Selanjutnya, atur bingkai jendela sebagai Tidak Terbatas atau Terikat. Untuk mengatur bingkai jendela yang tidak terbatas, atur penggeser ke Tidak Terbatas pada kedua ujung. Jika Anda memilih pengaturan antara Tak Terbatas dan Baris Saat Ini, maka Anda harus mengatur nilai awal dan akhir Offset. Kedua nilai tersebut adalah bilangan bulat positif. Anda dapat menggunakan angka relatif atau nilai dari data Anda.

Slider jendela memiliki dua nilai untuk diatur: nilai sebelum baris saat ini dan nilai setelah baris saat ini. Offset antara awal dan akhir sesuai dengan dua pengatur pada penggeser.

Cuplikan layar memperlihatkan Pengaturan Windowing dengan tab dipilih berdasarkan Rentang.

Kolom jendela

Terakhir, gunakan Penyusun Ekspresi untuk menentukan agregasi yang ingin Anda gunakan dengan jendela data seperti RANK, COUNT, MIN, MAX, DENSE RANK, LEAD, LAG, dll.

Daftar lengkap fungsi agregasi dan analitis yang tersedia untuk Anda gunakan dalam Data Flow Expression Language melalui Expression Builder tercantum dalam ekspresi transformasi data dalam mapping data flow.

Jika Anda mencari agregasi kelompok demi grup sederhana, gunakan transformasi Agregat