Bagikan melalui


Transformasi Window dalam pemetaan aliran data

BERLAKU UNTUK: Azure Data Factory Azure Synapse Analytics

Tip

Cobalah Data Factory di Microsoft Fabric, solusi analitik all-in-one untuk perusahaan. Microsoft Fabric mencakup semuanya mulai dari pergerakan data hingga ilmu data, analitik real time, kecerdasan bisnis, dan pelaporan. Pelajari cara memulai uji coba baru secara gratis!

Aliran data tersedia di Alur Azure Data Factory dan Azure Synapse. Artikel ini berlaku untuk memetakan aliran data. Jika Anda baru mengenal transformasi, silakan lihat artikel pengantar Transformasi data menggunakan aliran data pemetaan.

Transformasi Window adalah tempat Anda akan menentukan agregasi kolom berbasis jendela di aliran data Anda. Di Penyusun Ekspresi, Anda dapat menentukan berbagai jenis agregasi yang didasarkan pada data atau jendela waktu (klausa SQL OVER) seperti LEAD, LAG, NTILE, CUMEDIST, RANK, dll.). Bidang baru akan dihasilkan dalam output Anda yang menyertakan agregasi ini. Anda juga dapat menyertakan bidang kelompokkan-menurut opsional.

Cuplikan layar memperlihatkan Windowing dipilih dari menu.

Over

Mengatur pemartisian data kolom untuk transformasi jendela Anda. SQL yang setara adalah Partition By di klausa Over di SQL. Jika Anda ingin membuat perhitungan atau membuat ekspresi untuk digunakan untuk pemartisian, Anda dapat melakukannya dengan mengarahkan kursor ke nama kolom dan memilih "kolom yang dihitung".

Cuplikan layar memperlihatkan Pengaturan Windowing dengan tab Over dipilih.

Sort

Bagian lain dari klausa Over adalah mengatur Order By. Ini akan mengatur urutann pengurutan data. Anda juga bisa membuat ekspresi untuk menghitung nilai di bidang kolom ini untuk pengurutan.

Cuplikan layar memperlihatkan Pengaturan Windowing dengan tab Sort dipilih.

Range By

Selanjutnya, atur bingkai jendela sebagai Tidak Terbatas atau Dibatasi. Untuk mengatur bingkai jendela yang tidak terbatas, atur penggeser ke Tidak Terbatas di kedua ujungnya. Jika Anda memilih pengaturan antara Tidak Terbatas dan Baris Saat Ini, maka Anda harus mengatur nilai awal dan akhir Offset. Kedua nilai tersebut akan menjadi bilangan bulat positif. Anda dapat menggunakan angka atau nilai relatif dari data Anda.

Slider jendela memiliki dua nilai untuk diatur: nilai sebelum baris saat ini dan nilai setelah baris saat ini. Offset Mulai dan Akhir cocok dengan dua pemilih pada penggeser.

Cuplikan layar memperlihatkan Pengaturan Windowing dengan tab Range by dipilih.

Kolom jendela

Terakhir, gunakan Penyusun Ekspresi untuk menentukan agregasi yang ingin Anda gunakan dengan jendela data seperti RANK, COUNT, MIN, MAX, DENSE RANK, LEAD, LAG, dll.

Cuplikan layar memperlihatkan hasil tindakan windowing.

Daftar lengkap fungsi agregasi dan analitik yang tersedia untuk Anda gunakan dalam Bahasa Ekspresi Aliran Data melalui Penyusun Ekspresi tercantum dalam Ekspresi transformasi data dalam aliran data pemetaan.

Jika Anda mencari agregasi kelompokkan-menurut yang sederhana, gunakan Transformasi agregat