Bagikan melalui


Fungsi jendela dalam pemetaan aliran data

BERLAKU UNTUK: Azure Data Factory Azure Synapse Analytics

Tip

Cobalah Data Factory di Microsoft Fabric, sebuah solusi analitik terpadu untuk perusahaan. Microsoft Fabric mencakup segala hal mulai dari pergerakan data hingga ilmu data, analitik real-time, intelijen bisnis, dan pelaporan. Pelajari cara memulai uji coba baru secara gratis!

Aliran data tersedia di alur Azure Data Factory dan alur Azure Synapse Analytics. Artikel ini berlaku untuk memetakan aliran data. Jika Anda baru mengenal transformasi, lihat artikel pengantar Mengubah data menggunakan aliran data pemetaan.

Artikel ini menyediakan detail tentang fungsi jendela yang didukung oleh Azure Data Factory dan Azure Synapse Analytics dalam pemetaan aliran data.

Daftar fungsi jendela

Fungsi berikut hanya tersedia dalam transformasi jendela.

Fungsi jendela Task
cumeDist Menghitung posisi nilai yang relatif terhadap semua nilai dalam partisi. Hasilnya adalah jumlah baris sebelumnya atau sama dengan baris saat ini dalam urutan partisi dibagi dengan jumlah total baris di partisi jendela. Nilai ikatan apa pun dalam urutan dievaluasi ke posisi yang sama.
denseRank Menghitung peringkat nilai dalam grup nilai yang ditentukan dalam urutan menurut klausa jendela. Hasilnya adalah satu ditambah jumlah baris sebelumnya atau sama dengan baris saat ini dalam urutan partisi. Nilai itu tidak menghasilkan celah dalam urutan. Fungsi denseRank ini berfungsi bahkan ketika data tidak diurutkan dan mencari perubahan nilai.
lag Mendapatkan nilai baris parameter pertama yang dievaluasi n sebelum baris saat ini. Parameter kedua adalah jumlah baris untuk melihat ke belakang, dan nilai defaultnya adalah 1. Jika jumlah baris tidak sesuai, nilai null akan dikembalikan kecuali jika nilai default sudah ditentukan.
lead Mendapatkan nilai dari parameter pertama yang dievaluasi n baris setelah baris saat ini. Parameter kedua adalah jumlah baris untuk dilihat ke depan, dan nilai defaultnya adalah 1. Jika jumlah baris tidak sebanyak itu, nilai null akan dikembalikan kecuali jika nilai default telah ditentukan.
nTile Membagi baris untuk setiap partisi jendela menjadi n wadah mulai dari 1 hingga paling banyak n. Nilai wadah berbeda tidak lebih dari 1. Jika jumlah baris dalam partisi tidak dibagi secara merata menjadi jumlah wadah, nilai yang tersisa didistribusikan satu per wadah, dimulai dengan wadah pertama. Fungsi NTile ini berguna untuk perhitungan tertiles, kuartil, desile, dan statistik ringkasan umum lainnya.

Fungsi menghitung dua variabel selama inisialisasi. Ukuran wadah biasa memiliki satu baris tambahan yang ditambahkan ke dalamnya. Kedua variabel didasarkan pada ukuran partisi saat ini. Selama proses perhitungan, fungsi melacak nomor baris saat ini, nomor wadah saat ini, dan nomor baris tempat wadah berubah (bucketThreshold). Ketika nomor baris saat ini mencapai ambang batas wadah, nilai wadah meningkat satu per satu. Ambang batas meningkat berdasarkan ukuran wadah (ditambah satu tambahan jika wadah saat ini diisi).
rank Menghitung peringkat nilai dalam grup nilai yang ditentukan dalam urutan menurut klausa jendela. Hasilnya adalah satu ditambah jumlah baris sebelumnya atau sama dengan baris saat ini dalam urutan partisi. Nilai menghasilkan celah dalam urutan. Fungsi rank ini berfungsi bahkan ketika data tidak diurutkan dan mencari perubahan nilai.
rowNumber Menetapkan penomoran baris berurutan untuk baris di jendela yang dimulai dengan 1.