Bagikan melalui


Fungsi jendela dalam memetakan aliran data

BERLAKU UNTUK: Azure Data Factory Azure Synapse Analytics

Tip

Cobalah Data Factory di Microsoft Fabric, solusi analitik all-in-one untuk perusahaan. Microsoft Fabric mencakup semuanya mulai dari pergerakan data hingga ilmu data, analitik real time, kecerdasan bisnis, dan pelaporan. Pelajari cara memulai uji coba baru secara gratis!

Aliran data tersedia di Alur Azure Data Factory dan Azure Synapse. Artikel ini berlaku untuk memetakan aliran data. Jika Anda baru mengenal transformasi, silakan lihat artikel pengantar Transformasi data menggunakan aliran data pemetaan.

Artikel berikut memberikan detail tentang fungsi jendela yang didukung oleh Azure Data Factory dan Azure Synapse Analytics dalam memetakan aliran data.

Daftar fungsi jendela

Fungsi berikut hanya tersedia dalam transformasi jendela.

Fungsi jendela Tugas
cumeDist Fungsi CumeDist menghitung posisi nilai relatif terhadap semua nilai dalam partisi. Hasilnya adalah jumlah baris sebelum atau sama dengan baris saat ini dalam urutan partisi dibagi dengan jumlah total baris di partisi jendela. Nilai ikatan apa pun dalam urutan ini akan dievaluasi ke posisi yang sama.
denseRank Menghitung peringkat nilai dalam grup nilai yang ditentukan dalam urutan jendela menurut klausul. Hasilnya adalah satu ditambah jumlah baris sebelum atau sama dengan baris saat ini dalam urutan partisi. Nilai tidak akan menghasilkan celah dalam urutan. Peringkat Padat berfungsi meski data tidak diurutkan dan mencari perubahan dalam nilai.
lag Mendapatkan nilai baris n yang dievaluasi parameter pertama sebelum baris saat ini. Parameter kedua adalah jumlah baris yang akan digunakan kembali dan nilai default-nya adalah 1. Jika tidak ada baris sebanyak itu, nilai null akan ditampilkan kecuali jika nilai default ditentukan.
lead Mendapatkan baris n yang dievaluasi parameter pertama setelah baris saat ini. Parameter kedua adalah jumlah baris yang diharapkan dan nilai defaultnya adalah 1. Jika tidak ada baris sebanyak itu, nilai null akan ditampilkan kecuali jika nilai default ditentukan.
nTile Fungsi NTile membagi baris untuk setiap partisi jendela menjadi wadah n dalam rentang dari 1 hingga maksimal n. Nilai wadah akan berbeda paling banyak 1. Jika jumlah baris dalam partisi tidak dibagi rata menjadi dalam jumlah wadah, nilai sisa akan didistribusikan satu per wadah, dimulai dengan wadah pertama. Fungsi NTile berguna untuk penghitungan tertiles, kuartil, desil, dan statistik ringkasan umum lainnya. Fungsi ini menghitung dua variabel selama inisialisasi: Ukuran wadah biasa akan memiliki satu baris tambahan yang ditambahkan ke dalamnya. Kedua variabel didasarkan pada ukuran partisi saat ini. Selama proses penghitungan, fungsi akan melacak nomor baris saat ini, nomor wadah saat ini, dan nomor baris tempat wadah akan berubah (bucketThreshold). Jika jumlah baris saat ini mencapai ambang batas wadah, nilai wadah akan ditingkatkan satu dan ambang batasnya bertambah berdasarkan ukuran wadah (ditambah satu baris tambahan jika wadah saat ini berlapis).
rank Menghitung peringkat nilai dalam grup nilai yang ditentukan dalam urutan jendela menurut klausul. Hasilnya adalah satu ditambah jumlah baris sebelum atau sama dengan baris saat ini dalam urutan partisi. Nilai ini akan menghasilkan celah dalam urutan. Peringkat berfungsi meski data tidak diurutkan dan mencari perubahan dalam nilai.
rowNumber Menetapkan penomoran baris berurutan untuk baris dalam jendela yang dimulai dengan 1.