Funkcje okna w przepływach danych mapowania

DOTYCZY: Azure Data Factory Azure Synapse Analytics

Tip

Data Factory w usłudze Microsoft Fabric jest następną generacją Azure Data Factory z prostszą architekturą, wbudowaną sztuczną inteligencją i nowymi funkcjami. Jeśli dopiero zaczynasz integrować dane, zacznij od Fabric Data Factory. Istniejące obciążenia usługi ADF można uaktualnić do Fabric, aby uzyskać dostęp do nowych funkcji w nauce o danych, analizie w czasie rzeczywistym i raportowaniu.

Przepływy danych są dostępne zarówno w potokach Azure Data Factory, jak i w potokach Azure Synapse Analytics. Ten artykuł dotyczy przepływów danych mapowania. Jeśli dopiero zaczynasz z przekształceń danych, zapoznaj się z artykułem wprowadzającym Przekształcanie danych przy użyciu przepływów mapowania danych.

Ten artykuł zawiera szczegółowe informacje o funkcjach okien obsługiwanych przez Azure Data Factory i Azure Synapse Analytics w przepływach danych mapowania.

Lista funkcji okna

Następujące funkcje są dostępne tylko w przekształceniach okien.

Funkcja Window Task
cumeDist Oblicza położenie wartości względem wszystkich wartości w partycji. Wynikiem jest liczba wierszy poprzedzających lub równych bieżącemu wierszowi w kolejności partycji podzielonej przez łączną liczbę wierszy w partycji okna. Wszystkie równorzędne wartości w uporządkowaniu są oceniane na tej samej pozycji.
denseRank Oblicza rangę wartości w grupie wartości określonych w kolejności okna według klauzuli. Wynik to jeden plus liczba wierszy poprzedzających lub równych bieżącemu wierszowi w porządku partycji. Wartości nie generują luk w sekwencji. Funkcja denseRank działa nawet wtedy, gdy dane nie są sortowane i szukają zmian w wartościach.
lag Pobiera wartość pierwszego parametru, który był oceniany n wierszy przed bieżącym wierszem. Drugi parametr to liczba wierszy do przeszukania wstecz, a wartość domyślna to 1. Jeśli nie ma tak wielu wierszy, wartość null zostanie zwrócona, chyba że zostanie określona wartość domyślna.
lead Pobiera wartość pierwszego parametru obliczanego n wierszy po bieżącym wierszu. Drugi parametr to liczba wierszy, którą należy przesunąć do przodu, a wartość domyślna to 1. Jeśli nie ma tak wielu wierszy, wartość null zostanie zwrócona, chyba że zostanie określona wartość domyślna.
nTile Dzieli wiersze dla każdej partycji okna na n grupy w zakresie od 1 do maksymalnie n. Wartości wiadra różnią się co najwyżej 1. Jeśli liczba wierszy w partycji nie jest równomiernie podzielona na liczbę zasobników, pozostałe wartości są rozdzielane pojedynczo na zasobnik, począwszy od pierwszego zasobnika. Funkcja NTile jest przydatna do obliczania tertiles, kwartylów, decyli i innych typowych statystyk podsumowujących.

Funkcja oblicza dwie zmienne podczas inicjowania. Rozmiar zwykłego zasobnika zawiera jeden dodatkowy wiersz dodany do niego. Obie zmienne są oparte na rozmiarze bieżącej partycji. Podczas procesu obliczania funkcja śledzi bieżący numer wiersza, bieżący numer zasobnika i numer wiersza, w którym zmienia się zasobnik (bucketThreshold). Gdy bieżąca liczba wierszy osiągnie próg zasobnika, wartość zasobnika zwiększa się o jeden. Próg zwiększa się o rozmiar wiadra (plus jeden dodatkowy, jeśli bieżące wiadro jest wypełnione).
rank Oblicza rangę wartości w grupie wartości określonych w kolejności okna według klauzuli. Wynik to jeden plus liczba wierszy poprzedzających lub równych bieżącemu wierszowi w porządku partycji. Wartości generują luki w sekwencji. Funkcja rank działa nawet wtedy, gdy dane nie są sortowane i szukają zmian w wartościach.
rowNumber Przypisuje sekwencyjne numerowanie wierszy dla wierszy w oknie rozpoczynającym się od 1.