Ablakfüggvények az adatfolyamok térképezésében

A: Azure Data Factory Azure Synapse Analytics

Tipp

Data Factory a Microsoft Fabric a Azure Data Factory következő generációja, egyszerűbb architektúrával, beépített AI-vel és új funkciókkal. Ha még nem ismerkedik az adatintegrációval, kezdje a Fabric Data Factoryvel. A meglévő ADF-számítási feladatok Fabric frissíthetnek az adatelemzés, a valós idejű elemzés és a jelentéskészítés új képességeinek eléréséhez.

Az adatfolyamok Azure Data Factory folyamatokban és Azure Synapse Analytics folyamatokban is elérhetők. Ez a cikk az adatfolyamok leképezésére vonatkozik. Ha még nem ismerkedik az átalakításokkal, tekintse meg az Adatok átalakítása leképezési adatfolyamokkal című bevezető cikket.

Ez a cikk részletesen ismerteti az Azure Data Factory által támogatott ablakfüggvényeket és Azure Synapse Analytics az adatfolyamok leképezésében.

Ablakfüggvények listája

Az alábbi függvények csak az ablakátalakításokban érhetők el.

Ablak függvény Feladat
cumeDist Kiszámítja egy érték pozícióját a partíció összes értékéhez viszonyítva. Az eredmény a partíció sorrendjének aktuális sorát megelőző vagy azzal egyenlő sorok száma, osztva az ablakpartícióban lévő sorok teljes számával. Az azonos értékek a rendezésben ugyanarra a pozícióra kerülnek.
denseRank Kiszámítja egy érték rangsorát egy ablak sorrendjében megadott értékcsoportban záradék szerint. Az eredmény egy plusz a partíció sorrendjének aktuális sorát megelőző vagy egyenlő sorok száma. Az értékek nem okoznak réseket a sorozatban. A denseRank függvény akkor is működik, ha az adatok nincsenek rendezve, és az értékek változását keresi.
lemaradás Lekéri az első paraméter által kiértékelt n sorok értékét az aktuális sor előtt. A második paraméter a visszatekintendő sorok száma, az alapértelmezett érték pedig 1a . Ha nincs annyi sor, akkor a rendszer csak akkor ad vissza értéket null , ha nincs megadva alapértelmezett érték.
ólom Lekéri az aktuális sor után kiértékelt n első paramétersor értékét. A második paraméter a megtekintendő sorok száma, az alapértelmezett érték pedig 1az . Ha nincs annyi sor, akkor a rendszer csak akkor ad vissza értéket null , ha nincs megadva alapértelmezett érték.
nTile Az egyes ablakpartíciók sorait n gyűjtőkre osztja, ahol a tartomány 1 és legfeljebb n közötti lehet. A gyűjtőértékek legfeljebb 1eltérőek. Ha a partíció sorainak száma nem osztható egyenlően a gyűjtők számával, a maradék értékek gyűjtőnként egyenként kerülnek szétosztásra, az első gyűjtőtől kezdve. A NTile függvény hasznos a kvartilisek, a decilek és más általános összefoglaló statisztikák kiszámításához tertiles.

A függvény két változót számít ki az inicializálás során. A szokásos vödör mérete egy extra sorral lett növelve. Mindkét változó az aktuális partíció méretén alapul. A számítási folyamat során a függvény nyomon követi az aktuális sorszámot, az aktuális gyűjtőszámot és azt a sorszámot, amelyen a gyűjtő módosul (bucketThreshold). Amikor az aktuális sorszám eléri a vödör küszöbértékét, a vödör értéke eggyel nő. A küszöbérték a vödör méretével nő (plusz egy további, ha az aktuális vödör ki van párnázva).
rang Kiszámítja egy érték rangsorát egy ablak sorrendjében megadott értékcsoportban záradék szerint. Az eredmény egy plusz a partíció sorrendjének aktuális sorát megelőző vagy egyenlő sorok száma. Az értékek hézagokat eredményeznek a sorozatban. A rank függvény akkor is működik, ha az adatok nincsenek rendezve, és az értékek változását keresi.
rowNumber Szekvenciális sorszámozást rendel hozzá egy ablak soraihoz a következővel 1kezdődően: .