Ablakátalakítás a leképezési adatfolyamban

Vonatkozik: Azure Data Factory Azure Synapse Analytics

Tipp.

Data Factory a Microsoft Fabric a Azure Data Factory következő generációja, egyszerűbb architektúrával, beépített AI-vel és új funkciókkal. Ha még nem ismerkedik az adatintegrációval, kezdje a Fabric Data Factoryvel. A meglévő ADF-számítási feladatok frissíthetők Fabric használatával, hogy elérjék az adatkutatás, a valós idejű elemzés és a jelentéskészítés új képességeit.

Az adatfolyamok Azure Data Factory folyamatokban és Azure Synapse Analytics folyamatokban is elérhetők. Ez a cikk az adatfolyamok leképezésére vonatkozik. Ha még nem ismerkedik az átalakításokkal, tekintse meg az Adatok átalakítása leképezési adatfolyamokkal című bevezető cikket.

Tipp.

Ha még nem ismerkedik az adatintegrációval, kezdje a Fabric Data Factory, a Azure Data Factory következő generációjával. Az Ablak átalakítás jelenleg nem támogatott a Dataflow Gen2-ben. A támogatott átalakítások és azok megfelelőinek listáját a Dataflow Gen2 útmutatójában találja az adatfolyam-felhasználók leképezéséhez.

Az ablakátalakítás során az adatfolyamokban lévő oszlopok ablakalapú összesítéseit definiálhatja. A Kifejezésszerkesztőben különböző típusú összesítéseket definiálhat, amelyek az adatokon vagy az időablakokon (SQL OVER záradékon) alapulnak, például LEAD, LAG, NTILE, CUMEDIST és RANK. A kimenetben létrejön egy új mező, amely tartalmazza ezeket az összesítéseket. Választható csoportosítási mezőket is megadhat.

Képernyőkép mutatja a menüből kiválasztott ablakkezelést.

felett

Állítsa be az oszlopadatok particionálását az ablakátalakításhoz. Az SQL-ekvivalens az Partition By SQL Over záradékában található. Ha számítást szeretne létrehozni, vagy a particionáláshoz használandó kifejezést szeretne létrehozni, ezt megteheti úgy, hogy az oszlop nevére mutat, és kiválasztja a Számított oszlopot.

Képernyőkép az Ablakozási beállítások képernyőről, amelyen a Felett fület van kijelölve.

Sort

Az Over záradék másik része a Order By beállítása. Ez a záradék beállítja az adatrendezés sorrendjét. Az oszlopmezőben létrehozhat egy kifejezést egy kiszámított értékhez, amellyel rendezheti az adatokat.

Képernyőkép az Ablakbeállítások lehetőségről, amelyen a Rendezés lap van kijelölve.

Tartomány alapján

Ezután állítsa be az ablakkeretet kötetlen vagy kötöttként. Ha kötetlen ablakkeretet szeretne beállítani, állítsa a csúszkát kötetlenre mindkét végén. Ha a kötetlen és az aktuális sor közötti beállítást választja, akkor meg kell adnia az eltolás kezdő és záró értékét. Mindkét érték pozitív egész szám. Az adatokból származó relatív számokat vagy értékeket is használhatja.

Az ablakcsúszkának két értéke van: az aktuális sor előtti és az aktuális sor utáni értékek. A kezdés és a befejezés közötti eltolás megegyezik a csúszkán lévő két választóval.

A képernyőkép az Ablakbeállításokat mutatja, ahol a Tartomány szerinti lap van kiválasztva.

Ablakoszlopok

Végül a Kifejezésszerkesztővel definiálhatja az adatablakokkal használni kívánt összesítéseket, például RANK, COUNT, MIN, MAX, DENSE RANK, LEAD, LAG stb.

A Adatfolyam Kifejezésnyelvben a Kifejezésszerkesztőn keresztül használható összesítési és elemzési függvények teljes listája megtalálható az Adatátalakítási kifejezések a leképezési data flow-ban.

Ha egyszerű aggregációs csoportosítást szeretne, használja az Aggregate átalakítást