Delen via


Vensterfuncties in toewijzingsgegevensstroom

VAN TOEPASSING OP: Azure Data Factory Azure Synapse Analytics

Tip

Probeer Data Factory uit in Microsoft Fabric, een alles-in-één analyseoplossing voor ondernemingen. Microsoft Fabric omvat alles, van gegevensverplaatsing tot gegevenswetenschap, realtime analyses, business intelligence en rapportage. Meer informatie over het gratis starten van een nieuwe proefversie .

Gegevensstromen zijn beschikbaar in Zowel Azure Data Factory als Azure Synapse Pipelines. Dit artikel is van toepassing op toewijzingsgegevensstromen. Als u geen ervaring hebt met transformaties, raadpleegt u het inleidende artikel Gegevens transformeren met behulp van een toewijzingsgegevensstroom.

De volgende artikelen bevatten informatie over vensterfuncties die worden ondersteund door Azure Data Factory en Azure Synapse Analytics in toewijzingsgegevensstromen.

Lijst met vensterfuncties

De volgende functies zijn alleen beschikbaar in venstertransformaties.

Venster, functie Opdracht
cumeDist De functie CumeDist berekent de positie van een waarde ten opzichte van alle waarden in de partitie. Het resultaat is het aantal rijen dat voorafgaat aan of gelijk is aan de huidige rij in de volgorde van de partitie gedeeld door het totale aantal rijen in de vensterpartitie. Eventuele gelijkmakende waarden in de volgorde evalueren op dezelfde positie.
denseRank Berekent de rangschikking van een waarde in een groep waarden die zijn opgegeven in de volgorde van een venster per component. Het resultaat is één plus het aantal rijen dat voorafgaat aan of gelijk is aan de huidige rij in de volgorde van de partitie. De waarden produceren geen hiaten in de reeks. Dense Rank werkt zelfs wanneer gegevens niet worden gesorteerd en zoekt naar wijzigingen in waarden.
Lag Hiermee haalt u de waarde op van de eerste parameter die n rijen vóór de huidige rij heeft geëvalueerd. De tweede parameter is het aantal rijen om terug te kijken en de standaardwaarde is 1. Als er niet zoveel rijen zijn als een waarde van null wordt geretourneerd, tenzij er een standaardwaarde is opgegeven.
lood Hiermee haalt u de waarde op van de eerste parameter die n rijen na de huidige rij heeft geëvalueerd. De tweede parameter is het aantal rijen om vooruit te kijken en de standaardwaarde is 1. Als er niet zoveel rijen zijn als een waarde van null wordt geretourneerd, tenzij er een standaardwaarde is opgegeven.
nTile De NTile functie verdeelt de rijen voor elke vensterpartitie in n buckets van maximaal 1 tot maximaal n. Bucketwaarden verschillen maximaal 1. Als het aantal rijen in de partitie niet gelijkmatig wordt verdeeld in het aantal buckets, worden de restwaarden één per bucket verdeeld, te beginnen met de eerste bucket. De NTile functie is handig voor de berekening van tertileskwartielen, deciles en andere algemene samenvattingsstatistieken. De functie berekent twee variabelen tijdens de initialisatie: de grootte van een gewone bucket bevat één extra rij. Beide variabelen zijn gebaseerd op de grootte van de huidige partitie. Tijdens het berekeningsproces houdt de functie het huidige rijnummer, het huidige bucketnummer en het rijnummer bij waarop de bucket wordt gewijzigd (bucketThreshold). Wanneer het huidige rijnummer de bucketdrempel bereikt, wordt de bucketwaarde met één verhoogd en wordt de drempelwaarde verhoogd door de bucketgrootte (plus één extra als de huidige bucket is opgevuld).
rang Berekent de rangschikking van een waarde in een groep waarden die zijn opgegeven in de volgorde van een venster per component. Het resultaat is één plus het aantal rijen dat voorafgaat aan of gelijk is aan de huidige rij in de volgorde van de partitie. De waarden produceren hiaten in de reeks. Rangschikking werkt zelfs wanneer gegevens niet worden gesorteerd en zoekt naar wijzigingen in waarden.
rowNumber Hiermee wordt een sequentiële rijnummering toegewezen voor rijen in een venster dat begint met 1.