Teilen über


Fensterfunktionen in der Zuordnung von Datenflüssen

GILT FÜR: Azure Data Factory Azure Synapse Analytics

Tipp

Testen Sie Data Factory in Microsoft Fabric, eine All-in-One-Analyselösung für Unternehmen. Microsoft Fabric deckt alle Aufgaben ab, von der Datenverschiebung bis hin zu Data Science, Echtzeitanalysen, Business Intelligence und Berichterstellung. Erfahren Sie, wie Sie kostenlos eine neue Testversion starten!

Datenflüsse sind sowohl in Azure Data Factory-Pipelines als auch in Azure Synapse Analytics-Pipelines verfügbar. Dieser Artikel gilt für Datenflusszuordnungen. Wenn Sie mit Transformationen noch nicht fertig sind, lesen Sie den einführungsartikel Transformieren von Daten mithilfe von Zuordnungsdatenflüssen.

Dieser Artikel enthält Details zu Fensterfunktionen, die von Azure Data Factory und Azure Synapse Analytics bei der Zuordnung von Datenflüssen unterstützt werden.

Liste der Fensterfunktionen

Die folgenden Funktionen sind nur in Fenstertransformationen verfügbar.

Fensterfunktion Aufgabe
cumeDist Berechnet die Position eines Werts relativ zu allen Werten in der Partition. Das Ergebnis ist die Anzahl der Zeilen vor der aktuellen Zeile oder gleich dieser in der Reihenfolge der Partition, dividiert durch die Gesamtanzahl von Zeilen in der Fensterpartition. Alle gleichwertigen Werte in der Reihenfolge werden zur derselben Position ausgewertet.
denseRank Berechnet den Rang eines Werts in einer Gruppe von Werten, die in der Reihenfolge eines Fensters nach Klausel angegeben sind. Das Ergebnis ist 1 plus der Anzahl der Zeilen, die vor der aktuellen Zeile liegen oder dieser gleich sind in der Reihenfolge der Partition. Die Werte erzeugen keine Lücken in der Sequenz. Die denseRank Funktion funktioniert auch dann, wenn Daten nicht sortiert sind und nach Änderungen in Werten suchen.
lag Ruft den Wert des ersten ausgewerteten n Parameters Zeilen vor der aktuellen Zeile ab. Der zweite Parameter ist die Anzahl der Zeilen, die zurückgegeben werden sollen, und der Standardwert ist 1. Wenn nicht so viele Zeilen vorhanden sind, wird ein Wert zurückgegeben null , es sei denn, ein Standardwert wird angegeben.
lead Ruft den Wert des ersten ausgewerteten n Parameters Zeilen nach der aktuellen Zeile ab. Der zweite Parameter ist die Anzahl der Zeilen, die vorwärts angezeigt werden sollen, und der Standardwert ist 1. Wenn nicht so viele Zeilen vorhanden sind, wird ein Wert zurückgegeben null , es sei denn, ein Standardwert wird angegeben.
nTile Teilt die Zeilen für jede Fensterpartition in n Buckets, die von 1 bis maximal n reichen. Bucketwerte unterscheiden sich um höchstens 1. Wenn die Anzahl der Zeilen in der Partition nicht gleichmäßig auf die Anzahl der Buckets verteilt werden kann, wird jeweils ein Restwert auf jeden Bucket verteilt, beginnend mit dem ersten Bucket. Die NTile-Funktion ist nützlich für die Berechnung von tertiles, Quartilen, Dezilen und anderen üblichen zusammenfassenden Statistiken.

Die Funktion berechnet zwei Variablen während der Initialisierung. Der Größe eines regulären Buckets wird eine zusätzliche Zeile hinzugefügt. Beide Variablen basieren auf der Größe der aktuellen Partition. Während des Berechnungsprozesses verfolgt die Funktion die aktuelle Zeilennummer, die aktuelle Bucketnummer und die Zeilennummer, an der sich der Bucket ändert (bucketThreshold). Wenn die aktuelle Zeilennummer den Bucketschwellenwert erreicht, wird der Bucketwert um eins erhöht. Der Schwellenwert wird um die Bucketgröße erhöht (zusätzlich um eins, wenn der aktuelle Bucket aufgefüllt ist).
rank Berechnet den Rang eines Werts in einer Gruppe von Werten, die in der Reihenfolge eines Fensters nach Klausel angegeben sind. Das Ergebnis ist 1 plus der Anzahl der Zeilen, die vor der aktuellen Zeile liegen oder dieser gleich sind in der Reihenfolge der Partition. Die Werte erzeugen Lücken in der Sequenz. Die rank Funktion funktioniert auch dann, wenn Daten nicht sortiert sind und nach Änderungen in Werten suchen.
rowNumber ** Vergibt eine sequenzielle Zahlenreihenfolge für Zeilen in einem Fenster, beginnend bei 1.