Freigeben über


Aggregatfunktionen im Zuordnungsdatenfluss

GILT FÜR: Azure Data Factory Azure Synapse Analytics

Tipp

Testen Sie Data Factory in Microsoft Fabric, eine All-in-One-Analyselösung für Unternehmen. Microsoft Fabric deckt alle Aufgaben ab, von der Datenverschiebung bis hin zu Data Science, Echtzeitanalysen, Business Intelligence und Berichterstellung. Erfahren Sie, wie Sie kostenlos eine neue Testversion starten!

Datenflüsse sind sowohl in Azure Data Factory als auch in Azure Synapse-Pipelines verfügbar. Dieser Artikel gilt für Zuordnungsdatenflüsse. Wenn Sie noch nicht mit Transformationen arbeiten, lesen Sie den Einführungsartikel Transformieren von Daten mit einem Zuordnungsdatenfluss.

Der folgende Artikel enthält Details zu Aggregatfunktionen, die von Azure Data Factory und Azure Synapse Analytics in Zuordnungsdatenflüssen unterstützt werden.

Aggregatfunktionsliste

Die folgenden Funktionen stehen nur in Transformationen vom Typ „Aggregieren“, „Pivotieren“, „Entpivotieren“ und „Fenster“ zur Verfügung.

Aggregate-Funktion Aufgabe
approxDistinctCount Ruft die ungefähre aggregierte Anzahl unterschiedlicher Werte für eine Spalte ab. Der optionale zweite Parameter dient zur Kontrolle des Schätzfehlers.
avg Ruft den Durchschnitt der Werte einer Spalte ab.
avgIf Ruft den Durchschnitt der Werte einer Spalte basierend auf einem Kriterium ab.
collect Sammelt alle Werte des Ausdrucks in der aggregierten Gruppe in einem Array. Während dieses Prozesses können Strukturen gesammelt und in alternative Strukturen transformiert werden. Die Anzahl der Elemente ist gleich der Anzahl der Zeilen in dieser Gruppe und kann NULL-Werte enthalten. Die Anzahl der gesammelten Elemente sollte klein sein.
collectUnique Sammelt alle Werte des Ausdrucks in der aggregierten Gruppe in einem eindeutigen Array. Während dieses Prozesses können Strukturen gesammelt und in alternative Strukturen umgewandelt werden. Die Anzahl der Elemente entspricht höchstens der Anzahl der Zeilen in dieser Gruppe und kann Nullwerte enthalten. Die Anzahl der gesammelten Elemente sollte klein sein.
count Ruft die aggregierte Anzahl von Werten ab. Wenn optionale Spalten angegeben sind, werden NULL-Werte in der Anzahl ignoriert.
countAll Ruft die aggregierte Anzahl von Werten ab, einschließlich NULL.
countDistinct Ruft die aggregierte Anzahl unterschiedlicher Werte für eine Gruppe von Spalten ab.
countAllDistinct Ruft die aggregierte Anzahl unterschiedlicher Werte einer Spaltengruppe ab, einschließlich NULL.
countIf Ruft die aggregierte Anzahl von Werten basierend auf einem Kriterium ab. Wenn die optionale Spalte angegeben ist, werden NULL-Werte in der Anzahl ignoriert.
covariancePopulation Ruft die Kovarianz der Population zweier Spalten ab.
covariancePopulationIf Ruft die Kovarianz der Population zweier Spalten basierend auf einem Kriterium ab.
covarianceSample Ruft die Kovarianz einer Stichprobe zweier Spalten ab.
covarianceSampleIf Ruft die Kovarianz einer Stichprobe zweier Spalten basierend auf einem Kriterium ab.
first Ruft den ersten Wert einer Spaltengruppe ab. Wenn der zweite Parameter ignoreNulls nicht angegeben ist, wird dafür FALSE angenommen.
isDistinct Stellt fest, ob eine Spalte oder eine Gruppe von Spalten eindeutig ist. Null wird nicht als eigener Wert gezählt
kurtosis Ruft die Kurtosis einer Spalte ab.
kurtosisIf Ruft die Kurtosis einer Spalte basierend auf einem Kriterium ab.
last Ruft den letzten Wert einer Spaltengruppe ab. Wenn der zweite Parameter ignoreNulls nicht angegeben ist, wird dafür FALSE angenommen.
max Ruft den größten Wert einer Spalte ab.
maxIf Ruft den größten Wert einer Spalte basierend auf einem Kriterium ab.
mean Ruft das Mittel der Werte einer Spalte ab. Entspricht AVG.
meanIf Ruft das Mittel der Werte einer Spalte basierend auf einem Kriterium ab. Entspricht „avgIf“.
min Ruft den kleinsten Wert einer Spalte ab.
minIf Ruft den kleinsten Wert einer Spalte basierend auf einem Kriterium ab.
skewness Ruft die Schiefe einer Spalte ab.
skewnessIf Ruft die Schiefe einer Spalte basierend auf einem Kriterium ab.
stddev Ruft die Standardabweichung einer Spalte ab.
stddevIf Ruft die Standardabweichung einer Spalte basierend auf einem Kriterium ab.
stddevPopulation Ruft die Standardabweichung der Population einer Spalte ab.
stddevPopulationIf Ruft die Standardabweichung der Population einer Spalte basierend auf einem Kriterium ab.
stddevSample Ruft die Standardabweichung einer Stichprobe einer Spalte ab.
stddevSampleIf Ruft die Standardabweichung einer Stichprobe einer Spalte basierend auf einem Kriterium ab.
sum Ruft die aggregierte Summe einer numerischen Spalte ab.
sumDistinct Ruft die aggregierte Summe unterschiedlicher Werte einer numerischen Spalte ab.
sumDistinctIf Ruft die aggregierte Summe einer numerischen Spalte basierend auf Kriterien ab. Die Bedingung kann auf jeder Spalte basieren.
sumIf Ruft die aggregierte Summe einer numerischen Spalte basierend auf Kriterien ab. Die Bedingung kann auf jeder Spalte basieren.
topN Ruft die obersten N-Werte für diese Spalte ab.
variance Ruft die Varianz einer Spalte ab.
varianceIf Ruft die Varianz einer Spalte basierend auf einem Kriterium ab.
variancePopulation Ruft die Varianz der Population einer Spalte ab.
variancePopulationIf Ruft die Varianz der Population einer Spalte basierend auf einem Kriterium ab.
varianceSample Ruft die ausgewogene Varianz einer Spalte ab.
varianceSampleIf Ruft die ausgewogene Varianz einer Spalte basierend auf einem Kriterium ab.