Agregační funkce v mapování toků dat

VZTAHUJE SE NA: Azure Data Factory Azure Synapse Analytics

Tip

Data Factory v Microsoft Fabric je nová generace Azure Data Factory s jednodušší architekturou, integrovanou AI a novými funkcemi. Pokud s integrací dat začínáte, začněte Fabric Data Factory. Stávající úlohy ADF lze upgradovat na Fabric pro přístup k novým funkcím v oblastech datové vědy, analýz v reálném čase a vytváření sestav.

Toky dat jsou k dispozici v kanálech Azure Data Factory i v kanálech Azure Synapse Analytics. Tento článek se týká mapování toků dat. Pokud s transformacemi začínáte, přečtěte si úvodní článek Transformace dat pomocí mapování toků dat.

Tento článek obsahuje podrobnosti o agregačních funkcích podporovaných Azure Data Factory a Azure Synapse Analytics při mapování toků dat.

Seznam agregačních funkcí

Následující funkce jsou k dispozici pouze v agregaci, kontingenční tabulce, rozvázání kontingenční tabulky a okenních transformacích.

Agregační funkce Úloha
approxDistinctCount Získá přibližný agregovaný počet jedinečných hodnot pro sloupec. Volitelným druhým parametrem je kontrola chyby odhadu.
průměr Získá průměr hodnot sloupce.
avgIf Získá průměr hodnot sloupce na základě kritérií.
shromáždit Shromažďuje všechny hodnoty výrazu v agregované skupině do pole. Během tohoto procesu můžete shromažďovat a transformovat struktury na alternativní struktury. Počet položek se rovná počtu řádků v dané skupině a může obsahovat hodnoty null. Počet shromážděných položek by měl být malý.
collectUnique Shromažďuje všechny hodnoty výrazu v agregované skupině do jedinečného pole. Během tohoto procesu můžete shromažďovat a transformovat struktury na alternativní struktury. Počet položek je menší nebo roven počtu řádků v dané skupině a může obsahovat hodnoty null. Počet shromážděných položek by měl být malý.
count Získá agregovaný počet hodnot. Pokud jsou zadány volitelné sloupce, ignoruje NULL hodnoty v počtu.
countAll Získá agregovaný počet hodnot včetně NULL hodnot.
countDistinct Získá agregovaný počet jedinečných hodnot sady sloupců.
countAllDistinct Získá agregovaný počet jedinečných hodnot množiny sloupců včetně NULL hodnot.
countIf Získá agregovaný počet hodnot na základě kritérií. Pokud je specifikován volitelný sloupec, počítání ignoruje hodnoty NULL.
kovariancePopulace Získává populační kovarianci mezi dvěma sloupci.
covariancePopulationIf Získá populační kovarianci dvou sloupců na základě kritérií.
covarianceSample Získá hodnotu kovariance vzorku pro dva sloupce.
kovarianceSampleIf Získá kovarianci vzorku dvou sloupců na základě kritérií.
první Získá první hodnotu skupiny sloupců. Pokud druhý parametr ignoreNulls vynecháte, předpokládá se nepravda.
isDistinct Najde, jestli je sloupec nebo sada sloupců odlišná. Nezapočítává hodnotu null jako jedinečnou hodnotu.
kurtóza Získá kurtózu sloupce.
kurtosisIf Vypočítá kurtózu sloupce podle stanovených kritérií.
poslední Získá poslední hodnotu skupiny sloupců. Pokud druhý parametr ignoreNulls vynecháte, předpokládá se nepravda.
max Získá maximální hodnotu sloupce.
maxIf Získá maximální hodnotu sloupce na základě kritérií.
znamenat Získá střední hodnotu hodnot sloupce. Stejné jako AVG.
meanIf Získá střední hodnotu hodnot sloupce na základě kritérií. Stejné jako avgIf.
min Získá minimální hodnotu sloupce.
minIf Získá minimální hodnotu sloupce na základě kritérií.
šikmost Získá nerovnoměrnou distribuci sloupce.
skewnessIf Získá nerovnoměrnou distribuci sloupce na základě kritérií.
stddev Získá směrodatnou odchylku sloupce.
stddevIf Získá směrodatnou odchylku sloupce na základě kritérií.
stddevPopulation Získá směrodatnou odchylku populace pro sloupec.
stddevPopulationIf Vypočítá směrodatnou odchylku populace sloupce na základě specifikovaných kritérií.
stddevSample Získá vzorovou směrodatnou odchylku sloupce.
stddevSampleIf Získá směrodatnou odchylku vzorku sloupce na základě kritérií.
součet Získá agregovaný součet číselného sloupce.
sumDistinct Získá agregovaný součet jedinečných hodnot číselného sloupce.
sumDistinctIf Získá agregovaný součet číselného sloupce na základě kritérií. Podmínka může být založená na libovolném sloupci.
sumIf Získá agregovaný součet číselného sloupce na základě kritérií. Podmínka může být založená na libovolném sloupci.
topN Získá nejvyšší N hodnoty pro tento sloupec.
odchylka Získá rozptyl sloupce.
varianceIf Získá rozptyl sloupce na základě kritérií.
variancePopulation Získává populační rozptyl sloupce.
variancePopulationIf Získá rozptyl populace sloupce na základě kritérií.
varianceSample Získá nestrannou varianci sloupce.
varianceSampleIf Získá nestrannou odchylku sloupce na základě kritérií.