Sdílet prostřednictvím


Agregační funkce v mapování toků dat

PLATÍ PRO: Azure Data Factory Azure Synapse Analytics

Tip

Vyzkoušejte si službu Data Factory v Microsoft Fabric, řešení pro analýzy typu all-in-one pro podniky. Microsoft Fabric zahrnuje všechno od přesunu dat až po datové vědy, analýzy v reálném čase, business intelligence a vytváření sestav. Přečtěte si, jak začít používat novou zkušební verzi zdarma.

Toky dat jsou k dispozici v kanálech Azure Data Factory i v kanálech Azure Synapse Analytics. Tento článek se týká mapování toků dat. Pokud s transformacemi začínáte, přečtěte si úvodní článek Transformace dat pomocí mapování toků dat.

Tento článek obsahuje podrobnosti o agregačních funkcích podporovaných službou Azure Data Factory a Azure Synapse Analytics při mapování toků dat.

Seznam agregačních funkcí

Následující funkce jsou k dispozici pouze v agregaci, kontingenční tabulce, rozvázání kontingenční tabulky a okenních transformacích.

Agregační funkce Úloha
ccaDistinctCount Získá přibližný agregovaný počet jedinečných hodnot pro sloupec. Volitelným druhým parametrem je kontrola chyby odhadu.
průměr Získá průměr hodnot sloupce.
avgIf Získá průměr hodnot sloupce na základě kritérií.
shromáždit Shromažďuje všechny hodnoty výrazu v agregované skupině do pole. Během tohoto procesu můžete shromažďovat a transformovat struktury na alternativní struktury. Počet položek se rovná počtu řádků v dané skupině a může obsahovat hodnoty null. Počet shromážděných položek by měl být malý.
collectUnique Shromažďuje všechny hodnoty výrazu v agregované skupině do jedinečného pole. Během tohoto procesu můžete shromažďovat a transformovat struktury na alternativní struktury. Počet položek je menší nebo roven počtu řádků v dané skupině a může obsahovat hodnoty null. Počet shromážděných položek by měl být malý.
count Získá agregovaný počet hodnot. Pokud jsou zadány volitelné sloupce, ignoruje NULL hodnoty v počtu.
countAll Získá agregovaný počet hodnot včetně NULL hodnot.
countDistinct Získá agregovaný počet jedinečných hodnot sady sloupců.
countAllDistinct Získá agregovaný počet jedinečných hodnot množiny sloupců včetně NULL hodnot.
countIf Získá agregovaný počet hodnot na základě kritérií. Pokud je specifikován volitelný sloupec, počítání ignoruje hodnoty NULL.
kovariancePopulace Získá kovarianci základního souboru mezi dvěma sloupci.
kovariancePopulationIf Získá populační kovarianci dvou sloupců na základě kritérií.
kovarianceSample Získá kovarianci vzorku dvou sloupců.
kovarianceSampleIf Získá kovarianci vzorku dvou sloupců na základě kritérií.
první Získá první hodnotu skupiny sloupců. Pokud druhý parametr ignoreNulls vynecháte, předpokládá se nepravda.
isDistinct Najde, jestli je sloupec nebo sada sloupců odlišná. Nezapočítává hodnotu null jako jedinečnou hodnotu.
kurtóza Získá kurtózu sloupce.
kurtosisIf Vypočítá kurtózu sloupce podle stanovených kritérií.
poslední Získá poslední hodnotu skupiny sloupců. Pokud druhý parametr ignoreNulls vynecháte, předpokládá se nepravda.
Max Získá maximální hodnotu sloupce.
maxIf Získá maximální hodnotu sloupce na základě kritérií.
znamenat Získá střední hodnotu hodnot sloupce. Stejné jako AVG.
meanIf Získá střední hodnotu hodnot sloupce na základě kritérií. Stejné jako avgIf.
Min Získá minimální hodnotu sloupce.
minIf Získá minimální hodnotu sloupce na základě kritérií.
šikmost Získá nerovnoměrnou distribuci sloupce.
skewnessIf Získá nerovnoměrnou distribuci sloupce na základě kritérií.
stddev Získá směrodatnou odchylku sloupce.
stddevIf Získá směrodatnou odchylku sloupce na základě kritérií.
stddevPopulation Získá směrodatnou odchylku základního souboru sloupce.
stddevPopulationIf Vypočítá směrodatnou odchylku populace sloupce na základě specifikovaných kritérií.
stddevSample Získá vzorovou směrodatnou odchylku sloupce.
stddevSampleIf Získá směrodatnou odchylku vzorku sloupce na základě kritérií.
součet Získá agregovaný součet číselného sloupce.
sumDistinct Získá agregovaný součet jedinečných hodnot číselného sloupce.
sumDistinctIf Získá agregovaný součet číselného sloupce na základě kritérií. Podmínka může být založená na libovolném sloupci.
sumIf Získá agregovaný součet číselného sloupce na základě kritérií. Podmínka může být založená na libovolném sloupci.
topN Získá nejvyšší N hodnoty pro tento sloupec.
odchylka Získá odchylku sloupce.
varianceIf Získá rozptyl sloupce na základě kritérií.
variancePopulation Získá rozptyl základního souboru sloupce.
variancePopulationIf Získá rozptyl populace sloupce na základě kritérií.
varianceSample Získá nestrannou odchylku sloupce.
varianceSampleIf Získá nestrannou odchylku sloupce na základě kritérií.