Compartir a través de


Funciones de agregado en flujos de datos de mapeo

SE APLICA A: Azure Data Factory Azure Synapse Analytics

Sugerencia

Pruebe Data Factory en Microsoft Fabric, una solución de análisis integral para empresas. Microsoft Fabric abarca todo, desde el movimiento de datos hasta la ciencia de datos, el análisis en tiempo real, la inteligencia empresarial y la creación de informes. Obtenga información sobre cómo iniciar una nueva evaluación gratuita.

Los flujos de datos están disponibles tanto en canalizaciones de Azure Data Factory como en canalizaciones de Azure Synapse Analytics. Este artículo se aplica a los flujos de datos de asignación. Si no está familiarizado con las transformaciones, consulte el artículo introductorio Transformación de datos mediante flujos de datos de asignación.

En este artículo se proporcionan detalles sobre las funciones de agregado compatibles con Azure Data Factory y Azure Synapse Análisis en los flujos de datos de mapeo.

Lista de funciones de agregado

Las siguientes funciones solo están disponibles para las transformaciones de agregado, dinamización, anulación de dinamización y ventana.

Aggregate, función Tarea
approxDistinctCount Obtiene el recuento agregado aproximado de valores distintos para una columna. El segundo parámetro opcional es controlar el error de estimación.
avg Obtiene el promedio de valores de una columna.
avgIf Obtiene el promedio de valores de una columna, en función de los criterios.
collect Recopila todos los valores de la expresión del grupo agregado en una matriz. Durante este proceso, puede recopilar y transformar estructuras en estructuras alternativas. El número de elementos es igual al número de filas de ese grupo y puede contener valores NULL. El número de elementos recopilados debe ser pequeño.
collectUnique Recopila todos los valores de la expresión del grupo agregado en una matriz única. Durante este proceso, puede recopilar y transformar estructuras en estructuras alternativas. El número de elementos es menor o igual que el número de filas de ese grupo y puede contener valores NULL. El número de elementos recopilados debe ser pequeño.
count Obtiene el recuento agregado de valores. Si se especifican las columnas opcionales, omite los NULL valores del recuento.
countAll Obtiene el recuento agregado de valores, incluidos los valores NULL.
countDistinct Obtiene el recuento agregado de valores distintos de un conjunto de columnas.
countAllDistinct Obtiene el recuento agregado de valores distintos de un conjunto de columnas, incluidos los valores NULL.
countIf Obtiene el recuento agregado de valores, en función de los criterios. Si se especifica la columna opcional, omite los NULL valores del recuento.
covariancePopulation Obtiene la covarianza de la población entre dos columnas.
covariancePopulationIf Obtiene la covarianza poblacional de dos columnas, basándose en criterios.
covarianceSample Obtiene la covarianza de muestra de dos columnas.
covarianceSampleIf Obtiene la covarianza muestral de dos columnas, en función de un criterio.
first Obtiene el primer valor de un grupo de columnas. Si se omite el segundo parámetro ignoreNulls , se supone false.
isDistinct Busca si una columna o un conjunto de columnas es distinto. No cuenta null como un valor distinto.
kurtosis Obtiene la curtosis de una columna.
kurtosisIf Obtiene la curtosis de una columna según criterios.
last Obtiene el último valor de un grupo de columnas. Si se omite el segundo parámetro ignoreNulls , se supone false.
max Obtiene el valor máximo de una columna.
maxIf Obtiene el valor máximo de una columna, en función de los criterios.
mean Obtiene la media de valores de una columna. Igual que AVG.
meanIf Obtiene la media de valores de una columna, basándose en criterios. Igual que avgIf.
min Obtiene el valor mínimo de una columna.
minIf Obtiene el valor mínimo de una columna, en función de los criterios.
skewness Obtiene la asimetría de una columna.
skewnessIf Obtiene la asimetría de una columna según ciertos criterios.
stddev Obtiene la desviación estándar de una columna.
stddevIf Obtiene la desviación estándar de una columna, en función de los criterios.
stddevPopulation Obtiene la desviación estándar de población de una columna.
stddevPopulationIf Obtiene la desviación estándar de población de una columna, en función de los criterios.
stddevSample Obtiene la desviación estándar de muestra de una columna.
stddevSampleIf Obtiene la desviación estándar de ejemplo de una columna, en función de los criterios.
sum Obtiene la suma de agregados de una columna numérica.
sumDistinct Obtiene la suma de agregados de valores distintos de una columna numérica.
sumDistinctIf Obtiene la suma agregada de una columna numérica, basada en criterios. La condición se puede basar en cualquier columna.
sumIf Obtiene la suma agregada de una columna numérica, basada en criterios. La condición se puede basar en cualquier columna.
topN Obtiene los valores principales N de esta columna.
variance Obtiene la varianza de una columna.
varianceIf Obtiene la varianza de una columna, basada en criterios.
variancePopulation Obtiene la varianza de población de una columna.
variancePopulationIf Obtiene la varianza poblacional de los valores en una columna, en función de los criterios.
varianceSample Obtiene la varianza no sesgada de una columna.
varianceSampleIf Obtiene la varianza no sesgada de una columna, basada en criterios.