Comparteix a través de


Funciones de agregado en el flujo de datos de asignación

SE APLICA A: Azure Data Factory Azure Synapse Analytics

Sugerencia

Pruebe Data Factory en Microsoft Fabric, una solución de análisis todo en uno para empresas. Microsoft Fabric abarca todo, desde el movimiento de datos hasta la ciencia de datos, el análisis en tiempo real, la inteligencia empresarial y los informes. Obtenga información sobre cómo iniciar una nueva evaluación gratuita.

Los flujos de datos están disponibles en las canalizaciones Azure Data Factory y Azure Synapse. Este artículo se aplica a los flujos de datos de asignación. Si carece de experiencia con las transformaciones, consulte el artículo de introducción Transformación de datos mediante flujos de datos de asignación.

En los siguientes artículos se proporcionan detalles sobre las funciones de agregado compatibles con Azure Data Factory y Azure Synapse Analytics en los flujos de datos de asignación.

Lista de funciones de agregado

Las siguientes funciones solo están disponibles para las transformaciones de agregado, dinamización, anulación de dinamización y ventana.

Aggregate, función Tarea
approxDistinctCount Obtiene el recuento agregado aproximado de valores distintos para una columna. El segundo parámetro opcional es controlar el error de estimación.
avg Obtiene el promedio de valores de una columna.
avgIf En función de los criterios, obtiene el promedio de valores de una columna.
collect Recopila todos los valores de la expresión del grupo agregado en una matriz. Las estructuras se pueden recopilar y transformar en estructuras alternativas durante este proceso. El número de elementos será igual al número de filas de ese grupo y puede contener valores NULL. El número de elementos recopilados debe ser pequeño.
collectUnique Recopila todos los valores de la expresión del grupo agregado en una matriz única. Las estructuras se pueden recopilar y transformar en estructuras alternativas durante este proceso. El número de elementos será menor o igual al número de filas de ese grupo, y puede contener valores null. El número de elementos recopilados debe ser pequeño.
count Obtiene el recuento agregado de valores. Si se especifican las columnas opcionales, omite los valores NULL en el recuento.
countAll Obtiene el recuento agregado de valores, incluidos los valores NULL.
countDistinct Obtiene el recuento agregado de valores distintos de un conjunto de columnas.
countAllDistinct Obtiene el recuento agregado de valores distintos de un conjunto de columnas, incluidos los valores NULL.
countIf En función de los criterios, obtiene el recuento agregado de valores. Si se especifica la columna opcional, omite los valores NULL en el recuento.
covariancePopulation Obtiene la covarianza de la población entre dos columnas.
covariancePopulationIf En función de los criterios, obtiene la covarianza de la población de dos columnas.
covarianceSample Obtiene la covarianza de muestra de dos columnas.
covarianceSampleIf En función de los criterios, obtiene la covarianza de muestra de dos columnas.
first Obtiene el primer valor de un grupo de columnas. Si el segundo parámetro ignoreNulls se omite, se supone que es falso.
isDistinct Busca si una columna o un conjunto de columnas es distinto. No cuenta NULL como valor distinto
kurtosis Obtiene la curtosis de una columna.
kurtosisIf En función de los criterios, obtiene la curtosis de una columna.
last Obtiene el último valor de un grupo de columnas. Si el segundo parámetro ignoreNulls se omite, se supone que es falso.
max Obtiene el valor máximo de una columna.
maxIf En función de los criterios, obtiene el valor máximo de una columna.
mean Obtiene la media de valores de una columna. Igual que AVG.
meanIf En función de los criterios, obtiene la media de valores de una columna. Igual que avgIf.
min Obtiene el valor mínimo de una columna.
minIf En función de los criterios, obtiene el valor mínimo de una columna.
skewness Obtiene la asimetría de una columna.
skewnessIf En función de los criterios, obtiene la asimetría de una columna.
stddev Obtiene la desviación estándar de una columna.
stddevIf En función de los criterios, obtiene la desviación estándar de una columna.
stddevPopulation Obtiene la desviación estándar de población de una columna.
stddevPopulationIf En función de los criterios, obtiene la desviación estándar de población de una columna.
stddevSample Obtiene la desviación estándar de muestra de una columna.
stddevSampleIf En función de los criterios, obtiene la desviación estándar de muestra de una columna.
sum Obtiene la suma de agregados de una columna numérica.
sumDistinct Obtiene la suma de agregados de valores distintos de una columna numérica.
sumDistinctIf En función de los criterios, obtiene la suma de agregados de una columna numérica. La condición se puede basar en cualquier columna.
sumIf En función de los criterios, obtiene la suma de agregados de una columna numérica. La condición se puede basar en cualquier columna.
topN Obtiene los valores N principales de esta columna.
variance Obtiene la varianza de una columna.
varianceIf En función de los criterios, obtiene la varianza de una columna.
variancePopulation Obtiene la varianza de población de una columna.
variancePopulationIf En función de los criterios, obtiene la varianza de población de una columna.
varianceSample Obtiene la varianza no sesgada de una columna.
varianceSampleIf En función de los criterios, obtiene la varianza no sesgada de una columna.