Compartilhar via


Funções de agregação no fluxo de dados de mapeamento

APLICA-SE A: Azure Data Factory Azure Synapse Analytics

Dica

Experimente o Data Factory no Microsoft Fabric, uma solução de análise tudo-em-um para empresas. O Microsoft Fabric abrange desde movimentação de dados até ciência de dados, análise em tempo real, business intelligence e relatórios. Saiba como iniciar uma avaliação gratuita!

Os fluxos de dados estão disponíveis nos pipelines do Azure Data Factory e do Azure Synapse. Este artigo se aplica ao fluxo de dados de mapeamento. Se você for iniciante nas transformações, veja o artigo introdutório Transformar dados usando um fluxo de dados de mapeamento.

Os artigos a seguir fornecem detalhes sobre as funções de agregação com suporte no Azure Data Factory e no Azure Synapse Analytics nos fluxos de dados de mapeamento.

Somente lista de funções

As funções a seguir só estão disponíveis em transformações agregadas, dinâmicas, não dinâmicas e de janela.

Função de agregação Tarefa
approxDistinctCount Obtém a contagem de agregação aproximada de valores distintos para uma coluna. O segundo parâmetro opcional é controlar o erro de estimativa.
avg Obtém a média dos valores de uma coluna.
avgIf Com base em um critério, obtém a média dos valores de uma coluna.
collect Coleta todos os valores da expressão no grupo agregado em uma matriz. As estruturas podem ser coletadas e transformadas em estruturas alternativas durante esse processo. O número de itens será igual ao número de linhas nesse grupo e poderá conter valores nulos. O número de itens coletados deve ser pequeno.
collectUnique Coleta todos os valores da expressão no grupo agregado em uma matriz exclusiva. As estruturas podem ser coletadas e transformadas em estruturas alternativas durante esse processo. O número de itens será igual ao número de linhas nesse grupo, e pode conter valores nulos. O número de itens coletados deve ser pequeno.
contagem Obtém a contagem agregada de valores. Se a coluna opcional for especificada, ela ignorará os valores NULL na contagem.
countAll Obtém a contagem agregada de valores, incluindo NULOS.
countDistinct Obtém a contagem agregada de valores distintos de um conjunto de colunas.
countAllDistinct Obtém a contagem agregada de valores distintos de um conjunto de colunas, incluindo NULOS.
countIf Com base em um critério, obtém a contagem agregada de valores. Se a coluna opcional for especificada, ela ignorará os valores NULL na contagem.
covariancePopulation Obtém a covariância de população entre duas colunas.
covariancePopulationIf Com base em um critério, obtém a covariância de população de duas colunas.
covarianceSample Obtém a covariância de amostra de duas colunas.
covarianceSampleIf Com base em um critério, obtém a covariância de amostra de duas colunas.
first Obtém o primeiro valor de um grupo de colunas. Se o segundo parâmetro ignoreNulls for omitido, será considerado false.
isDistinct Localiza se uma coluna ou conjunto de colunas for diferente. Não contabiliza nulo como um valor distinto
kurtosis Obtém a curtose de uma coluna.
kurtosisIf Com base em um critério, obtém a curtose de uma coluna.
last Obtém o último valor de um grupo de colunas. Se o segundo parâmetro ignoreNulls for omitido, será considerado false.
max Obtém o valor máximo de uma coluna.
maxIf Com base em um critério, obtém o valor máximo de uma coluna.
mean Obtém a média dos valores de uma coluna. Igual a AVG.
meanIf Com base em um critério, obtém a média dos valores de uma coluna. Igual a avgIf.
min Obtém o valor mínimo de uma coluna.
minIf Com base em um critério, obtém o valor mínimo de uma coluna.
skewness Obtém a distorção de uma coluna.
skewnessIf Com base em um critério, obtém a distorção de uma coluna.
stddev Obtém o desvio padrão de uma coluna.
stddevIf Com base em um critério, obtém o desvio padrão de uma coluna.
stddevPopulation Obtém o desvio padrão de população de uma coluna.
stddevPopulationIf Com base em um critério, obtém o desvio padrão de população de uma coluna.
stddevSample Obtém o desvio padrão de amostra de uma coluna.
stddevSampleIf Com base em um critério, obtém o desvio padrão de amostra de uma coluna.
sum Obtém a soma agregada de uma coluna numérica.
sumDistinct Obtém a soma agregada de valores distintos de uma coluna numérica.
sumDistinctIf Com base em um critério, obtém a soma agregada de uma coluna numérica. A condição pode ser baseada em qualquer coluna.
sumIf Com base em um critério, obtém a soma agregada de uma coluna numérica. A condição pode ser baseada em qualquer coluna.
topN Obtém os maiores valores N dessa coluna.
variance Obtém a variação de uma coluna.
varianceIf Com base em um critério, obtém a variação de uma coluna.
variancePopulation Obtém a variação de população de uma coluna.
variancePopulationIf Com base em um critério, obtém a variação de população de uma coluna.
varianceSample Obtém a variação não polarizada de uma coluna.
varianceSampleIf Com base em um critério, obtém a variação não polarizada de uma coluna.