Funções de agregação no fluxo de dados de mapeamento
APLICA-SE A: Azure Data Factory Azure Synapse Analytics
Dica
Experimente o Data Factory no Microsoft Fabric, uma solução de análise tudo-em-um para empresas. O Microsoft Fabric abrange desde movimentação de dados até ciência de dados, análise em tempo real, business intelligence e relatórios. Saiba como iniciar uma avaliação gratuita!
Os fluxos de dados estão disponíveis nos pipelines do Azure Data Factory e do Azure Synapse. Este artigo se aplica ao fluxo de dados de mapeamento. Se você for iniciante nas transformações, veja o artigo introdutório Transformar dados usando um fluxo de dados de mapeamento.
Os artigos a seguir fornecem detalhes sobre as funções de agregação com suporte no Azure Data Factory e no Azure Synapse Analytics nos fluxos de dados de mapeamento.
Somente lista de funções
As funções a seguir só estão disponíveis em transformações agregadas, dinâmicas, não dinâmicas e de janela.
Função de agregação | Tarefa |
---|---|
approxDistinctCount | Obtém a contagem de agregação aproximada de valores distintos para uma coluna. O segundo parâmetro opcional é controlar o erro de estimativa. |
avg | Obtém a média dos valores de uma coluna. |
avgIf | Com base em um critério, obtém a média dos valores de uma coluna. |
collect | Coleta todos os valores da expressão no grupo agregado em uma matriz. As estruturas podem ser coletadas e transformadas em estruturas alternativas durante esse processo. O número de itens será igual ao número de linhas nesse grupo e poderá conter valores nulos. O número de itens coletados deve ser pequeno. |
collectUnique | Coleta todos os valores da expressão no grupo agregado em uma matriz exclusiva. As estruturas podem ser coletadas e transformadas em estruturas alternativas durante esse processo. O número de itens será igual ao número de linhas nesse grupo, e pode conter valores nulos. O número de itens coletados deve ser pequeno. |
contagem | Obtém a contagem agregada de valores. Se a coluna opcional for especificada, ela ignorará os valores NULL na contagem. |
countAll | Obtém a contagem agregada de valores, incluindo NULOS. |
countDistinct | Obtém a contagem agregada de valores distintos de um conjunto de colunas. |
countAllDistinct | Obtém a contagem agregada de valores distintos de um conjunto de colunas, incluindo NULOS. |
countIf | Com base em um critério, obtém a contagem agregada de valores. Se a coluna opcional for especificada, ela ignorará os valores NULL na contagem. |
covariancePopulation | Obtém a covariância de população entre duas colunas. |
covariancePopulationIf | Com base em um critério, obtém a covariância de população de duas colunas. |
covarianceSample | Obtém a covariância de amostra de duas colunas. |
covarianceSampleIf | Com base em um critério, obtém a covariância de amostra de duas colunas. |
first | Obtém o primeiro valor de um grupo de colunas. Se o segundo parâmetro ignoreNulls for omitido, será considerado false. |
isDistinct | Localiza se uma coluna ou conjunto de colunas for diferente. Não contabiliza nulo como um valor distinto |
kurtosis | Obtém a curtose de uma coluna. |
kurtosisIf | Com base em um critério, obtém a curtose de uma coluna. |
last | Obtém o último valor de um grupo de colunas. Se o segundo parâmetro ignoreNulls for omitido, será considerado false. |
max | Obtém o valor máximo de uma coluna. |
maxIf | Com base em um critério, obtém o valor máximo de uma coluna. |
mean | Obtém a média dos valores de uma coluna. Igual a AVG. |
meanIf | Com base em um critério, obtém a média dos valores de uma coluna. Igual a avgIf. |
min | Obtém o valor mínimo de uma coluna. |
minIf | Com base em um critério, obtém o valor mínimo de uma coluna. |
skewness | Obtém a distorção de uma coluna. |
skewnessIf | Com base em um critério, obtém a distorção de uma coluna. |
stddev | Obtém o desvio padrão de uma coluna. |
stddevIf | Com base em um critério, obtém o desvio padrão de uma coluna. |
stddevPopulation | Obtém o desvio padrão de população de uma coluna. |
stddevPopulationIf | Com base em um critério, obtém o desvio padrão de população de uma coluna. |
stddevSample | Obtém o desvio padrão de amostra de uma coluna. |
stddevSampleIf | Com base em um critério, obtém o desvio padrão de amostra de uma coluna. |
sum | Obtém a soma agregada de uma coluna numérica. |
sumDistinct | Obtém a soma agregada de valores distintos de uma coluna numérica. |
sumDistinctIf | Com base em um critério, obtém a soma agregada de uma coluna numérica. A condição pode ser baseada em qualquer coluna. |
sumIf | Com base em um critério, obtém a soma agregada de uma coluna numérica. A condição pode ser baseada em qualquer coluna. |
topN | Obtém os maiores valores N dessa coluna. |
variance | Obtém a variação de uma coluna. |
varianceIf | Com base em um critério, obtém a variação de uma coluna. |
variancePopulation | Obtém a variação de população de uma coluna. |
variancePopulationIf | Com base em um critério, obtém a variação de população de uma coluna. |
varianceSample | Obtém a variação não polarizada de uma coluna. |
varianceSampleIf | Com base em um critério, obtém a variação não polarizada de uma coluna. |
Conteúdo relacionado
- Lista de todas as funções de matriz.
- Lista de todas as funções de pesquisa em cache.
- Lista de todas as funções de conversão.
- Lista de todas as funções de data e hora.
- Lista de todas as funções de expressão.
- Lista de todas as funções de mapa.
- Lista de todas as metafunções.
- Lista de todas as funções de janela.
- Detalhes de uso de todas as expressões de transformação de dados.
- Saiba como usar o Construtor de Expressões.