Funções janela no mapeamento de fluxos de dados

APLICA-SE A: Azure Data Factory Azure Synapse Analytics

Gorjeta

Data Factory em Microsoft Fabric é a próxima geração de Azure Data Factory, com uma arquitetura mais simples, IA incorporada e novas funcionalidades. Se és novo na integração de dados, começa pelo Fabric Data Factory. As cargas de trabalho existentes do ADF podem atualizar para o Fabric para aceder a novas capacidades em ciência de dados, análise em tempo real e relatórios.

Os fluxos de dados estão disponíveis tanto nos pipelines do Azure Data Factory como no do Azure Synapse Analytics. Este artigo aplica-se ao mapeamento de fluxos de dados. Se você é novo em transformações, consulte o artigo introdutório Transformar dados usando fluxos de dados de mapeamento.

Este artigo fornece detalhes sobre funções de janela suportadas pelo Azure Data Factory e Azure Synapse Analytics no mapeamento de fluxos de dados.

Lista de funções da janela

As seguintes funções estão disponíveis apenas em transformações de janela.

Função janela	Task
cumeDist	Calcula a posição de um valor relativamente a todos os valores na partição. O resultado é o número de linhas anteriores ou iguais à linha atual na ordenação da partição dividido pelo número total de linhas na partição da janela. Quaisquer valores empatados na ordenação são avaliados para a mesma posição.
denseRank	Calcula a classificação de um valor em um grupo de valores especificados na ordem de uma janela por cláusula. O resultado é um mais o número de linhas anteriores ou iguais à linha atual na ordem da partição. Os valores não produzem lacunas na sequência. A `denseRank` função funciona mesmo quando os dados não estão organizados e procura alterações nos valores.
Atraso	Obtém o valor do primeiro parâmetro avaliado `n` linhas antes da linha atual. O segundo parâmetro é o número de linhas a consultar para trás, e o valor padrão é `1`. Se não houver tantas linhas, é devolvido um valor de `null` a menos que seja especificado um valor padrão.
Chumbo	Obtém o valor do primeiro parâmetro avaliado `n` nas linhas após a linha atual. O segundo parâmetro é o número de linhas a avançar, e o valor padrão é `1`. Se não houver tantas linhas, é devolvido um valor de `null` a menos que seja especificado um valor padrão.
nTile	Divide as linhas de cada partição de janela em `n` baldes que variam de `1` até no máximo `n`. Os valores dos baldes diferem em no máximo `1`. Se o número de linhas na partição não se dividir igualmente no número de baldes, os valores restantes são distribuídos um por balde, começando pelo primeiro balde. A `NTile` função é útil para o cálculo de `tertiles`, quartis, decilis e outras estatísticas resumidas comuns. A função calcula duas variáveis durante a inicialização. O tamanho de um balde normal inclui uma fila adicional. Ambas as variáveis são baseadas no tamanho da partição atual. Durante o processo de cálculo, a função acompanha o número da linha atual, o número do compartimento atual e o número da linha em que o compartimento muda (`bucketThreshold`). Quando o número da linha atual atinge o limiar do balde, o valor do balde aumenta em uma unidade. O limiar aumenta com o tamanho do balde (mais um extra se o balde atual estiver acolchoado).
Posição	Calcula a classificação de um valor em um grupo de valores especificados na ordem de uma janela por cláusula. O resultado é um mais o número de linhas anteriores ou iguais à linha atual na ordem da partição. Os valores produzem lacunas na sequência. A `rank` função funciona mesmo quando os dados não estão organizados e procura alterações nos valores.
número de linha	Atribui uma numeração sequencial de linhas para linhas numa janela que começa por `1`.

Lista de todas as funções agregadas.
Lista de todas as funções da matriz.
Lista de todas as funções de pesquisa em cache.
Lista de todas as funções de conversão.
Lista de todas as funções de data e hora.
Lista de todas as funções de expressão.
Lista de todas as funções do mapa.
Lista de todas as metafunções.
Detalhes de utilização de todas as expressões de transformação de dados.
Aprende a usar o Construtor de Expressões.

Comentários

Esta página foi útil?

Last updated on 2026-04-07

Partilhar via

Funções janela no mapeamento de fluxos de dados

Lista de funções da janela

Conteúdos relacionados

Comentários

Recursos adicionais