Condividi tramite


Funzioni di finestra nei flussi di dati di mappatura

SI APPLICA A: Azure Data Factory Azure Synapse Analytics

Suggerimento

Provare Data Factory in Microsoft Fabric, una soluzione di analisi all-in-one per le aziende. Microsoft Fabric copre tutto, dallo spostamento dati al data science, all'analisi in tempo reale, alla business intelligence e alla creazione di report. Vedere le informazioni su come iniziare una nuova prova gratuita.

I flussi di dati sono disponibili sia nelle pipeline di Azure Data Factory che nelle pipeline di Azure Synapse Analytics. Questo articolo si applica ai flussi di dati per mapping. Se non si ha familiarità con le trasformazioni, vedere l'articolo introduttivo Trasformare i dati usando flussi di dati di mapping.

Questo articolo fornisce informazioni dettagliate sulle funzioni finestra supportate da Azure Data Factory e Azure Synapse Analytics nei flussi di dati di mapping.

Elenco di funzioni finestra

Le funzioni seguenti sono disponibili solo nelle trasformazioni della finestra.

Funzione finestra Attività
cumeDist Calcola la posizione di un valore rispetto a tutti i valori nella partizione. Il risultato è il numero di righe precedenti o uguali alla riga corrente nell'ordinamento della partizione diviso per il numero totale di righe nella partizione di finestra. Qualsiasi valore di legatura nell'ordinamento restituisce la stessa posizione.
denseRank Calcola la classificazione di un valore in un gruppo di valori specificato nella clausola ORDER BY di una finestra. Come risultato si ha uno più il numero di righe precedenti o uguali alla riga corrente nell'ordinamento della partizione. I valori non producono spazi nella sequenza. La denseRank funzione funziona anche quando i dati non vengono ordinati e cercano modifiche nei valori.
lag Ottiene il valore del primo parametro valutato n righe prima della riga corrente. Il secondo parametro è il numero di righe da esaminare e il valore predefinito è 1. Se non sono presenti tante righe, viene restituito un valore di null a meno che non venga specificato un valore predefinito.
lead Ottiene il valore del primo parametro valutato n righe dopo la riga corrente. Il secondo parametro è il numero di righe da cercare in avanti e il valore predefinito è 1. Se non sono presenti tante righe, viene restituito un valore di null a meno che non venga specificato un valore predefinito.
nTile Divide le righe per ogni partizione di finestra in n bucket che vanno da 1 a al massimo n. I valori del bucket differiscono al massimo di 1. Se il numero di righe nella partizione non viene diviso uniformemente nel numero di bucket, i valori rimanenti vengono distribuiti uno per bucket, a partire dal primo bucket. La funzione NTile è particolarmente utile per il calcolo di tertiles, quartili, decili e altre statistiche di riepilogo comuni.

La funzione calcola due variabili durante l'inizializzazione. Alla dimensione di un bucket normale viene aggiunta una riga extra. Entrambe le variabili si basano sulle dimensioni della partizione corrente. Durante il processo di calcolo, la funzione tiene traccia del numero di riga corrente, del numero di bucket corrente e del numero di riga in corrispondenza del quale cambia il bucket (bucketThreshold). Quando il numero di riga corrente raggiunge la soglia del bucket, il valore del bucket aumenta di uno. La soglia aumenta in base alle dimensioni del bucket (più un extra se il bucket corrente è riempito).
rank Calcola la classificazione di un valore in un gruppo di valori specificato nella clausola ORDER BY di una finestra. Come risultato si ha uno più il numero di righe precedenti o uguali alla riga corrente nell'ordinamento della partizione. I valori producono spazi vuoti nella sequenza. La rank funzione funziona anche quando i dati non vengono ordinati e cercano modifiche nei valori.
rowNumber Assegna una numerazione sequenziale di righe per le righe in una finestra che inizia con 1.