Compartir vía


Funciones de ventana en flujos de datos de mapeo

SE APLICA A: Azure Data Factory Azure Synapse Analytics

Sugerencia

Pruebe Data Factory en Microsoft Fabric, una solución de análisis todo en uno para empresas. Microsoft Fabric abarca todo, desde el movimiento de datos hasta la ciencia de datos, el análisis en tiempo real, la inteligencia empresarial y los informes. Obtenga información sobre cómo iniciar una nueva evaluación gratuita.

Los flujos de datos están disponibles tanto en canalizaciones de Azure Data Factory como en canalizaciones de Azure Synapse Analytics. Este artículo se aplica al mapeado de flujos de datos. Si no está familiarizado con las transformaciones, consulte el artículo introductorio Transformar datos mediante flujos de datos de asignación.

En este artículo se proporcionan detalles sobre las funciones de ventana compatibles con Azure Data Factory y Azure Synapse Analytics en los flujos de datos de asignación.

Lista de funciones de ventana

Las siguientes funciones solo están disponibles en las transformaciones de ventana.

Función de ventana Tarea
cumeDist Calcula la posición de un valor en relación con todos los valores de la partición. El resultado es el número de filas anteriores o iguales a la fila actual en la ordenación de la partición dividido por el número total de filas de la partición de la ventana. Los valores de empate en la ordenación se evalúan en la misma posición.
denseRank Calcula el rango de un valor en un grupo de valores especificado en la cláusula ORDER BY de una ventana. El resultado es uno más el número de filas anteriores o iguales a la fila actual en la ordenación de la partición. Los valores no producen huecos en la secuencia. La denseRank función funciona incluso cuando los datos no están ordenados y buscan cambios en los valores.
lag Obtiene el valor de las primeras filas evaluadas n del parámetro antes de la fila actual. El segundo parámetro es el número de filas hacia atrás que se deben tomar en cuenta, y el valor predeterminado es 1. Si no hay tantas filas, se devuelve un valor de null a menos que se especifique un valor predeterminado.
lead Obtiene el valor del primer parámetro evaluado n filas después de la fila actual. El segundo parámetro es el número de filas que se debe mirar hacia adelante, y el valor predeterminado es 1. Si no hay tantas filas, se devuelve un valor de null a menos que se especifique un valor predeterminado.
nTile Divide las filas de cada partición de ventana en n cubos que van desde 1 hasta como máximo n. Los valores de cubo difieren por, como máximo, 1. Si el número de filas de la partición no se divide uniformemente en el número de cubos, los valores de resto se distribuyen uno por cubo, empezando por el primer cubo. La función NTile es útil para el cálculo de tertiles, cuartiles, deciles y otras estadísticas de resumen comunes.

La función calcula dos variables durante la inicialización. El tamaño de un cubo estándar tiene una fila adicional añadida. Ambas variables se basan en el tamaño de la partición actual. Durante el proceso de cálculo, la función realiza un seguimiento del número de fila actual, el número de cubo actual y el número de fila en el que cambia el cubo (bucketThreshold). Cuando el número de fila actual alcanza el umbral del cubo, el valor del cubo aumenta en uno. El umbral aumenta según el tamaño del cubo (más uno adicional si el cubo actual está rellenado).
rank Calcula el rango de un valor en un grupo de valores especificado en la cláusula ORDER BY de una ventana. El resultado es uno más el número de filas anteriores o iguales a la fila actual en la ordenación de la partición. Los valores producen lagunas en la secuencia. La rank función funciona incluso cuando los datos no están ordenados y buscan cambios en los valores.
rowNumber Asigna una numeración de filas secuencial para las filas de una ventana a partir de 1.