Comparteix a través de


Transformación Ventana en el flujo de datos de asignación

SE APLICA A: Azure Data Factory Azure Synapse Analytics

Sugerencia

Pruebe Data Factory en Microsoft Fabric, una solución de análisis todo en uno para empresas. Microsoft Fabric abarca todo, desde el movimiento de datos hasta la ciencia de datos, el análisis en tiempo real, la inteligencia empresarial y los informes. Obtenga información sobre cómo iniciar una nueva evaluación gratuita.

Los flujos de datos están disponibles en las canalizaciones Azure Data Factory y Azure Synapse. Este artículo se aplica a los flujos de datos de asignación. Si carece de experiencia con las transformaciones, consulte el artículo de introducción Transformación de datos mediante flujos de datos de asignación.

En la transformación Ventana se definen las agregaciones basadas en ventanas de las columnas de las secuencias de datos. En el Generador de expresiones, puede definir diferentes tipos de agregaciones basadas en ventanas de datos o tiempo (cláusula OVER de SQL), como LEAD, LAG, NTILE, CUMEDIST y RANK. Se genera un nuevo campo en la salida que incluye estas agregaciones. También puede incluir campos de agrupación opcionales.

Captura de pantalla que muestra las ventanas seleccionadas en el menú.

Over

Establezca las particiones de los datos de columna para la transformación Ventana. El equivalente en SQL es Partition By en la cláusula Over de SQL. Si desea crear un cálculo o una expresión para usarlos en la creación de las particiones, desplace el cursor por encima del nombre de la columna y seleccione Columna calculada.

Captura de pantalla que muestra la configuración de ventanas con la pestaña Over seleccionada.

Sort

Otra parte de la cláusula Over es establecer Order By. Esta cláusula establece la ordenación de datos. También puede crear una expresión que genere un valor de cálculo en este campo de columna para ordenar.

Captura de pantalla que muestra la configuración de ventanas con la pestaña Sort seleccionada.

Range By

A continuación, enlace o desenlace el marco de la ventana. Para establecer un marco de ventana sin enlazar, establezca el control deslizante en Unbounded (Sin enlazar) en ambos extremos. Si elige un valor entre Unbounded (Sin enlazar) y Current Row (Fila actual), debe establecer los valores de desplazamiento inicial y final. Ambos valores son números enteros positivos. Puede usar números relativos o valores de sus datos.

El control deslizante de la ventana puede establecer dos valores: valores antes de la fila actual y valores después de la fila actual. El desplazamiento entre inicio y fin coincide con los dos selectores del control deslizante.

Captura de pantalla que muestra la configuración de ventanas con la pestaña Range by seleccionada.

Columnas de Ventana

Por último, use el Generador de expresiones para definir las agregaciones que desea utilizar con las ventanas de datos, por ejemplo, RANK, COUNT, MIN, MAX, DENSE RANK, LEAD, LAG, etc.

La lista completa de las funciones analíticas y de agregación disponibles para usar en el lenguaje de expresiones de un flujo de datos mediante el Generador de expresiones se incluye en Expresiones de transformación de datos en flujos de datos de asignación.

Si busca una agregación de agrupación simple, use la transformación Agregar.