Compartir vía


Transformación Ventana en el flujo de datos de asignación

SE APLICA A: Azure Data Factory Azure Synapse Analytics

Sugerencia

Data Factory en Microsoft Fabric es la próxima generación de Azure Data Factory, con una arquitectura más sencilla, inteligencia artificial integrada y nuevas características. Si no está familiarizado con la integración de datos, comience con Fabric Data Factory. Las cargas de trabajo de ADF existentes pueden actualizarse a Fabric para acceder a nuevas funcionalidades en ciencia de datos, análisis en tiempo real e informes.

Los flujos de datos están disponibles tanto en canalizaciones de Azure Data Factory como en canalizaciones de Azure Synapse Analytics. Este artículo se aplica a los flujos de datos de mapeo. Si no está familiarizado con las transformaciones, consulte el artículo introductorio Transformar datos mediante flujos de datos de asignación.

En la transformación Ventana se definen las agregaciones basadas en ventanas de las columnas de las secuencias de datos. En el Generador de expresiones, puede definir diferentes tipos de agregaciones basadas en ventanas de datos o tiempo (cláusula OVER de SQL), como LEAD, LAG, NTILE, CUMEDIST y RANK. Se genera un nuevo campo en la salida que incluye estas agregaciones. También puede incluir campos de agrupación opcionales.

Captura de pantalla que muestra las ventanas seleccionadas en el menú.

Over

Establezca las particiones de los datos de columna para la transformación Ventana. El equivalente en SQL es Partition By en la cláusula Over de SQL. Si desea crear un cálculo o una expresión para usarlos en la creación de las particiones, desplace el cursor por encima del nombre de la columna y seleccione Columna calculada.

Captura de pantalla que muestra la configuración de ventanas con la pestaña Over seleccionada.

Sort

Otra parte de la cláusula Over es establecer Order By. Esta cláusula establece la ordenación de datos. También puede crear una expresión para un valor calculado en esta columna para ordenar.

Captura de pantalla que muestra la configuración de ventanas con la pestaña Sort seleccionada.

Range By

A continuación, configure el marco de la ventana como Sin límites o Con límites. Para establecer un marco de ventana sin límites, establezca el control deslizante en Sin límites en ambos extremos. Si elige un valor entre Unbounded (Sin enlazar) y Current Row (Fila actual), debe establecer los valores de desplazamiento inicial y final. Ambos valores son números enteros positivos. Puede usar números relativos o valores de sus datos.

El control deslizante de la ventana puede establecer dos valores: valores antes de la fila actual y valores después de la fila actual. El desplazamiento entre inicio y fin coincide con los dos selectores del control deslizante.

Captura de pantalla que muestra la configuración de ventanas con la pestaña por rango seleccionada.

Columnas de Ventana

Por último, use el Generador de expresiones para definir las agregaciones que desea utilizar con las ventanas de datos, por ejemplo, RANK, COUNT, MIN, MAX, DENSE RANK, LEAD, LAG, etc.

La lista completa de funciones analíticas y de agregación disponibles para su uso en el lenguaje de expresiones de flujos de datos a través del generador de expresiones se muestra en Expresiones de transformación de datos en la asignación de flujos de datos.

Si busca una agregación de agrupación simple, use la transformación Agregar