Compartir vía


Transformación de clasificación en el flujo de datos de mapeo

SE APLICA A: Azure Data Factory Azure Synapse Analytics

Sugerencia

Data Factory en Microsoft Fabric es la próxima generación de Azure Data Factory, con una arquitectura más sencilla, inteligencia artificial integrada y nuevas características. Si no está familiarizado con la integración de datos, comience con Fabric Data Factory. Las cargas de trabajo de ADF existentes pueden actualizarse a Fabric para acceder a nuevas funcionalidades en ciencia de datos, análisis en tiempo real e informes.

Los flujos de datos están disponibles tanto en canalizaciones de Azure Data Factory como en canalizaciones de Azure Synapse Analytics. Este artículo se aplica a los flujos de datos de mapeo. Si no está familiarizado con las transformaciones, consulte el artículo introductorio Transformación de datos mediante flujos de datos de asignación.

Use la transformación de clasificación para generar una clasificación ordenada en función de las condiciones de ordenación especificadas por el usuario.

Configuración

Configuración de clasificación

No distinguir entre mayúsculas y minúsculas: si una columna de ordenación es de tipo cadena, las mayúsculas o minúsculas se factorizarán en la clasificación.

Denso: si se habilita, la columna de clasificación tendrá una clasificación densa. Cada recuento de clasificación será un número consecutivo y los valores de clasificación no se omitirán después de una vinculación.

Rank column (Columna de clasificación): nombre de la columna de clasificación generada. Esta columna será de tipo Long.

Condiciones de ordenación: elija las columnas por las que va a ordenar y en qué orden se realiza la ordenación. El orden determina la prioridad de ordenación.

La configuración anterior toma los datos de baloncesto entrantes y crea una columna de clasificación denominada "pointsRanking". La fila con el valor más alto de la columna PTS tendrá un valor de pointsRanking de 1.

Script de flujo de datos

Sintaxis

<incomingStream>
    rank(
        desc(<sortColumn1>),
        asc(<sortColumn2>),
        ...,
        caseInsensitive: { true | false }
        dense: { true | false }
        output(<rankColumn> as long)
    ) ~> <sortTransformationName<>

Ejemplo

Configuración de clasificación

El script del flujo de datos para la configuración de clasificación anterior se encuentra en el siguiente fragmento de código.

PruneColumns
    rank(
        desc(PTS, true),
        caseInsensitive: false,
        output(pointsRanking as long),
        dense: false
    ) ~> RankByPoints

Filtre las filas en función de los valores de clasificación mediante la transformación de filtro.