Transformation du classement dans le flux de données de mappage

S’APPLIQUE À : Azure Data Factory Azure Synapse Analytics

Conseil

Essayez Data Factory dans Microsoft Fabric, une solution d’analyse tout-en-un pour les entreprises. Microsoft Fabric couvre tous les aspects, du déplacement des données à la science des données, en passant par l’analyse en temps réel, l’aide à la décision et la création de rapports. Découvrez comment démarrer un nouvel essai gratuitement !

Les flux de données sont disponibles à la fois dans les pipelines Azure Data Factory et Azure Synapse. Cet article s’applique aux flux de données de mappage. Si vous débutez dans le domaine des transformations, consultez l’article d’introduction Transformer des données avec un flux de données de mappage.

Utilisez la transformation de classement pour générer un classement ordonné en fonction des conditions de tri spécifiées par l’utilisateur.

Configuration

Rank settings

Insensible à la casse : Si une colonne de tri est de type chaîne, la casse sera factorisée dans le classement.

Dense : Si l’option est activée, la colonne de classement sera classée dans un classement dense. Chaque classement sera un nombre consécutif et les valeurs de classement ne seront pas ignorées en cas d’égalité.

Colonne de classement : Nom de la colonne de classement générée. Cette colonne sera de type long.

Conditions de tri : Choisissez les colonnes sur lesquelles porte le tri et l’ordre dans lequel il se produit. L’ordre détermine la priorité de tri.

La configuration ci-dessus accepte les données de basket-ball entrantes et crée une colonne de classement appelée « pointsRanking ». La ligne ayant la valeur la plus élevée de la colonne PTS aura une valeur pointsRanking de 1.

Script de flux de données

Syntaxe

<incomingStream>
    rank(
        desc(<sortColumn1>),
        asc(<sortColumn2>),
        ...,
        caseInsensitive: { true | false }
        dense: { true | false }
        output(<rankColumn> as long)
    ) ~> <sortTransformationName<>

Exemple

Rank settings

Le script de flux de données correspondant à la configuration de classement ci-dessus est présenté dans l’extrait de code suivant.

PruneColumns
    rank(
        desc(PTS, true),
        caseInsensitive: false,
        output(pointsRanking as long),
        dense: false
    ) ~> RankByPoints

Filtrez les lignes en fonction des valeurs de classement à l’aide de la transformation de filtre.