Transformação de classificação em fluxo de dados de mapeamento

APLICA-SE A: Azure Data Factory Azure Synapse Analytics

Dica

Data Factory no Microsoft Fabric é a próxima geração de Azure Data Factory, com uma arquitetura mais simples, IA interna e novos recursos. Se você não estiver familiarizado com a integração de dados, comece com Fabric Data Factory. As cargas de trabalho existentes do ADF podem ser atualizadas para Fabric para acessar novos recursos em ciência de dados, análise em tempo real e relatórios.

Os fluxos de dados estão disponíveis em os pipelines do Azure Data Factory e os pipelines do Azure Synapse Analytics. Este artigo se aplica ao fluxo de dados de mapeamento. Se você for novo em transformações, consulte o artigo introdutório Transformar dados usando fluxos de dados de mapeamento.

Dica

Para a transformação equivalente (coluna de Classificação) no Dataflow Gen2, consulte Guia do Dataflow Gen2 para mapeamento de usuários de fluxo de dados.

Use a transformação de classificação para gerar uma classificação ordenada com base nas condições de classificação especificadas pelo usuário.

Configuração

Configurações de classificação

Não diferencia maiúsculas de minúsculas: Se uma coluna de classificação for do tipo cadeia de caracteres, o caso será levado em conta na classificação.

Densa: Se ativado, a coluna de classificação será classificada densamente. Cada contagem de classificação será um número consecutivo e os valores de classificação não serão ignorados após um empate.

Coluna de classificação: o nome da coluna de classificação gerada. Esta coluna é do tipo long.

Condições de classificação: escolha quais colunas você está classificando e em qual ordem a classificação acontece. A ordem determina a prioridade de classificação.

A configuração usa dados de basquete de entrada e cria uma coluna de classificação chamada 'pointsRanking'. A linha com o valor mais alto da coluna PTS tem um valor pointsRanking de 1.

Script de fluxo de dados

Sintaxe

<incomingStream>
    rank(
        desc(<sortColumn1>),
        asc(<sortColumn2>),
        ...,
        caseInsensitive: { true | false }
        dense: { true | false }
        output(<rankColumn> as long)
    ) ~> <sortTransformationName<>

Exemplo

Configurações de classificação

O script de fluxo de dados para a configuração de classificação está no snippet de código a seguir.

PruneColumns
    rank(
        desc(PTS, true),
        caseInsensitive: false,
        output(pointsRanking as long),
        dense: false
    ) ~> RankByPoints

Filtrar linhas com base nos valores de classificação usando a transformação de filtro.