Condividi tramite


Trasformazione Ordinamento nel flusso di dati di mapping

SI APPLICA A: Azure Data Factory Azure Synapse Analytics

Suggerimento

Provare Data Factory in Microsoft Fabric, una soluzione di analisi completa per le aziende. Microsoft Fabric copre tutti gli elementi, dallo spostamento dei dati all'analisi scientifica dei dati, all'analisi in tempo reale, alla business intelligence e alla creazione di report. Scopri come avviare gratuitamente una nuova versione di valutazione .

I flussi di dati sono disponibili sia in Azure Data Factory che in Azure Synapse Pipelines. Questo articolo si applica ai flussi di dati di mapping. Se non si ha esperienza con le trasformazioni, vedere l'articolo introduttivo Trasformare i dati usando un flusso di dati di mapping.

La trasformazione ordinamento consente di ordinare le righe in ingresso nel flusso di dati corrente. È possibile scegliere singole colonne e ordinarle in ordine crescente o decrescente.

Nota

I flussi di dati di mapping vengono eseguiti in cluster Spark che distribuiscono i dati tra più nodi e partizioni. Se si sceglie di ripartizionare i dati in una trasformazione successiva, l'ordinamento potrebbe andare perso a causa del rimshuffing dei dati. Il modo migliore per mantenere l'ordinamento nel flusso di dati consiste nell'impostare una singola partizione nella scheda Ottimizza della trasformazione e mantenere la trasformazione Ordinamento il più vicino possibile al sink.

Configurazione

Sort settings

Senza distinzione tra maiuscole e minuscole: indica se si desidera ignorare la distinzione tra maiuscole e minuscole durante l'ordinamento di campi stringa o di testo

Ordina solo all'interno delle partizioni: quando i flussi di dati vengono eseguiti in Spark, ogni flusso di dati è suddiviso in partizioni. Questa impostazione ordina i dati solo all'interno delle partizioni in ingresso anziché ordinare l'intero flusso di dati.

Condizioni di ordinamento: scegliere le colonne in base a cui si esegue l'ordinamento e in quale ordine si verifica l'ordinamento. L'ordine determina la priorità di ordinamento. Scegliere se i valori Null verranno visualizzati all'inizio o alla fine del flusso di dati.

Colonne calcolate

Per modificare o estrarre un valore di colonna prima di applicare l'ordinamento, passare il puntatore del mouse sulla colonna e selezionare "colonna calcolata". Verrà aperto il generatore di espressioni per creare un'espressione per l'operazione di ordinamento anziché usare un valore di colonna.

Script del flusso di dati

Sintassi

<incomingStream>
    sort(
        desc(<sortColumn1>, { true | false }),
        asc(<sortColumn2>, { true | false }),
        ...
    ) ~> <sortTransformationName<>

Esempio

Sort settings

Lo script del flusso di dati per la configurazione di ordinamento precedente si trova nel frammento di codice seguente.

BasketballStats sort(desc(PTS, true),
    asc(Age, true)) ~> Sort1

Dopo l'ordinamento, è possibile usare la trasformazione Aggregazione