Trasformazione Ordinamento nel flusso di dati di mapping

Applicabile a: Azure Data Factory Azure Synapse Analytics

Suggerimento

Data Factory in Microsoft Fabric è la nuova generazione di Azure Data Factory, con un'architettura più semplice, un'intelligenza artificiale predefinita e nuove funzionalità. Se non si ha familiarità con l'integrazione dei dati, iniziare con Fabric Data Factory. I carichi di lavoro di Azure Data Factory esistenti possono eseguire l'aggiornamento a Fabric per accedere a nuove funzionalità tra data science, analisi in tempo reale e creazione di report.

I flussi di dati sono disponibili sia nelle pipeline Azure Data Factory che nelle pipeline di Azure Synapse Analytics. Questo articolo si applica ai flussi di dati per mapping. Se non si ha familiarità con le trasformazioni, vedere l'articolo introduttivo Trasformare i dati usando flussi di dati di mapping.

Suggerimento

Per la trasformazione equivalente (Ordinamento) in Dataflow Gen2, vedere Una guida a Dataflow Gen2 per gli utenti del flusso di dati di mapping.

La trasformazione ordinamento consente di ordinare le righe in ingresso nel flusso di dati corrente. È possibile scegliere singole colonne e ordinarle in ordine crescente o decrescente.

Nota

I flussi di dati di mapping vengono eseguiti in cluster Spark che distribuiscono i dati tra più nodi e partizioni. Se si sceglie di ripartizionare i dati in una trasformazione successiva, è possibile perdere l'ordinamento a causa del rimshuffing dei dati. Il modo migliore per mantenere l'ordinamento nel flusso di dati consiste nell'impostare una singola partizione nella scheda Ottimizza della trasformazione e mantenere la trasformazione Ordinamento il più vicino possibile al sink.

Impostazione

Impostazioni di ordinamento

Senza distinzione tra maiuscole e minuscole: indica se si desidera ignorare la distinzione tra maiuscole e minuscole durante l'ordinamento di campi stringa o di testo

Ordina solo all'interno delle partizioni: quando i flussi di dati vengono eseguiti in Spark, ogni flusso di dati è suddiviso in partizioni. Questa impostazione ordina i dati solo all'interno delle partizioni in ingresso anziché ordinare l'intero flusso di dati.

Condizioni di ordinamento: scegliere le colonne in base a cui si esegue l'ordinamento e in quale ordine si verifica l'ordinamento. L'ordine determina la priorità di ordinamento. Scegliere se i valori Null vengono visualizzati all'inizio o alla fine del flusso di dati.

Colonne calcolate

Per modificare o estrarre un valore di colonna prima di applicare l'ordinamento, passare il puntatore del mouse sulla colonna e selezionare "colonna calcolata". Nel generatore di espressioni creare un'espressione per l'operazione di ordinamento anziché usare un valore di colonna.

Script del flusso di dati

Sintassi

<incomingStream>
    sort(
        desc(<sortColumn1>, { true | false }),
        asc(<sortColumn2>, { true | false }),
        ...
    ) ~> <sortTransformationName<>

Esempio

Impostazioni di ordinamento

Lo script del flusso di dati per la configurazione di ordinamento precedente si trova nel frammento di codice seguente.

BasketballStats sort(desc(PTS, true),
    asc(Age, true)) ~> Sort1

Dopo l'ordinamento, è possibile usare la trasformazione Aggregazione

Commenti e suggerimenti

Questa pagina è stata utile?

Last updated on 2026-04-28