Condividi tramite


Panoramica delle attività

Questo articolo fornisce informazioni sulle attività in Microsoft Fabric e su come usarle per creare flussi di lavoro completi basati sui dati per gli scenari di elaborazione e trasferimento dei dati.

Panoramica

Un'area di lavoro di Microsoft Fabric può avere una o più pipeline. Una pipeline è un raggruppamento logico di attività che insieme eseguono un'operazione. Una pipeline, ad esempio, può contenere un set di attività che inseriscono e puliscono i dati di log e quindi avviano un flusso di dati di mapping per analizzare i dati di log. La pipeline consente di gestire le attività come un set anziché singolarmente. Si distribuisce e si pianifica la pipeline anziché ogni attività in modo indipendente.

Le attività in una pipeline definiscono le azioni da eseguire sui dati. Ad esempio, è possibile usare un'attività di copia per copiare i dati da un Server SQL a un archivio BLOB di Azure. Usare quindi un'attività di flusso di dati o un'attività dei notebook per elaborare e trasformare i dati dall'archivio BLOB in un pool di Azure Synapse Analytics, in cui vengono compilate soluzioni di creazione di report di business intelligence.

Microsoft Fabric ha tre tipi di attività: attività di spostamento dei dati, attività di trasformazione dei dati e attività di controllo.

Attività di spostamento dei dati

L'attività di copia in Microsoft Fabric esegue la copia dei dati da un archivio dati di origine a un archivio dati sink. Fabric supporta gli archivi dati elencati nell'articolo Panoramica del connettore. I dati da qualsiasi origine possono essere scritti in qualsiasi sink.

Per altre informazioni, vedere Come copiare i dati usando ll'attività di copia.

Attività di trasformazione dei dati

Microsoft Fabric supporta le seguenti attività di trasformazione che possono essere aggiunte singolarmente o con un'altra attività concatenata.

Per altre informazioni, vedere l'articolo Attività di trasformazione dei dati.

Attività di trasformazione dei dati Ambiente di calcolo
Copiare i dati Gestione calcolo di Microsoft Fabric
Dataflow Gen2 Gestione calcolo di Microsoft Fabric
Eliminare i dati Gestione calcolo di Microsoft Fabric
Notebook di Fabric Cluster Apache Spark gestiti da Microsoft Fabric
Attività di HDInsight Cluster Apache Spark gestiti da Microsoft Fabric
Definizione di processo Spark Cluster Apache Spark gestiti da Microsoft Fabric
Stored procedure Azure SQL, Azure Synapse Analytics o SQL Server
Script SQL Azure SQL, Azure Synapse Analytics o SQL Server

Attività del flusso di controllo

Sono supportate le seguenti attività del flusso di controllo:

Attività di controllo Descrizione
Accoda variabile Aggiungere un valore a una variabile di matrice esistente.
Attività di Azure Batch Esegue uno script di Azure Batch.
Attività di Azure Databricks Esegue un processo di Azure Databricks (Notebook, Jar, Python).
Attività di Azure Machine Learning Eseguire un processo di Azure Machine Learning.
Disattivare un'attività Disattiva un'altra attività.
Fail Causa l'esito negativo dell'esecuzione della pipeline con un messaggio di errore personalizzato e un codice di errore.
Filtra Applicare un'espressione di filtro a una matrice di input.
ForEach L'attività ForEach definisce un flusso di controllo ripetuto nella pipeline. Questa attività viene usata per eseguire l'iterazione di una raccolta e attività specifiche in un ciclo. L'implementazione in cicli di questa attività è simile alla struttura di esecuzione in cicli Foreach nei linguaggi di programmazione.
Attività di funzioni Eseguire una funzione di Azure.
Ottenere metadati L'attività GetMetadata può essere usata per recuperare i metadati di qualsiasi dato in una pipeline Data Factory o Synapse.
Condizione If Può essere usata per creare un ramo in base alla condizione che il valore restituito sia true o false. L'attività If Condition svolge la stessa funzione dell'istruzione If nei linguaggi di programmazione. Valuta un set di attività se la condizione restituisce true e un altro set di attività se la condizione restituisce false.
Pipeline richiamata L'attività Execute Pipeline consente a una pipeline di Data Factory o Synapse di richiamare un'altra pipeline.
Attività KQL Esegue uno script KQL su un'istanza Kusto.
Attività Lookup L'attività Lookup può essere usata per la lettura o la ricerca di un record/nome di tabella/valore da qualsiasi origine esterna. Questo output può essere referenziato ulteriormente dalle attività successive.
Impostare una variabile Impostare il valore di una variabile esistente.
Attività Switch Implementa un'espressione switch che consente più attività successive per ogni potenziale risultato dell'espressione.
Attività di Teams Pubblica un messaggio in un canale di Teams o in una chat di gruppo.
Attività Until Implementa il ciclo Do-Until che è simile alla struttura di esecuzione cicli Do-Until nei linguaggi di programmazione. Esegue infatti un set di attività in un ciclo finché la condizione associata con l'attività restituisce true. È possibile specificare un valore di timeout per l'attività Until.
Attività Wait Quando si usa un'attività Wait in una pipeline, la pipeline attende per il periodo di tempo specificato prima di proseguire con l'esecuzione delle attività successive.
Attività Web È possibile usare l'attività Web per chiamare un endpoint REST personalizzato da una pipeline.
Attività Webhook Usando l'attività webhook, chiamare un endpoint e passare un URL di callback. L'esecuzione della pipeline attende che il callback venga richiamato prima di procedere all'attività successiva.

Aggiunta di attività a una pipeline con l'interfaccia utente di Microsoft Fabric

Usare questi passaggi per aggiungere e configurare attività in una pipeline di Microsoft Fabric:

  1. Creare una nuova pipeline nell'area di lavoro.
  2. Nella scheda Attività per la pipeline esplorare le attività visualizzate, scorrere verso destra, se necessario per visualizzare tutte le attività. Selezionare un'attività da aggiungere all'editor della pipeline.
  3. Quando si aggiunge un'attività e la si seleziona nell'area di disegno dell'editor della pipeline, le relative impostazioni generali verranno visualizzate nel riquadro delle proprietà sotto l'area di disegno.
  4. Ogni attività contiene anche proprietà personalizzate specifiche della relativa configurazione in altre schede nel riquadro delle proprietà.

Screenshot che mostra l'editor della pipeline con la scheda Attività, la barra degli strumenti, un'attività di copia e la scheda Generale delle relative proprietà, tutte evidenziate.

Impostazioni generali

Quando si aggiunge una nuova attività a una pipeline e la si seleziona, nella parte inferiore della schermata verranno visualizzati i riquadri delle proprietà. Questi riquadri delle proprietà includono Generale, Impostazioni e talvolta anche altri riquadri.

Screenshot che mostra la scheda Impostazioni generali di un'attività.

Le impostazioni generali includono sempre i campi Nome e Descrizione per ogni attività. Alcune attività possono includere anche quanto segue:

Impostazione Descrizione
Timeout Il tempo massimo di esecuzione di un'attività. Il valore predefinito è 12 ore e la quantità massima di tempo consentita è di sette giorni. Il formato per il timeout è in D.HH:MM:SS.
Riprova Il massimo numero di tentativi.
(Proprietà avanzate) Intervallo tra tentativi (sec) Il numero di secondi tra ogni tentativo.
(Proprietà avanzate) Output sicuro Quando selezionato, l'output dell'attività non viene acquisito nella registrazione.
(Proprietà avanzate) Input sicuro Se selezionato, l'input dell'attività non viene acquisito nella registrazione.

Nota

Esiste un limite predefinito di 80 attività per ogni pipeline, che include le attività interne per i contenitori.