Panoramica delle attività
Questo articolo fornisce informazioni sulle attività in Microsoft Fabric e su come usarle per creare flussi di lavoro completi basati sui dati per gli scenari di elaborazione e trasferimento dei dati.
Panoramica
Un'area di lavoro di Microsoft Fabric può avere una o più pipeline. Una pipeline è un raggruppamento logico di attività che insieme eseguono un'operazione. Una pipeline, ad esempio, può contenere un set di attività che inseriscono e puliscono i dati di log e quindi avviano un flusso di dati di mapping per analizzare i dati di log. La pipeline consente di gestire le attività come un set anziché singolarmente. Si distribuisce e si pianifica la pipeline anziché ogni attività in modo indipendente.
Le attività in una pipeline definiscono le azioni da eseguire sui dati. Ad esempio, è possibile usare un'attività di copia per copiare i dati da un Server SQL a un archivio BLOB di Azure. Usare quindi un'attività di flusso di dati o un'attività dei notebook per elaborare e trasformare i dati dall'archivio BLOB in un pool di Azure Synapse Analytics, in cui vengono compilate soluzioni di creazione di report di business intelligence.
Microsoft Fabric ha tre tipi di attività: attività di spostamento dei dati, attività di trasformazione dei dati e attività di controllo.
Attività di spostamento dei dati
L'attività di copia in Microsoft Fabric esegue la copia dei dati da un archivio dati di origine a un archivio dati sink. Fabric supporta gli archivi dati elencati nell'articolo Panoramica del connettore. I dati da qualsiasi origine possono essere scritti in qualsiasi sink.
Per altre informazioni, vedere Come copiare i dati usando ll'attività di copia.
Attività di trasformazione dei dati
Microsoft Fabric supporta le seguenti attività di trasformazione che possono essere aggiunte singolarmente o con un'altra attività concatenata.
Per altre informazioni, vedere l'articolo Attività di trasformazione dei dati.
Attività di trasformazione dei dati | Ambiente di calcolo |
---|---|
Copiare i dati | Gestione calcolo di Microsoft Fabric |
Dataflow Gen2 | Gestione calcolo di Microsoft Fabric |
Eliminare i dati | Gestione calcolo di Microsoft Fabric |
Notebook di Fabric | Cluster Apache Spark gestiti da Microsoft Fabric |
Attività di HDInsight | Cluster Apache Spark gestiti da Microsoft Fabric |
Definizione di processo Spark | Cluster Apache Spark gestiti da Microsoft Fabric |
Stored procedure | Azure SQL, Azure Synapse Analytics o SQL Server |
Script SQL | Azure SQL, Azure Synapse Analytics o SQL Server |
Attività del flusso di controllo
Sono supportate le seguenti attività del flusso di controllo:
Attività di controllo | Descrizione |
---|---|
Accoda variabile | Aggiungere un valore a una variabile di matrice esistente. |
Attività di Azure Batch | Esegue uno script di Azure Batch. |
Attività di Azure Databricks | Esegue un processo di Azure Databricks (Notebook, Jar, Python). |
Attività di Azure Machine Learning | Eseguire un processo di Azure Machine Learning. |
Disattivare un'attività | Disattiva un'altra attività. |
Fail | Causa l'esito negativo dell'esecuzione della pipeline con un messaggio di errore personalizzato e un codice di errore. |
Filtra | Applicare un'espressione di filtro a una matrice di input. |
ForEach | L'attività ForEach definisce un flusso di controllo ripetuto nella pipeline. Questa attività viene usata per eseguire l'iterazione di una raccolta e attività specifiche in un ciclo. L'implementazione in cicli di questa attività è simile alla struttura di esecuzione in cicli Foreach nei linguaggi di programmazione. |
Attività di funzioni | Eseguire una funzione di Azure. |
Ottenere metadati | L'attività GetMetadata può essere usata per recuperare i metadati di qualsiasi dato in una pipeline Data Factory o Synapse. |
Condizione If | Può essere usata per creare un ramo in base alla condizione che il valore restituito sia true o false. L'attività If Condition svolge la stessa funzione dell'istruzione If nei linguaggi di programmazione. Valuta un set di attività se la condizione restituisce true e un altro set di attività se la condizione restituisce false . |
Pipeline richiamata | L'attività Execute Pipeline consente a una pipeline di Data Factory o Synapse di richiamare un'altra pipeline. |
Attività KQL | Esegue uno script KQL su un'istanza Kusto. |
Attività Lookup | L'attività Lookup può essere usata per la lettura o la ricerca di un record/nome di tabella/valore da qualsiasi origine esterna. Questo output può essere referenziato ulteriormente dalle attività successive. |
Impostare una variabile | Impostare il valore di una variabile esistente. |
Attività Switch | Implementa un'espressione switch che consente più attività successive per ogni potenziale risultato dell'espressione. |
Attività di Teams | Pubblica un messaggio in un canale di Teams o in una chat di gruppo. |
Attività Until | Implementa il ciclo Do-Until che è simile alla struttura di esecuzione cicli Do-Until nei linguaggi di programmazione. Esegue infatti un set di attività in un ciclo finché la condizione associata con l'attività restituisce true. È possibile specificare un valore di timeout per l'attività Until. |
Attività Wait | Quando si usa un'attività Wait in una pipeline, la pipeline attende per il periodo di tempo specificato prima di proseguire con l'esecuzione delle attività successive. |
Attività Web | È possibile usare l'attività Web per chiamare un endpoint REST personalizzato da una pipeline. |
Attività Webhook | Usando l'attività webhook, chiamare un endpoint e passare un URL di callback. L'esecuzione della pipeline attende che il callback venga richiamato prima di procedere all'attività successiva. |
Aggiunta di attività a una pipeline con l'interfaccia utente di Microsoft Fabric
Usare questi passaggi per aggiungere e configurare attività in una pipeline di Microsoft Fabric:
- Creare una nuova pipeline nell'area di lavoro.
- Nella scheda Attività per la pipeline esplorare le attività visualizzate, scorrere verso destra, se necessario per visualizzare tutte le attività. Selezionare un'attività da aggiungere all'editor della pipeline.
- Quando si aggiunge un'attività e la si seleziona nell'area di disegno dell'editor della pipeline, le relative impostazioni generali verranno visualizzate nel riquadro delle proprietà sotto l'area di disegno.
- Ogni attività contiene anche proprietà personalizzate specifiche della relativa configurazione in altre schede nel riquadro delle proprietà.
Impostazioni generali
Quando si aggiunge una nuova attività a una pipeline e la si seleziona, nella parte inferiore della schermata verranno visualizzati i riquadri delle proprietà. Questi riquadri delle proprietà includono Generale, Impostazioni e talvolta anche altri riquadri.
Le impostazioni generali includono sempre i campi Nome e Descrizione per ogni attività. Alcune attività possono includere anche quanto segue:
Impostazione | Descrizione |
---|---|
Timeout | Il tempo massimo di esecuzione di un'attività. Il valore predefinito è 12 ore e la quantità massima di tempo consentita è di sette giorni. Il formato per il timeout è in D.HH:MM:SS. |
Riprova | Il massimo numero di tentativi. |
(Proprietà avanzate) Intervallo tra tentativi (sec) | Il numero di secondi tra ogni tentativo. |
(Proprietà avanzate) Output sicuro | Quando selezionato, l'output dell'attività non viene acquisito nella registrazione. |
(Proprietà avanzate) Input sicuro | Se selezionato, l'input dell'attività non viene acquisito nella registrazione. |
Nota
Esiste un limite predefinito di 80 attività per ogni pipeline, che include le attività interne per i contenitori.