Inserire dati nel warehouse usando pipeline di dati

Si applica a: Warehouse in Microsoft Fabric

Le pipeline di dati offrono un'alternativa all'uso del comando COPY tramite un'interfaccia utente grafica. Una pipeline di dati è un raggruppamento logico di attività che insieme eseguono un'attività di inserimento dati. Le pipeline consentono di gestire le attività di estrazione, trasformazione e caricamento (ETL) anziché gestirle singolarmente.

In questa esercitazione si creerà una nuova pipeline che carica i dati di esempio in un warehouse in Microsoft Fabric.

Nota

Alcune funzionalità di Azure Data Factory non sono disponibili in Microsoft Fabric, ma i concetti sono intercambiabili. Altre informazioni su Azure Data Factory e pipeline su pipeline e attività sono disponibili in Azure Data Factory e Azure Synapse Analytics. Per una guida introduttiva, vedere Avvio rapido: Creare la prima pipeline per copiare i dati.

Creare una pipeline di dati

  1. Per creare una nuova pipeline passare all'area di lavoro, selezionare il pulsante +Nuovo e selezionare Pipeline di dati. Screenshot della sezione superiore dell'area di lavoro dell'utente che mostra il pulsante Nuovo e con le opzioni Warehouse, Data pipeline e Mostra tutto.

  2. Nella finestra di dialogo Nuova pipeline specificare un nome per la nuova pipeline e selezionare Crea.

  3. Nell'area canvas della pipeline verranno visualizzate tre opzioni per iniziare: Aggiungere un'attività della pipeline, Copiare i dati e Scegliere un'attività da avviare.

    Screenshot che mostra le tre opzioni da selezionare per l'avvio dell'inserimento.

    Ognuna di queste opzioni offre alternative diverse per creare una pipeline:

    • Aggiungere l'attività della pipeline: questa opzione avvia l'editor della pipeline, in cui è possibile creare nuove pipeline da zero usando le attività della pipeline.
    • Copia dati: questa opzione avvia un assistente dettagliato che consente di selezionare un'origine dati, una destinazione e configurare le opzioni di caricamento dei dati, ad esempio i mapping delle colonne. Al termine, crea una nuova attività della pipeline con un'attività Copia dati già configurata automaticamente.
    • Scegliere un'attività da avviare: questa opzione avvia un set di modelli predefiniti per iniziare a usare le pipeline in base a diversi scenari.

    Selezionare l'opzione Copia dati per avviare l'Assistente copia.

  4. La prima pagina dell'Assistente copia dati consente di selezionare i propri dati da varie origini dati o di selezionare uno degli esempi forniti per iniziare. Per questa esercitazione si userà l'esempio Di COVID-19 Data Lake . Selezionare questa opzione e selezionare Avanti.

    Screenshot che mostra le opzioni per usare dati di esempio o altre origini dati.

  5. Nella pagina successiva è possibile selezionare un set di dati, il formato del file di origine e visualizzare in anteprima il set di dati selezionato. Selezionare Bing COVID-19, il formato CSV e selezionare Avanti.

    Screenshot che mostra diverse opzioni del set di dati per l'esempio DI COVID-19, i formati di file e una griglia che mostra un'anteprima dei dati.

  6. La pagina successiva, Destinazioni dati, consente di configurare il tipo di area di lavoro di destinazione. I dati verranno caricati in un warehouse nell'area di lavoro, quindi selezionare la scheda Warehouse e l'opzione Data Warehouse . Selezionare Avanti.

    Screenshot che mostra diverse opzioni di destinazione.

  7. A questo punto è possibile selezionare il data warehouse in cui caricare i dati. Selezionare il magazzino desiderato nell'elenco a discesa e selezionare Avanti.

    Screenshot che mostra un elenco a discesa con un magazzino selezionato.

  8. L'ultimo passaggio per configurare la destinazione consiste nel fornire un nome alla tabella di destinazione e configurare i mapping delle colonne. Qui è possibile scegliere di caricare i dati in una nuova tabella o in una tabella esistente, specificare uno schema e nomi di tabella, modificare i nomi delle colonne, rimuovere colonne o modificarne i mapping. È possibile accettare le impostazioni predefinite o modificare le impostazioni in base alle proprie preferenze.

    Screenshot che mostra le opzioni per caricare i dati in una tabella esistente o crearne uno nuovo.

    Dopo aver esaminato le opzioni, selezionare Avanti.

  9. La pagina successiva offre la possibilità di usare la gestione temporanea o di fornire opzioni avanzate per l'operazione di copia dei dati ,che usa il comando T-SQL COPY. Esaminare le opzioni senza modificarle e selezionare Avanti.

  10. L'ultima pagina dell'assistente offre un riepilogo dell'attività di copia. Selezionare l'opzione Avvia trasferimento dati immediatamente e selezionare Salva + Esegui.

    Screenshot che mostra l'opzione per avviare immediatamente l'operazione di trasferimento dei dati e i pulsanti Indietro e Salva + Esegui.

  11. Si viene indirizzati all'area canvas della pipeline, in cui è già configurata una nuova attività Copia dati. La pipeline inizia a essere eseguita automaticamente. È possibile monitorare lo stato della pipeline nel riquadro Output :

    Screenshot che mostra l'area di disegno della pipeline con un attività Copy al centro e lo stato di esecuzione della pipeline che mostra lo stato corrente In corso.

  12. Dopo alcuni secondi, la pipeline viene completata correttamente. Tornando al warehouse, è possibile selezionare la tabella per visualizzare in anteprima i dati e verificare che l'operazione di copia sia stata completata.

    Screenshot che mostra un warehouse con la tabella bing_covid_19 selezionata e una griglia che mostra un'anteprima dei dati nella tabella.

Per altre informazioni sull'inserimento dei dati nel warehouse in Microsoft Fabric, visitare:

Passaggio successivo