Condividi tramite


Inserire dati nel Warehouse usando pipeline di dati

Si applica a✅: warehouse in Microsoft Fabric

Le pipeline di dati offrono un'alternativa all'uso del comando COPY tramite un'interfaccia utente grafica. Una pipeline è un raggruppamento logico di attività che insieme eseguono un'operazione di inserimento dati. Le pipeline consentono di gestire tutte le attività di estrazione, trasformazione e caricamento (ETL), anziché gestirle singolarmente.

In questa esercitazione si creerà una nuova pipeline che carica dati campione in un Warehouse in Microsoft Fabric.

Nota

Alcune funzionalità di Azure Data Factory non sono disponibili in Microsoft Fabric, ma i concetti sono intercambiabili. Altre informazioni su Azure Data Factory e Pipeline sono disponibili in Pipeline e attività in Azure Data Factory e Azure Synapse Analytics. Per un avvio rapido, vedere Avvio rapido: creare la prima pipeline per copiare dati.

Creazione di una pipeline di dati

  1. Per creare una nuova pipeline, passare all'area di lavoro, selezionare il pulsante +Nuovo e quindi Pipeline di dati. Screenshot della sezione superiore dell'area di lavoro dell'utente che mostra il pulsante Nuovo e con le opzioni Warehouse, Data pipeline e Mostra tutto.

  2. Nella finestra di dialogo Nuova pipeline specificare un nome per la nuova pipeline e selezionare Crea.

  3. Nell'area di lavoro della pipeline, verranno visualizzate tre opzioni per iniziare: Aggiungi un'attività di pipeline, Copia dati e Scegli un'attività da avviare.

    Screenshot che mostra le tre opzioni da selezionare per l'avvio dell'inserimento.

    Ognuna di queste opzioni offre alternative diverse per creare una pipeline:

    • Aggiungere attività di pipeline: questa opzione avvia l'editor della pipeline, in cui è possibile creare nuove pipeline da zero usando le attività di pipeline.
    • Copia dati: questa opzione avvia un assistente step-by-step che consente di selezionare un'origine dati, una destinazione e configurare le opzioni di caricamento dei dati, ad esempio i mapping delle colonne. Al termine, crea una nuova attività di pipeline con un'attività Copia dati già configurata automaticamente.
    • Scegli un'attività da avviare: questa opzione avvia un set di modelli predefiniti per iniziare a usare le pipeline in base a diversi scenari.

    Selezionare l'opzione Copia dati per avviare l'Assistente copia.

  4. La prima pagina dell'Assistente Copia dati consente di selezionare i propri dati da varie origini dati o di selezionare uno degli esempi forniti per iniziare. Per questa esercitazione, si userà l'esempio COVID-19 Data Lake. Selezionare questa opzione, quindi selezionare Avanti.

    Screenshot che mostra le opzioni per usare dati campione o altre origini dati.

  5. Nella pagina successiva, è possibile selezionare un set di dati, il formato del file di origine e visualizzare in anteprima il set di dati selezionato. Selezionare Bing COVID-19, il formato CSV e quindi selezionare Avanti.

    Screenshot che mostra diverse opzioni del set di dati per il campione COVID-19, formati di file e una griglia che mostra un'anteprima dei dati.

  6. La pagina successiva, Destinazioni dati, consente di configurare il tipo di area di lavoro di destinazione. I dati verranno caricati in un Warehouse nell'area di lavoro; quindi, selezionare la scheda Warehouse e l'opzione Data Warehouse. Selezionare Avanti.

    Screenshot che mostra diverse opzioni di destinazione.

  7. A questo punto, è possibile selezionare il data warehouse in cui caricare i dati. Selezionare il Warehouse desiderato nell'elenco a discesa e quindi selezionare Avanti.

    Screenshot che mostra un elenco a discesa con un Warehouse selezionato.

  8. L'ultimo passaggio per configurare la destinazione consiste nel fornire un nome per la tabella di destinazione e configurare i mapping delle colonne. Qui è possibile scegliere di caricare i dati in una nuova tabella o in una tabella esistente, specificare uno schema e dei nomi di tabella, modificare i nomi delle colonne, rimuovere colonne o modificarne i mapping. È possibile accettare le impostazioni predefinite o modificarle in base alle proprie preferenze.

    Screenshot che mostra le opzioni per caricare dati in una tabella esistente o crearne una nuova.

    Dopo aver esaminato le opzioni, selezionare Avanti.

  9. La pagina successiva offre la possibilità di usare la gestione temporanea o di fornire opzioni avanzate per l'operazione di copia dei dati (che usa il comando T-SQL COPY). Esaminare le opzioni senza modificarle e quindi selezionare Avanti.

  10. L'ultima pagina dell'assistente offre un riepilogo dell'attività di copia. Selezionare l'opzione Avvia trasferimento dati immediatamente e quindi Salva + Esegui.

    Screenshot che mostra l'opzione per avviare immediatamente l'operazione di trasferimento dei dati e i pulsanti Indietro e Salva + Esegui.

  11. Si verrà reindirizzati all'area di lavoro della pipeline, in cui è già configurata una nuova attività di Copia dati. La pipeline sarà eseguita automaticamente. È possibile monitorare lo stato della pipeline nel riquadro Output:

    Screenshot che mostra l'area di lavoro della pipeline con un’attività Copy al centro e lo stato di esecuzione della pipeline con stato corrente In corso.

  12. Dopo alcuni secondi, la pipeline viene completata correttamente. Tornando al Warehouse, è possibile selezionare la tabella per visualizzare i dati in anteprima e verificare che l'operazione Copy sia stata completata.

    Screenshot che mostra un Warehouse con la tabella bing_covid_19 selezionata e una griglia che mostra un'anteprima dei dati nella tabella.

Per altre informazioni sull'inserimento di dati nel Warehouse in Microsoft Fabric, visitare:

Passaggio successivo