Avvio rapido: Spostare e trasformare i dati con flussi di dati e pipeline di dati
In questa esercitazione si vedrà come l'esperienza del flusso di dati e della pipeline di dati può creare una soluzione data factory potente e completa.
Importante
Microsoft Fabric è attualmente in ANTEPRIMA. Queste informazioni si riferiscono a un prodotto di versione preliminare che può essere modificato sostanzialmente prima che venga rilasciato. Microsoft non garantisce alcuna garanzia, espressa o implicita, rispetto alle informazioni fornite qui. Vedere Azure Data Factory documentazione per il servizio in Azure.
Prerequisiti
Per iniziare, è necessario completare i prerequisiti seguenti:
- Un account tenant con una sottoscrizione attiva. Crea un account gratuito.
- Assicurarsi di avere un'area di lavoro abilitata per Microsoft Fabric: creare un'area di lavoro che non sia l'area di lavoro personale predefinita.
- Un database Azure SQL con dati di tabella.
- Un account di archiviazione BLOB.
Trasformare i dati con flussi di dati
Seguire questa procedura per configurare il flusso di dati.
Passaggio 1: Creare un flusso di dati
Scegliere l'area di lavoro abilitata per Fabric e quindi selezionare Nuovo. Selezionare Quindi Dataflow Gen2.
Viene visualizzata la finestra dell'editor di flussi di dati. Selezionare la scheda Importa dalla scheda SQL Server.
Passaggio 2: Ottenere dati
Nella finestra di dialogo Connetti all'origine dati visualizzata successivamente immettere i dettagli per connettersi al database Azure SQL, quindi selezionare Avanti. In questo esempio si usa il database di esempio AdventureWorksLT configurato quando si configura il database di Azure SQL nei prerequisiti.
Selezionare i dati che si desidera trasformare e quindi selezionare Crea. Per questa guida introduttiva, selezionare SalesLT.Customer dai dati di esempio AdventureWorksLT forniti per Azure SQL DATABASE e quindi il pulsante Seleziona tabelle correlate per includere automaticamente due altre tabelle correlate.
Passaggio 3: Trasformare i dati
Se non è selezionata, selezionare il pulsante Visualizzazione diagramma lungo la barra di stato nella parte inferiore della pagina oppure selezionare Visualizzazione diagramma nel menu Visualizza nella parte superiore dell'editor di Power Query. Una di queste opzioni può attivare la visualizzazione diagramma.
Fare clic con il pulsante destro del mouse sulla query SalesLT Customer oppure selezionare i puntini di sospensione verticale a destra della query, quindi selezionare Merge query.
Configurare l'unione selezionando la tabella SalesOrderHeader come tabella destra per l'unione, la colonna CustomerID da ogni tabella come colonna join e Sinistra come tipo di join. Selezionare Quindi Ok quando aggiungere la query di tipo merge.
Selezionare il pulsante Aggiungi destinazione dati , simile a un simbolo di database con una freccia sopra di esso, dalla nuova query di unione appena creata. Selezionare quindi Azure SQL database come tipo di destinazione.
Specificare i dettagli per la connessione al database Azure SQL in cui verrà pubblicata la query di tipo merge. In questo esempio è possibile usare anche il database AdventureWorksLT usato come origine dati per la destinazione.
Scegliere un database per archiviare i dati e specificare un nome di tabella, quindi selezionare Avanti.
È possibile lasciare le impostazioni predefinite nella finestra di dialogo Scegli impostazioni di destinazione e selezionare Salva impostazioni senza apportare modifiche qui.
Selezionare Pubblica nuovamente nella pagina dell'editor del flusso di dati per pubblicare il flusso di dati.
Spostare i dati con le pipeline di dati
Dopo aver creato un flusso di dati gen2, è possibile usarlo in una pipeline. In questo esempio verranno copiati i dati generati dal flusso di dati in formato di testo in un account Archiviazione BLOB di Azure.
Passaggio 1: Creare una nuova pipeline di dati
Nell'area di lavoro selezionare Nuovo, quindi selezionare Pipeline di dati.
Assegnare un nome alla pipeline e quindi selezionare Crea.
Passaggio 2: Configurare il flusso di dati
Aggiungere una nuova attività di flusso di dati alla pipeline di dati selezionando Flusso di dati nella scheda Attività .
Selezionare il flusso di dati nell'area di disegno della pipeline e quindi la scheda Impostazioni . Scegliere il flusso di dati creato in precedenza dall'elenco a discesa.
Selezionare Salva e quindi Esegui per eseguire il flusso di dati per popolare inizialmente la tabella di query unita progettata nel passaggio precedente.
Passaggio 3: Usare l'assistente copia per aggiungere un'attività di copia
Selezionare Copia dati nell'area di disegno per aprire lo strumento Copia assistente per iniziare. In alternativa, selezionare Usa assistente copia dall'elenco a discesa Copia dati nella scheda Attività sulla barra multifunzione.
Scegliere l'origine dati selezionando un tipo di origine dati. In questa esercitazione si userà il database Azure SQL usato in precedenza quando è stato creato il flusso di dati per generare una nuova query di merge. Scorrere verso il basso sotto le offerte di dati di esempio e selezionare la scheda Azure in Origini dati e quindi Azure SQL Database. Selezionare Quindi Avanti per continuare.
Creare una connessione all'origine dati selezionando Crea nuova connessione. Compilare le informazioni di connessione necessarie nel pannello e immettere AdventureWorksLT per il database, in cui è stata generata la query di merge nel flusso di dati. Fare quindi clic su Avanti.
Selezionare la tabella generata nel passaggio precedente del flusso di dati e quindi selezionare Avanti.
Per la destinazione scegliere Archiviazione BLOB di Azure e quindi selezionare Avanti.
Creare una connessione alla destinazione selezionando Crea nuova connessione. Specificare i dettagli per la connessione, quindi selezionare Avanti.
Selezionare il percorso della cartella e specificare un nome file, quindi selezionare Avanti.
Selezionare Di nuovo Avanti per accettare il formato di file predefinito, il delimitatore di colonne, il delimitatore di righe e il tipo di compressione, facoltativamente inclusa un'intestazione.
Finalizzare le impostazioni. Esaminare quindi e selezionare OK per completare il processo.
Passaggio 5: Progettare la pipeline di dati e salvare per eseguire e caricare i dati
Per eseguire l'attività Copia dopo l'attività Flusso di dati , trascinare da Successed nell'attività Flusso di dati all'attività Copy . L'attività Copia verrà eseguita solo dopo che l'attività Flusso di dati ha avuto esito positivo.
Selezionare Salva per salvare la pipeline di dati. Selezionare Quindi Esegui per eseguire la pipeline di dati e caricare i dati.
Pianificare l'esecuzione della pipeline
Dopo aver completato lo sviluppo e il test della pipeline, è possibile pianificarlo automaticamente.
Nella scheda Home della finestra dell'editor della pipeline selezionare Pianifica.
Configurare la pianificazione in base alle esigenze. L'esempio seguente pianifica l'esecuzione giornaliera della pipeline alle 8:00 fino alla fine dell'anno.
Passaggi successivi
Questo esempio illustra come creare e configurare un flusso di dati gen2 per creare una query di tipo merge e archiviarla in un database Azure SQL, quindi copiare i dati dal database in un file di testo in Archiviazione BLOB di Azure. Si è appreso come:
- Creare un flusso di dati.
- Trasformare i dati con il flusso di dati.
- Creare una pipeline di dati usando il flusso di dati.
- Ordinare l'esecuzione di passaggi nella pipeline.
- Copiare i dati con l'assistente copia.
- Eseguire e pianificare la pipeline di dati.
Successivamente, passare per altre informazioni sul monitoraggio delle esecuzioni della pipeline.