Copiare da Archiviazione BLOB di Azure a Lakehouse
In questa esercitazione si creerà una pipeline di dati per spostare un file CSV da una cartella di input di un'origine Archiviazione BLOB di Azure a una destinazione Lakehouse.
Prerequisiti
Per iniziare, è necessario completare i prerequisiti seguenti:
Assicurarsi di avere un'area di lavoro abilitata per Project Microsoft Fabric: Creare un'area di lavoro.
Selezionare il pulsante Prova adesso per preparare l'origine dati Archiviazione BLOB di Azure copia. Creare un nuovo gruppo di risorse per questo Archiviazione BLOB di Azure e selezionare Rivedi e crea crea>.
Verrà quindi creata una Archiviazione BLOB di Azure e moviesDB2.csv verrà caricata nella cartella di input del Archiviazione BLOB di Azure creato.
Creare una pipeline di dati
Passare a Data factory nella pagina app.powerbi.com.
Creare una nuova area di lavoro per questa demo.
Selezionare Nuovo e quindi pipeline di dati.
Copiare dati con l'Assistente copia
In questa sessione si inizierà a creare una pipeline di dati seguendo questa procedura. Questi passaggi copiano un file CSV da una cartella di input di un Archiviazione BLOB di Azure a una destinazione Lakehouse usando l'assistente copia.
Passaggio 1: Iniziare con l'assistente copia
Selezionare Copia dati nell'area di disegno per aprire lo strumento Di assistente copia per iniziare. In alternativa, selezionare Usa assistente copia dall'elenco a discesa Copia dati nella scheda Attività sulla barra multifunzione.
Passaggio 2: Configurare l'origine
Selezionare Archiviazione BLOB di Azure e quindi selezionare Avanti.
Creare una connessione all'origine dati selezionando Nuova connessione.
Dopo aver selezionato Crea nuova connessione, è sufficiente immettere il nome o l'URL dell'account e il tipo di autenticazione. Se si immette il nome dell'account o l'URL usando il nome dell'account Archiviazione BLOB di Azure, la connessione verrà compilata automaticamente. In questa demo verrà scelta la chiave dell'account, ma è possibile scegliere un altro tipo di autenticazione per quanto riguarda le preferenze. Dopo aver selezionato Accedi, è sufficiente accedere a un account con questa autorizzazione di archiviazione BLOB.
Dopo aver creato correttamente la connessione, è sufficiente selezionare Avanti per Connessione all'origine dati.
Scegliere il file moviesDB2.csv nella configurazione di origine da visualizzare in anteprima e quindi selezionare Avanti.
Passaggio 3: Configurare la destinazione
Selezionare Lakehouse e quindi Avanti.
Creare un nuovo Lakehouse e immettere il nome Lakehouse. Quindi seleziona Avanti.
Configurare ed eseguire il mapping dei dati di origine alla destinazione; quindi selezionare Avanti per completare le configurazioni di destinazione.
Passaggio 4: Esaminare e creare l'attività di copia
Esaminare le impostazioni dell'attività di copia nei passaggi precedenti e selezionare OK per completare. In alternativa, è possibile tornare ai passaggi precedenti per modificare le impostazioni, se necessario nello strumento.
Al termine, l'attività di copia verrà quindi aggiunta all'area di disegno della pipeline di dati. Tutte le impostazioni, incluse le impostazioni avanzate per questa attività di copia, sono disponibili nelle schede seguenti quando è selezionata.
Eseguire e pianificare la pipeline di dati
Passare alla scheda Home e selezionare Esegui. Selezionare quindi Salva ed Esegui.
Selezionare il pulsante Dettagli per monitorare lo stato di avanzamento e controllare i risultati dell'esecuzione.
Nella finestra di dialogo Copia dettagli dati vengono visualizzati i risultati dell'esecuzione, inclusi lo stato, il volume di dati letti e scritti, gli orari di avvio e di arresto e la durata.
È anche possibile pianificare l'esecuzione della pipeline con una frequenza specifica in base alle esigenze. Di seguito è riportato l'esempio per pianificare l'esecuzione della pipeline ogni 15 minuti.
Contenuto correlato
La pipeline di questo esempio illustra come copiare dati da Archiviazione BLOB di Azure a Lakehouse. Contenuto del modulo:
- Creare una pipeline di dati.
- Copiare dati con l'Assistente copia.
- Eseguire e pianificare la pipeline di dati.
Passare quindi a altre informazioni sul monitoraggio delle esecuzioni della pipeline.
Commenti e suggerimenti
https://aka.ms/ContentUserFeedback.
Presto disponibile: Nel corso del 2024 verranno gradualmente disattivati i problemi di GitHub come meccanismo di feedback per il contenuto e ciò verrà sostituito con un nuovo sistema di feedback. Per altre informazioni, vedereInvia e visualizza il feedback per