Copiare da Archiviazione BLOB di Azure a Lakehouse

In questa esercitazione si creerà una pipeline di dati per spostare un file CSV da una cartella di input di un'origine Archiviazione BLOB di Azure a una destinazione Lakehouse.

Prerequisiti

Per iniziare, è necessario completare i prerequisiti seguenti:

  • Assicurarsi di avere un'area di lavoro abilitata per Project Microsoft Fabric: Creare un'area di lavoro.

  • Selezionare il pulsante Prova adesso per preparare l'origine dati Archiviazione BLOB di Azure copia. Creare un nuovo gruppo di risorse per questo Archiviazione BLOB di Azure e selezionare Rivedi e crea crea>.

    Try your first data factory demo

    Screenshot of Project details screen.

    Verrà quindi creata una Archiviazione BLOB di Azure e moviesDB2.csv verrà caricata nella cartella di input del Archiviazione BLOB di Azure creato.

    Screenshot showing where new storage appears in folder.

Creare una pipeline di dati

  1. Passare a Data factory nella pagina app.powerbi.com.

    Screenshot of menu in which Data factory option appears.

  2. Creare una nuova area di lavoro per questa demo.

    Screenshot of Workspace screen.

  3. Selezionare Nuovo e quindi pipeline di dati.

    Screenshot of the New menu.

Copiare dati con l'Assistente copia

In questa sessione si inizierà a creare una pipeline di dati seguendo questa procedura. Questi passaggi copiano un file CSV da una cartella di input di un Archiviazione BLOB di Azure a una destinazione Lakehouse usando l'assistente copia.

Passaggio 1: Iniziare con l'assistente copia

  1. Selezionare Copia dati nell'area di disegno per aprire lo strumento Di assistente copia per iniziare. In alternativa, selezionare Usa assistente copia dall'elenco a discesa Copia dati nella scheda Attività sulla barra multifunzione.

    Screenshot of two options to select copy assistant.

Passaggio 2: Configurare l'origine

  1. Selezionare Archiviazione BLOB di Azure e quindi selezionare Avanti.

    Screenshot showing where to choose Azure Blob Storage as data source.

  2. Creare una connessione all'origine dati selezionando Nuova connessione.

    Screenshot showing where to select New connection.

    1. Dopo aver selezionato Crea nuova connessione, è sufficiente immettere il nome o l'URL dell'account e il tipo di autenticazione. Se si immette il nome dell'account o l'URL usando il nome dell'account Archiviazione BLOB di Azure, la connessione verrà compilata automaticamente. In questa demo verrà scelta la chiave dell'account, ma è possibile scegliere un altro tipo di autenticazione per quanto riguarda le preferenze. Dopo aver selezionato Accedi, è sufficiente accedere a un account con questa autorizzazione di archiviazione BLOB.

      Screenshot showing the Connect to data source screen of the copy data assistant.

    2. Dopo aver creato correttamente la connessione, è sufficiente selezionare Avanti per Connessione all'origine dati.

  3. Scegliere il file moviesDB2.csv nella configurazione di origine da visualizzare in anteprima e quindi selezionare Avanti.

    Screenshot showing how to choose data source.

Passaggio 3: Configurare la destinazione

  1. Selezionare Lakehouse e quindi Avanti.

    Screenshot showing the Choose data destination dialog with Lakehouse selected.

  2. Creare un nuovo Lakehouse e immettere il nome Lakehouse. Quindi seleziona Avanti.

    Screenshot showing the Choose data destination dialog with the new lakehouse option selected.

  3. Configurare ed eseguire il mapping dei dati di origine alla destinazione; quindi selezionare Avanti per completare le configurazioni di destinazione.

    Screenshot showing the Connect to data destination dialog in the copy data assistant with the table name MoviesDB filled in.

Passaggio 4: Esaminare e creare l'attività di copia

  1. Esaminare le impostazioni dell'attività di copia nei passaggi precedenti e selezionare OK per completare. In alternativa, è possibile tornare ai passaggi precedenti per modificare le impostazioni, se necessario nello strumento.

    Screenshot showing the Review + create screen in the Copy data assistant dialog.

  2. Al termine, l'attività di copia verrà quindi aggiunta all'area di disegno della pipeline di dati. Tutte le impostazioni, incluse le impostazioni avanzate per questa attività di copia, sono disponibili nelle schede seguenti quando è selezionata.

    Screenshot showing the finished Copy activity.

Eseguire e pianificare la pipeline di dati

  1. Passare alla scheda Home e selezionare Esegui. Selezionare quindi Salva ed Esegui.

    Screenshot showing the Copy activity's Run button on the Home tab.

    Screenshot showing the Save and run dialog for the Copy activity.

  2. Selezionare il pulsante Dettagli per monitorare lo stato di avanzamento e controllare i risultati dell'esecuzione.

    Screenshot showing the run Details button.

  3. Nella finestra di dialogo Copia dettagli dati vengono visualizzati i risultati dell'esecuzione, inclusi lo stato, il volume di dati letti e scritti, gli orari di avvio e di arresto e la durata.

    Screenshot showing the Copy data details dialog.

  4. È anche possibile pianificare l'esecuzione della pipeline con una frequenza specifica in base alle esigenze. Di seguito è riportato l'esempio per pianificare l'esecuzione della pipeline ogni 15 minuti.

    Screenshot showing the schedule configuration dialog.

    Screenshot showing a pipeline with a configured schedule to run every 15 minutes.

La pipeline di questo esempio illustra come copiare dati da Archiviazione BLOB di Azure a Lakehouse. Contenuto del modulo:

  • Creare una pipeline di dati.
  • Copiare dati con l'Assistente copia.
  • Eseguire e pianificare la pipeline di dati.

Passare quindi a altre informazioni sul monitoraggio delle esecuzioni della pipeline.