Esercitazione su Lakehouse: Inserire i dati nella lakehouse

In questa esercitazione si inseriscono tabelle più dimensionali e dei fatti dalla Wide World Importers (WWI) alla lakehouse.

Prerequisiti

Inserire i dati

In questa sezione si usa l'attività Copia dati della pipeline di Data Factory per inserire dati di esempio da un account di archiviazione di Azure alla sezione File della lakehouse creata in precedenza.

  1. Selezionare Aree di lavoro nel riquadro di spostamento sinistro e quindi selezionare la nuova area di lavoro dal menu Aree di lavoro . Viene visualizzata la visualizzazione elementi dell'area di lavoro.

  2. Nella voce di menu +Nuovo della barra multifunzione dell'area di lavoro selezionare Pipeline di dati.

    Screenshot che mostra come creare una nuova pipeline di dati.

  3. Nella finestra di dialogo Nuova pipeline specificare il nome in IngestDataFromSourceToLakehouse e selezionare Crea. Viene creata e aperta una nuova pipeline di data factory.

  4. Nella pipeline di data factory appena creata selezionare Attività pipeline per aggiungere un'attività alla pipeline e selezionare Copia dati. Questa azione aggiunge l'attività di copia dei dati all'area di disegno della pipeline.

    Screenshot che mostra dove selezionare Attività pipeline e Copia dati.

  5. Selezionare l'attività di copia appena aggiunta dall'area di disegno. Le proprietà dell'attività vengono visualizzate in un riquadro sotto l'area di disegno (potrebbe essere necessario espandere il riquadro verso l'alto trascinando il bordo superiore). Nella scheda Generale del riquadro delle proprietà digitare Copia dati in Lakehouse nel campo Nome .

    Screenshot che mostra dove aggiungere il nome dell'attività di copia nella scheda Generale.

  6. Nella scheda Origine dell'attività di copia selezionata selezionare Esterno come tipo di archivio dati e quindi selezionare + Nuovo per creare una nuova connessione all'origine dati.

    Screenshot che mostra dove selezionare Esterno e + Nuovo nella scheda Origine.

  7. Per questa esercitazione, tutti i dati di esempio sono disponibili in un contenitore pubblico di archiviazione BLOB di Azure. Ci si connette a questo contenitore per copiare i dati da esso. Nella prima schermata Nuova connessione selezionare Archiviazione BLOB di Azure e quindi selezionare Continua.

    Screenshot della Procedura guidata Nuova connessione, che mostra dove selezionare Archiviazione BLOB di Azure.

  8. Nella schermata delle impostazioni di Connessione ion immettere i dettagli seguenti e selezionare Crea per creare la connessione all'origine dati.

    Proprietà valore
    Nome o URL dell'account https://azuresynapsestorage.blob.core.windows.net/sampledata
    Connessione Create new connection
    Nome connessione wwisampledata
    Tipo di autenticazione Anonimo

    Screenshot della schermata delle impostazioni di Connessione ion, che mostra dove immettere i dettagli e selezionare Crea.

  9. Dopo aver creato la nuova connessione, tornare alla scheda Origine dell'attività di copia dei dati e la connessione appena creata è selezionata per impostazione predefinita. Specificare le proprietà seguenti prima di passare alle impostazioni di destinazione.

    Proprietà valore
    Tipo di archivio dati Esterna
    Connessione wwisampledata
    Tipo percorso file Percorso file
    Percorso file Nome contenitore (prima casella di testo): sampledata
    Nome directory (seconda casella di testo): WideWorldImportersDW/parquet
    Recursively (Ricorsivo) Selezionato
    File format Binario

    Screenshot della scheda di origine che mostra dove immettere i dettagli specifici.

  10. Nella scheda Destinazione dell'attività di copia dei dati di copia selezionata specificare le proprietà seguenti:

    Proprietà valore
    Tipo di archivio dati Area di lavoro
    Tipo di archivio dati dell'area di lavoro Lakehouse
    Lakehouse wwilakehouse
    Cartella radice File
    Percorso file Nome directory (prima casella di testo): wwi-raw-data
    File format Binario

    Screenshot della scheda Destinazione, che mostra dove immettere dettagli specifici.

  11. L'attività di copia dei dati è stata configurata. Selezionare l'icona salva sulla barra multifunzione superiore (sotto Home) per salvare le modifiche e selezionare Esegui per eseguire la pipeline e la relativa attività. È anche possibile pianificare le pipeline per aggiornare i dati a intervalli definiti per soddisfare i requisiti aziendali. Per questa esercitazione, la pipeline viene eseguita una sola volta selezionando Esegui.

    Questa azione attiva la copia dei dati dall'origine dati sottostante al lakehouse specificato e potrebbe richiedere fino a un minuto. È possibile monitorare l'esecuzione della pipeline e la relativa attività nella scheda Output , visualizzata quando si fa clic in un punto qualsiasi dell'area di disegno. Facoltativamente, è possibile selezionare l'icona degli occhiali, visualizzata quando si passa il puntatore del mouse sul nome, per esaminare i dettagli del trasferimento dei dati.

    Screenshot che mostra dove selezionare Salva ed esegui e dove trovare i dettagli dell'esecuzione e l'icona degli occhiali nella scheda Output.

  12. Dopo aver copiato i dati, passare alla visualizzazione elementi dell'area di lavoro e selezionare la nuova lakehouse (wwilakehouse) per avviare la visualizzazione Explorer .

    Screenshot che mostra dove selezionare il lakehouse per avviare la visualizzazione Explorer.

  13. Verificare che nella visualizzazione Explorer venga visualizzata una nuova cartella wwi-raw-data e che i dati per tutte le tabelle vengano copiati.

    Screenshot che mostra i dati di origine copiati in Lakehouse Explorer.

Per caricare dati incrementali in un lakehouse, vedere Caricare dati in modo incrementale da un data warehouse a una lakehouse.

Passaggio successivo