Esercitazione su Lakehouse: Inserire i dati nella lakehouse
In questa esercitazione si inseriscono tabelle più dimensionali e dei fatti dalla Wide World Importers (WWI) alla lakehouse.
Prerequisiti
- Se non si dispone di una lakehouse, è necessario creare una lakehouse.
Inserire i dati
In questa sezione si usa l'attività Copia dati della pipeline di Data Factory per inserire dati di esempio da un account di archiviazione di Azure alla sezione File della lakehouse creata in precedenza.
Selezionare Aree di lavoro nel riquadro di spostamento sinistro e quindi selezionare la nuova area di lavoro dal menu Aree di lavoro . Viene visualizzata la visualizzazione elementi dell'area di lavoro.
Nella voce di menu +Nuovo della barra multifunzione dell'area di lavoro selezionare Pipeline di dati.
Nella finestra di dialogo Nuova pipeline specificare il nome in IngestDataFromSourceToLakehouse e selezionare Crea. Viene creata e aperta una nuova pipeline di data factory.
Nella pipeline di data factory appena creata selezionare Attività pipeline per aggiungere un'attività alla pipeline e selezionare Copia dati. Questa azione aggiunge l'attività di copia dei dati all'area di disegno della pipeline.
Selezionare l'attività di copia appena aggiunta dall'area di disegno. Le proprietà dell'attività vengono visualizzate in un riquadro sotto l'area di disegno (potrebbe essere necessario espandere il riquadro verso l'alto trascinando il bordo superiore). Nella scheda Generale del riquadro delle proprietà digitare Copia dati in Lakehouse nel campo Nome .
Nella scheda Origine dell'attività di copia selezionata selezionare Esterno come tipo di archivio dati e quindi selezionare + Nuovo per creare una nuova connessione all'origine dati.
Per questa esercitazione, tutti i dati di esempio sono disponibili in un contenitore pubblico di archiviazione BLOB di Azure. Ci si connette a questo contenitore per copiare i dati da esso. Nella prima schermata Nuova connessione selezionare Archiviazione BLOB di Azure e quindi selezionare Continua.
Nella schermata Impostazioni connessione immettere i dettagli seguenti e selezionare Crea per creare la connessione all'origine dati.
Proprietà valore Nome o URL dell'account https://azuresynapsestorage.blob.core.windows.net/sampledata
Connessione Create new connection Nome connessione wwisampledata Tipo di autenticazione Anonimo Dopo aver creato la nuova connessione, tornare alla scheda Origine dell'attività di copia dei dati e la connessione appena creata è selezionata per impostazione predefinita. Specificare le proprietà seguenti prima di passare alle impostazioni di destinazione.
Proprietà valore Tipo di archivio dati Esterna Connessione wwisampledata Tipo percorso file Percorso file Percorso file Nome contenitore (prima casella di testo): sampledata
Nome directory (seconda casella di testo): WideWorldImportersDW/parquetRecursively (Ricorsivo) Selezionato File format Binario Nella scheda Destinazione dell'attività di copia dei dati di copia selezionata specificare le proprietà seguenti:
Proprietà valore Tipo di archivio dati Area di lavoro Tipo di archivio dati dell'area di lavoro Lakehouse Lakehouse wwilakehouse Cartella radice File Percorso file Nome directory (prima casella di testo): wwi-raw-data File format Binario L'attività di copia dei dati è stata configurata. Selezionare l'icona salva sulla barra multifunzione superiore (sotto Home) per salvare le modifiche e selezionare Esegui per eseguire la pipeline e la relativa attività. È anche possibile pianificare le pipeline per aggiornare i dati a intervalli definiti per soddisfare i requisiti aziendali. Per questa esercitazione, la pipeline viene eseguita una sola volta selezionando Esegui.
Questa azione attiva la copia dei dati dall'origine dati sottostante al lakehouse specificato e potrebbe richiedere fino a un minuto. È possibile monitorare l'esecuzione della pipeline e la relativa attività nella scheda Output , visualizzata quando si fa clic in un punto qualsiasi dell'area di disegno. Facoltativamente, è possibile selezionare l'icona degli occhiali, visualizzata quando si passa il puntatore del mouse sul nome, per esaminare i dettagli del trasferimento dei dati.
Dopo aver copiato i dati, passare alla visualizzazione elementi dell'area di lavoro e selezionare la nuova lakehouse (wwilakehouse) per avviare la visualizzazione Explorer .
Verificare che nella visualizzazione Explorer venga visualizzata una nuova cartella wwi-raw-data e che i dati per tutte le tabelle vengano copiati.
Per caricare dati incrementali in un lakehouse, vedere Caricare dati in modo incrementale da un data warehouse a una lakehouse.