Condividi tramite


Esercitazione su Lakehouse: creare un lakehouse, inserire dati di esempio e generare un report

In questa esercitazione viene generato un lakehouse, vengono inseriti dati di esempio nella tabella Delta, viene applicata la trasformazione dove necessario e quindi vengono creati report.

Suggerimento

Questo tutorial è il primo di una serie. Dopo aver completato questa esercitazione, continuare a inserire i dati nel lakehouse per creare un lakehouse aziendale completo usando pipeline di Data Factory, notebook Spark e tecniche avanzate di creazione di report.

Ecco un elenco di controllo dei passaggi completati in questa esercitazione:

Se Microsoft Fabric non è disponibile, iscriversi per ottenere una capacità di valutazione gratuita.

Prerequisiti

Perché è necessario OneDrive per questa esercitazione?

Per questa esercitazione è necessario OneDrive perché il processo di inserimento dati si basa su OneDrive come meccanismo di archiviazione sottostante per i caricamenti di file. Quando si carica un file CSV in Fabric, viene archiviato temporaneamente nell'account OneDrive prima di essere inserito nel lakehouse. Questa integrazione garantisce il trasferimento sicuro e facile dei file all'interno dell'ecosistema Microsoft 365.

Il passaggio di inserimento non funziona se OneDrive non è configurato, perché Fabric non può accedere al file caricato. Se i dati sono già disponibili nel lakehouse o in un'altra posizione supportata, OneDrive non è necessario.

Nota

Se si dispone già di dati nel lakehouse, è possibile usare tali dati anziché il file CSV di esempio. Per verificare se i dati sono già associati al lakehouse, usare Lakehouse Explorer o l'endpoint di analisi SQL per esplorare tabelle, file e cartelle. Per ulteriori informazioni su come verificare, vedere Panoramica di Lakehouse e Consultare le tabelle di lakehouse con l'endpoint di analisi SQL.

Creare un lakehouse

In questa sezione, crei un lakehouse in Fabric.

  1. In Fabric, selezionare aree di lavoro dalla barra di spostamento.

  2. Per aprire l'area di lavoro, immettere il nome nella casella di ricerca in alto e selezionarlo nei risultati della ricerca.

  3. Nell'area di lavoro selezionare Nuovo elemento, immettere Lakehouse nella casella di ricerca e quindi selezionare Lakehouse.

  4. Nella finestra di dialogo Nuovo lakehouse immettere wwilakehouse nel campo Nome.

    Screenshot della finestra di dialogo del nuovo lakehouse.

  5. Selezionare Crea per creare e aprire il nuovo lakehouse.

Inserire dati di esempio

In questa sezione vengono inseriti dati di esempio dei clienti nel lakehouse.

Nota

Se OneDrive non è configurato, iscriversi alla versione di valutazione gratuita di Microsoft 365: Versione di valutazione gratuita - Prova Microsoft 365 per un mese.

  1. Scaricare il file dimension_customer.csv dal repository degli esempi di Fabric.

  2. Selezionare il tuo Lakehouse e poi passare alla scheda Home.

  3. Selezionare Recupera datiNuovo flusso di dati >Gen2 per creare un nuovo flusso di dati. Questo flusso di dati viene usato per inserire i dati di esempio nel lakehouse. In alternativa, in Recupera dati nel lakehouse è possibile selezionare il riquadro New Dataflow Gen2 (Nuovo flusso di dati Gen2 ).

    Screenshot che mostra dove selezionare l'opzione New Dataflow Gen2 (Nuovo flusso di dati Gen2) per caricare i dati nel lakehouse.

  4. Nel riquadro Nuovo flusso di dati Gen2 immettere Customer Dimension Data nel campo Nome e selezionare Crea.

    Screenshot del riquadro Nuovo flusso di dati Gen2 che mostra dove immettere il nome del flusso di dati.

  5. Nella scheda Home del flusso di dati selezionare il riquadro Importa da un file di testo/CSV .

  6. Nella schermata Connetti all'origine dati, selezionare il pulsante di opzione Carica file.

  7. Esplora o trascina il file dimension_customer.csv scaricato nel passaggio 1. Dopo il caricamento del file, selezionare Avanti.

    Screenshot che mostra dove selezionare il file da caricare.

  8. Nella pagina Anteprima dati file è possibile visualizzare in anteprima i dati. Selezionare quindi Crea per continuare e tornare all'area di disegno del flusso di dati.

Trasforma e carica i dati nel lakehouse

In questa sezione si trasformano i dati in base ai requisiti aziendali e si caricano nel lakehouse.

  1. Nel riquadro Impostazioni query verificare che il campo Nome sia impostato su dimension_customer. Questo nome viene usato come nome di tabella nella Lakehouse, quindi deve essere tutto in minuscolo e non deve contenere spazi.

    Screenshot del riquadro di impostazioni query che mostra dove immettere il nome e selezionare la destinazione dei dati.

  2. Poiché hai creato il flusso di dati dal tuo lakehouse, la destinazione dei dati viene automaticamente impostata sul tuo lakehouse. È possibile verificarlo controllando la destinazione dati nel riquadro Impostazioni query.

    Suggerimento

    Se si crea un flusso di dati dall'area di lavoro anziché da un lakehouse, è necessario aggiungere manualmente una destinazione dati. Per altre informazioni, vedere Destinazione predefinita flusso di dati Gen2 e Destinazioni dati e impostazioni gestite.

  3. Dalla canvas del flusso di dati è possibile trasformare facilmente i dati in base alle esigenze aziendali. Per semplicità, in questa esercitazione non vengono apportate modifiche. Per continuare, selezionare Salva ed esegui nella barra degli strumenti.

    Screenshot del riquadro Impostazioni query che contiene il pulsante Pubblica.

    Attendere il completamento dell'esecuzione del flusso di dati. Mentre è in corso, viene visualizzato un indicatore di stato rotante.

    Screenshot che mostra lo stato di esecuzione del flusso di dati.

  4. Al termine dell'esecuzione del flusso di dati, selezionare il lakehouse nella barra dei menu in alto per aprirlo.

  5. In Lakehouse Explorer, trova lo schema dbo sotto le Tabelle, seleziona il menu ... (puntini di sospensione) accanto allo schema e quindi seleziona Aggiorna. Questo esegue il flusso di dati e carica i dati dal file di origine nella tabella lakehouse.

    Screenshot dell'esploratore lakehouse, che mostra dove selezionare l'opzione Aggiorna.

  6. Al termine dell'aggiornamento, espandere lo schema dbo per visualizzare la tabella Delta dimension_customer. Selezionare una tabella per visualizzare un'anteprima dei dati.

  7. È possibile usare l'endpoint di analisi SQL del lakehouse per eseguire query sui dati con istruzioni SQL. Selezionare Endpoint di analisi SQL dal menu a discesa nella parte superiore destra della schermata.

    Screenshot della tabella Delta, che mostra dove selezionare endpoint di Analisi SQL.

  8. Selezionare la tabella dimension_customer per visualizzarne l'anteprima dei dati. Per scrivere istruzioni SQL, selezionare Nuova query SQL dal menu o selezionare il riquadro Nuova query SQL .

    Screenshot della schermata endpoint di analisi SQL che mostra dove selezionare Nuova query SQL.

  9. Immettere la query di esempio seguente che aggrega il conteggio delle righe in base alla colonna BuyingGroup della tabella dimension_customer .

    SELECT BuyingGroup, Count(*) AS Total
    FROM dimension_customer
    GROUP BY BuyingGroup
    

    Nota

    I file di query SQL vengono salvati automaticamente per riferimento futuro ed è possibile rinominare o eliminare questi file in base alle esigenze.

  10. Per eseguire lo script, selezionare l'icona Esegui nella parte superiore del file di script.

    Screenshot che mostra l'icona Esegui e i risultati della query.

Aggiungere tabelle al modello semantico

In questa sezione si aggiungono le tabelle al modello semantico in modo che sia possibile usarle per creare report.

  1. Apri il tuo lakehouse e passa alla vista Endpoint di analisi SQL.

  2. Selezionare Nuovo modello semantico.

  3. Nel riquadro Nuovo modello semantico immettere un nome per il modello semantico, assegnare un'area di lavoro e selezionare le tabelle da aggiungere. In questo caso, selezionare la tabella dimension_customer.

    Screenshot in cui è possibile selezionare le tabelle da aggiungere al modello semantico.

  4. Selezionare Conferma per creare il modello semantico.

    Avvertimento

    Se viene visualizzato un messaggio di errore che indica che non è stato possibile aggiungere o rimuovere tabelle a causa della capacità di calcolo di Fabric dell'organizzazione che supera i limiti, attendere alcuni minuti e riprovare. Per altre informazioni, vedere documentazione sulla capacità dell'infrastruttura.

  5. Il modello semantico viene creato in modalità Direct Lake Storage, ovvero legge i dati direttamente dalle tabelle Delta in OneLake per ottenere prestazioni di query rapide senza dover importare i dati. Dopo la creazione, è possibile modificare il modello semantico per aggiungere relazioni, misure e altro ancora.

    Suggerimento

    Per altre informazioni su Direct Lake e sui relativi vantaggi, vedere Panoramica di Direct Lake.

Creare un report

In questa sezione viene creato un report dal modello semantico creato.

  1. Nell'area di lavoro, trova il modello semantico che hai creato, seleziona il menu ... (puntini di sospensione) e quindi seleziona Crea report automaticamente.

    Screenshot del modello semantico nella pagina di panoramica dell'area di lavoro, che mostra dove creare un report.

  2. La tabella è una dimensione e non vi sono misure. Power BI crea una misura per il conteggio delle righe, la aggrega in colonne diverse e crea grafici diversi, come illustrato nello screenshot seguente.

    Screenshot di una pagina di riepilogo rapido che mostra quattro grafici a barre diversi.

  3. È possibile salvare questo report per il futuro selezionando Salva dalla barra multifunzione superiore. È possibile apportare altre modifiche a questo report per soddisfare i propri requisiti includendo o escludendo altre tabelle o colonne.

Passaggio successivo