Esercitazione: Analizzare i dati con un notebook

Si applica a: Endpoint SQL e Warehouse in Microsoft Fabric

Questa esercitazione descrive come salvare i dati una volta e quindi usarla con molti altri servizi. È anche possibile creare collegamenti ai dati archiviati in Azure Data Lake Storage e S3 per consentire di accedere direttamente alle tabelle delta dai sistemi esterni.

Importante

Microsoft Fabric è attualmente in ANTEPRIMA. Queste informazioni si riferiscono a un prodotto di versione preliminare che può essere modificato sostanzialmente prima che venga rilasciato. Microsoft non garantisce alcuna garanzia, espressa o implicita, rispetto alle informazioni fornite qui.

Creare una lakehouse

Prima di tutto, creiamo una nuova lakehouse. Per creare una nuova lakehouse nell'area di lavoro di Microsoft Fabric:

  1. Selezionare l'area Data Warehouse Tutorial di lavoro nel menu di spostamento.

  2. Selezionare + New>Lakehouse (anteprima).

    Screenshot del portale di Fabric che mostra il menu + Nuovo. Lakehouse (anteprima) è in rosso.

  3. Nel campo Nome immettere ShortcutExercise e selezionare Crea.

    Screenshot del portale di Fabric che mostra il campo nome per la nuova lakehouse. Il nome specificato è ShortcutExercise.

  4. Il nuovo lakehouse carica e la visualizzazione Explorer si apre, con il menu Recupera dati nel menu lakehouse . In Carica dati in lakehouse selezionare il pulsante Nuovo collegamento .

    Screenshot del portale di Fabric che mostra i dati di caricamento nel menu lakehouse nella pagina di destinazione. Il pulsante Nuovo collegamento viene premuto in rosso.

  5. Nella finestra Nuovo collegamento selezionare il pulsante per Microsoft OneLake.

    Screenshot del portale di Fabric che mostra la finestra Nuovo collegamento. Il pulsante per Microsoft OneLake è in rosso.

  6. Nella finestra Selezionare un tipo di origine dati scorrere l'elenco fino a trovare il Warehouse denominato WideWorldImporters in precedenza. Selezionarla, quindi selezionare Avanti.

  7. Nel browser oggetti OneLake espandere Tabelle, espandere lo dbo schema e quindi selezionare il pulsante di opzione accanto dimension_customera . Selezionare il pulsante Crea.

    Screenshot del portale di Fabric che mostra il browser a oggetti OneLake. In WideWorldImporters, Tables, dbo, il dimension_customer è in rosso.

  8. Se viene visualizzata una cartella denominata Unidentified in Tabelle, selezionare l'icona Aggiorna nella barra dei menu orizzontale.

    Screenshot del portale di Fabric che mostra il pulsante di aggiornamento sulla barra dei menu orizzontale e le tabelle non identificate in ShortcutExercise in Lakehouse Explorer.

  9. Selezionare l'oggetto nell'elenco dimension_customerTabella per visualizzare in anteprima i dati. Si noti che il lakehouse mostra i dati della dimension_customer tabella dal Warehouse!

    Screenshot del portale di Fabric che mostra l'anteprima dei dati della tabella dimension_customer.

  10. Creare quindi un nuovo notebook per eseguire query sulla dimension_customer tabella. Nella barra multifunzione Home selezionare l'elenco a discesa Apri notebook e scegliere Nuovo notebook.

    Screenshot del portale di Fabric che mostra il pulsante Apri notebook premuto e l'opzione Nuovo notebook selezionato.

  11. Selezionare, quindi trascinare l'oggetto dall'elenco dimension_customerTabelle nella cella del notebook aperto. È possibile visualizzare una query PySpark scritta per eseguire query su tutti i dati da ShortcutExercise.dimension_customer. Questa esperienza del notebook è simile all'esperienza del notebook jupyter di Visual Studio Code. È anche possibile aprire il notebook in VS Code.

    Screenshot della visualizzazione notebook del portale di Fabric. Una freccia indica il percorso per selezionare dimension_customer, quindi trascinarlo nella cella del notebook aperto.

  12. Nella barra multifunzione Home selezionare il pulsante Esegui tutto . Una volta completata la query, si noterà che è possibile usare facilmente PySpark per eseguire query sulle tabelle warehouse.

    Screenshot del portale di Fabric che mostra i risultati dell'esecuzione del notebook per visualizzare i dati da dimension_customer.

Passaggi successivi