Esercitazione: Analizzare i dati con un notebook
Si applica a: Endpoint SQL e Warehouse in Microsoft Fabric
Questa esercitazione descrive come salvare i dati una volta e quindi usarla con molti altri servizi. È anche possibile creare collegamenti ai dati archiviati in Azure Data Lake Storage e S3 per consentire di accedere direttamente alle tabelle delta dai sistemi esterni.
Importante
Microsoft Fabric è attualmente in ANTEPRIMA. Queste informazioni si riferiscono a un prodotto di versione preliminare che può essere modificato sostanzialmente prima che venga rilasciato. Microsoft non garantisce alcuna garanzia, espressa o implicita, rispetto alle informazioni fornite qui.
Creare una lakehouse
Prima di tutto, creiamo una nuova lakehouse. Per creare una nuova lakehouse nell'area di lavoro di Microsoft Fabric:
Selezionare l'area
Data Warehouse Tutorial
di lavoro nel menu di spostamento.Selezionare + New>Lakehouse (anteprima).
Nel campo Nome immettere
ShortcutExercise
e selezionare Crea.Il nuovo lakehouse carica e la visualizzazione Explorer si apre, con il menu Recupera dati nel menu lakehouse . In Carica dati in lakehouse selezionare il pulsante Nuovo collegamento .
Nella finestra Nuovo collegamento selezionare il pulsante per Microsoft OneLake.
Nella finestra Selezionare un tipo di origine dati scorrere l'elenco fino a trovare il Warehouse denominato
WideWorldImporters
in precedenza. Selezionarla, quindi selezionare Avanti.Nel browser oggetti OneLake espandere Tabelle, espandere lo
dbo
schema e quindi selezionare il pulsante di opzione accantodimension_customer
a . Selezionare il pulsante Crea.Se viene visualizzata una cartella denominata
Unidentified
in Tabelle, selezionare l'icona Aggiorna nella barra dei menu orizzontale.Selezionare l'oggetto nell'elenco
dimension_customer
Tabella per visualizzare in anteprima i dati. Si noti che il lakehouse mostra i dati delladimension_customer
tabella dal Warehouse!Creare quindi un nuovo notebook per eseguire query sulla
dimension_customer
tabella. Nella barra multifunzione Home selezionare l'elenco a discesa Apri notebook e scegliere Nuovo notebook.Selezionare, quindi trascinare l'oggetto dall'elenco
dimension_customer
Tabelle nella cella del notebook aperto. È possibile visualizzare una query PySpark scritta per eseguire query su tutti i dati daShortcutExercise.dimension_customer
. Questa esperienza del notebook è simile all'esperienza del notebook jupyter di Visual Studio Code. È anche possibile aprire il notebook in VS Code.Nella barra multifunzione Home selezionare il pulsante Esegui tutto . Una volta completata la query, si noterà che è possibile usare facilmente PySpark per eseguire query sulle tabelle warehouse.