Come usare i notebook di Microsoft Fabric

Il notebook di Microsoft Fabric è un elemento di codice principale per lo sviluppo di processi Apache Spark e esperimenti di Machine Learning. Si tratta di una superficie interattiva basata sul Web usata da data scientist e data engineer per scrivere codice che trae vantaggio dalle visualizzazioni avanzate e dal testo Markdown. I data engineer scrivono codice per l'inserimento dei dati, la preparazione dei dati e la trasformazione dei dati. I data scientist usano anche notebook per creare soluzioni di Machine Learning, tra cui la creazione di esperimenti e modelli, il rilevamento dei modelli e la distribuzione.

Con un notebook di Fabric è possibile:

  • Introduzione a zero operazioni di configurazione.
  • Esplorare ed elaborare facilmente i dati con un'esperienza intuitiva a basso codice.
  • Mantenere i dati protetti con le funzionalità di sicurezza aziendali predefinite.
  • Analizzare i dati in formati non elaborati (CSV, txt, JSON e così via), formati di file elaborati (parquet, Delta Lake e così via), usando potenti funzionalità spark.
  • Ottenere produttività con funzionalità avanzate di creazione e visualizzazione dei dati predefinite.

Questo articolo descrive come usare i notebook nelle esperienze di data science e ingegneria dei dati.

Creare notebook

È possibile creare un nuovo notebook o importare un notebook esistente.

Creare un nuovo notebook

Analogamente ad altri processi di creazione di elementi di Fabric standard, è possibile creare facilmente un nuovo notebook dalla home page di Fabric Ingegneria dei dati, dall'opzione Nuovo dell'area di lavoro o dall'opzione Crea hub.

Importare notebook esistenti

È possibile importare uno o più notebook esistenti dal computer locale in un'area di lavoro infrastruttura dalla Ingegneria dei dati o dalla home page di Data Science. I notebook di Fabric riconoscono i file con estensione ipynb di Jupyter Notebook standard e i file di origine come py, scala e sql e creano di conseguenza nuovi elementi del notebook.

Screenshot showing where to find notebook options on the New menu.

Esportare un notebook

È possibile esportare il notebook in altri formati standard. Il notebook synapse può essere esportato in:

  • File di notebook standard (con estensione ipynb) usato per i notebook di Jupyter.
  • Un file HTML (.html) che può essere aperto direttamente da un browser.
  • Un file Python (con estensione py).
  • Un file Latex (con estensione tex).

Screenshot showing where to export notebook.

Salvare un notebook

In Fabric, un notebook verrà salvato automaticamente dopo l'apertura e la modifica; non è necessario preoccuparsi di perdere le modifiche al codice. È anche possibile usare Salva una copia per clonare un'altra copia nell'area di lavoro corrente o in un'altra area di lavoro.

Screenshot showing where to save a copy.

Se si preferisce salvare manualmente un notebook, è possibile passare all'opzione Salvataggio manuale per avere un ramo locale dell'elemento del notebook e quindi usare Salva o CTRL+s per salvare le modifiche.

Screenshot showing where to switch manual save.

È anche possibile passare alla modalità di salvataggio manuale selezionando Modifica ->Salva opzioni ->Manuale. Per attivare un ramo locale del notebook e quindi salvarlo manualmente, selezionare Salva o usare la scelta rapida da tastiera CTRL+s .

Connessione lakehouses e notebook

I notebook di Infrastruttura supportano ora interazioni ravvicinate con i lakehouse; è possibile aggiungere facilmente una lakehouse nuova o esistente dallo strumento di esplorazione lakehouse.

È possibile passare a diversi lakehouse in Lakehouse Explorer e impostare una lakehouse come predefinita aggiungendola. Il valore predefinito viene quindi montato nella directory di lavoro del runtime ed è possibile leggere o scrivere nel lakehouse predefinito usando un percorso locale.

Screenshot showing where to pin a default lakehouse.

Nota

È necessario riavviare la sessione dopo aver aggiunto una nuova lakehouse o rinominare la lakehouse predefinita.

Aggiungere o rimuovere una lakehouse

Se si seleziona l'icona X accanto a un nome lakehouse, viene rimosso dalla scheda del notebook, ma l'elemento lakehouse esiste ancora nell'area di lavoro.

Selezionare Aggiungi lakehouse per aggiungere altri lakehouse al notebook aggiungendo uno esistente o creando un nuovo lakehouse.

Esplorare un file lakehouse

La sottocartella e i file nella sezione Tabelle e file della visualizzazione Lake vengono visualizzati in un'area di contenuto tra l'elenco lakehouse e il contenuto del notebook. Selezionare cartelle diverse nella sezione Tabelle e file per aggiornare l'area del contenuto.

Operazioni su cartelle e file

Se si seleziona un file (.csv, .parquet, .txt, .jpg, .png e così via) con un clic con il pulsante destro del mouse, è possibile usare l'API Spark o Pandas per caricare i dati. Viene generata e inserita una nuova cella di codice sotto la cella dello stato attivo.

È possibile copiare facilmente un percorso con un formato diverso dal file o dalla cartella di selezione e usare il percorso corrispondente nel codice.

Screenshot showing context menu of files in lakehouse.

Risorse del notebook

Esplora risorse notebook offre un file system simile a Unix che consente di gestire cartelle e file. Offre uno spazio di file system scrivibile in cui è possibile archiviare file di piccole dimensioni, ad esempio moduli di codice, modelli semantici e immagini. È possibile accedervi facilmente con il codice nel notebook come se si usasse il file system locale.

Animated GIF of notebook resources.

Questa cartella predefinita è una cartella predefinita di sistema per ogni istanza del notebook. Mantiene fino a 500 MB di archiviazione per archiviare le dipendenze del notebook corrente. Queste sono le funzionalità principali delle risorse del notebook:

  • È possibile usare operazioni comuni, ad esempio creazione/eliminazione, caricamento/download, trascinamento/rilascio, ridenominazione, duplicato e ricerca nell'interfaccia utente.
  • È possibile usare percorsi relativi come builtin/YourData.txt per un'esplorazione rapida. Il mssparkutils.nbResPath metodo consente di comporre il percorso completo.
  • È possibile spostare facilmente i dati convalidati in una lakehouse tramite l'opzione Scrivi in lakehouse . Fabric include frammenti di codice avanzati incorporati per i tipi di file comuni che consentono di iniziare rapidamente.
  • Queste risorse sono disponibili anche per l'uso nel caso di esecuzione del notebook di riferimento tramite mssparkutils.notebook.run().

Nota

  • Attualmente Fabric supporta il caricamento di determinati tipi di file tramite l'interfaccia utente, tra cui, .py, .whl, .jar, .txt, .json, .yml, .xml, .csv, .html, .png, .jpg e file xlsx. È possibile scrivere nella cartella predefinita con tipi di file non inclusi nell'elenco tramite codice, ma i notebook di Fabric non supportano la generazione di frammenti di codice su tipi di file non supportati.
  • Ogni dimensione del file deve essere inferiore a 50 MB e la cartella predefinita consente fino a 100 istanze di file/cartelle in totale.
  • Quando si usa mssparkutils.notebook.run(), usare il mssparkutils.nbResPath comando per accedere alla risorsa notebook di destinazione. Il percorso relativo "builtin/" punterà sempre alla cartella predefinita del notebook radice.

Collaborare in un notebook

Il notebook di Fabric è un elemento collaborativo che supporta più utenti che modificano lo stesso notebook.

Quando si apre un notebook, si passa alla modalità di modifica condivisa per impostazione predefinita e ogni modifica del notebook viene salvata automaticamente. Se i colleghi aprono contemporaneamente lo stesso notebook, vengono visualizzati il profilo, l'output dell'esecuzione, l'indicatore del cursore, l'indicatore di selezione e la modifica della traccia. Usando le funzionalità di collaborazione, è possibile eseguire facilmente la programmazione di coppie, il debug remoto e gli scenari di tutoring.

Screenshot showing a code cell with another user editing.

Condividere un notebook

La condivisione di un notebook è un modo pratico per collaborare con i membri del team. I ruoli dell'area di lavoro autorizzati possono visualizzare o modificare/eseguire notebook per impostazione predefinita. È possibile condividere un notebook con le autorizzazioni specificate concesse.

  1. Selezionare Condividi sulla barra degli strumenti del notebook.

    Screenshot showing where to select Share.

  2. Selezionare la categoria corrispondente di persone che possono visualizzare questo notebook. È possibile scegliere Condividi, Modifica o Esegui autorizzazioni per i destinatari.

    Screenshot showing where to select permissions.

  3. Dopo aver selezionato Applica, è possibile inviare il notebook direttamente o copiare il collegamento ad altri utenti. I destinatari possono quindi aprire il notebook con la visualizzazione corrispondente concessa dal livello di autorizzazione.

    Screenshot showing where to create and send link.

  4. Per gestire ulteriormente le autorizzazioni del notebook, selezionare Elenco elementi dell'area>di lavoro Altre opzioni e quindi selezionare Gestisci autorizzazioni. Da questa schermata è possibile aggiornare l'accesso e le autorizzazioni esistenti del notebook.

    Screenshot showing where to manage permissions in workspace.

Aggiungere un commento a una cella di codice

Il commento è un'altra funzionalità utile per gli scenari collaborativi. Attualmente Fabric supporta l'aggiunta di commenti a livello di cella.

  1. Selezionare il pulsante Commenti sulla barra degli strumenti del notebook o sull'indicatore di commento della cella per aprire il riquadro Commenti .

    Screenshot showing where to select Comment.

  2. Selezionare il codice nella cella del codice, selezionare Nuovo nel riquadro Commenti , aggiungere commenti e quindi selezionare Pubblica commento per salvare.

    Screenshot showing where to select New.

  3. Se sono necessari, trovare le opzioni Modifica commento, Risolvi thread ed Elimina thread selezionando l'opzione Altro accanto al commento.

Cambiare la modalità notebook

I notebook di Fabric supportano due modalità che è possibile passare facilmente tra: modalità di modifica e modalità di visualizzazione .

Screenshot showing where switch modes.

  • Modalità di modifica: è possibile modificare ed eseguire le celle e collaborare con altri utenti nel notebook.
  • Modalità di visualizzazione: è possibile visualizzare solo il contenuto, l'output e i commenti della cella del notebook. Tutte le operazioni che apportano modifiche al notebook sono disabilitate.