Condividi tramite


Come usare i notebook di Microsoft Fabric

Il notebook di Microsoft Fabric è un elemento di codice principale per lo sviluppo di processi Apache Spark e esperimenti di Machine Learning. Si tratta di una superficie interattiva basata sul Web usata da data scientist e data engineer per scrivere codice che trae vantaggio dalle visualizzazioni avanzate e dal testo Markdown. I data engineer scrivono codice per l'inserimento dei dati, la preparazione dei dati e la trasformazione dei dati. I data scientist usano anche notebook per creare soluzioni di Machine Learning, tra cui la creazione di esperimenti e modelli, il rilevamento dei modelli e la distribuzione.

Con un notebook di Fabric è possibile:

  • Introduzione a zero operazioni di configurazione.
  • Esplorare ed elaborare facilmente i dati con un'esperienza intuitiva a basso codice.
  • Mantenere i dati protetti con le funzionalità di sicurezza aziendali predefinite.
  • Analizzare i dati in formati non elaborati (CSV, txt, JSON e così via), formati di file elaborati (parquet, Delta Lake e così via), usando potenti funzionalità spark.
  • Ottenere produttività con funzionalità avanzate di creazione e visualizzazione dei dati predefinite.

Questo articolo descrive come usare i notebook nelle esperienze di data science e ingegneria dei dati.

Creare notebook

È possibile creare un nuovo notebook o importare un notebook esistente.

Creare un nuovo notebook

Analogamente ad altri processi di creazione di elementi di Fabric standard, è possibile creare facilmente un nuovo notebook dalla home page di Fabric Ingegneria dei dati, dall'opzione Nuovo dell'area di lavoro o dall'opzione Crea hub.

Importare notebook esistenti

È possibile importare uno o più notebook esistenti dal computer locale in un'area di lavoro infrastruttura dalla Ingegneria dei dati o dalla home page di Data Science. I notebook di Fabric riconoscono i file con estensione ipynb di Jupyter Notebook standard e i file di origine come .py, scala e .sql e creano di conseguenza nuovi elementi del notebook.

Screenshot che mostra dove trovare le opzioni del notebook nel menu Nuovo.

Esportare un notebook

È possibile esportare il notebook in altri formati standard. Il notebook synapse può essere esportato in:

  • File di notebook standard (con estensione ipynb) usato per i notebook di Jupyter.
  • Un file HTML (.html) che può essere aperto direttamente da un browser.
  • Un file Python (.py).
  • Un file latex (.tex).

Screenshot che mostra dove esportare il notebook.

Salvare un notebook

In Fabric, un notebook verrà salvato automaticamente dopo l'apertura e la modifica; non è necessario preoccuparsi di perdere le modifiche al codice. È anche possibile usare Salva una copia per clonare un'altra copia nell'area di lavoro corrente o in un'altra area di lavoro.

Screenshot che mostra dove salvare una copia.

Se si preferisce salvare manualmente un notebook, è possibile passare all'opzione Salvataggio manuale per avere un ramo locale dell'elemento del notebook e quindi usare Salva o CTRL+s per salvare le modifiche.

Screenshot che mostra dove cambiare il salvataggio manuale.

È anche possibile passare alla modalità di salvataggio manuale selezionando Modifica ->Salva opzioni ->Manuale. Per attivare un ramo locale del notebook e quindi salvarlo manualmente, selezionare Salva o usare la scelta rapida da tastiera CTRL+s .

Connessione lakehouses e notebook

I notebook di Infrastruttura supportano ora interazioni ravvicinate con i lakehouse; è possibile aggiungere facilmente una lakehouse nuova o esistente dallo strumento di esplorazione lakehouse.

È possibile passare a diversi lakehouse in Lakehouse Explorer e impostare una lakehouse come predefinita aggiungendola. Il valore predefinito viene quindi montato nella directory di lavoro del runtime ed è possibile leggere o scrivere nel lakehouse predefinito usando un percorso locale.

Screenshot che mostra dove aggiungere una lakehouse predefinita.

Nota

È necessario riavviare la sessione dopo aver aggiunto una nuova lakehouse o rinominare la lakehouse predefinita.

Aggiungere o rimuovere una lakehouse

Se si seleziona l'icona X accanto a un nome lakehouse, viene rimosso dalla scheda del notebook, ma l'elemento lakehouse esiste ancora nell'area di lavoro.

Selezionare Aggiungi lakehouse per aggiungere altri lakehouse al notebook aggiungendo uno esistente o creando un nuovo lakehouse.

Esplorare un file lakehouse

La sottocartella e i file nella sezione Tabelle e file della visualizzazione Lake vengono visualizzati in un'area di contenuto tra l'elenco lakehouse e il contenuto del notebook. Selezionare cartelle diverse nella sezione Tabelle e file per aggiornare l'area del contenuto.

Operazioni su cartelle e file

Se si seleziona un file (.csv, parquet, .txt, .jpg, .png e così via) con un clic con il pulsante destro del mouse, è possibile usare l'API Spark o Pandas per caricare i dati. Viene generata e inserita una nuova cella di codice sotto la cella dello stato attivo.

È possibile copiare facilmente un percorso con un formato diverso dal file o dalla cartella di selezione e usare il percorso corrispondente nel codice.

Screenshot che mostra il menu di scelta rapida dei file in lakehouse.

Risorse del notebook

Esplora risorse notebook offre un file system simile a Unix che consente di gestire cartelle e file. Offre uno spazio di file system scrivibile in cui è possibile archiviare file di piccole dimensioni, ad esempio moduli di codice, modelli semantici e immagini. È possibile accedervi facilmente con il codice nel notebook come se si usasse il file system locale.

GIF animata delle risorse del notebook.

Questa cartella predefinita è una cartella predefinita di sistema per ogni istanza del notebook. Mantiene fino a 500 MB di archiviazione per archiviare le dipendenze del notebook corrente. Queste sono le funzionalità principali delle risorse del notebook:

  • È possibile usare operazioni comuni, ad esempio creazione/eliminazione, caricamento/download, trascinamento/rilascio, ridenominazione, duplicato e ricerca nell'interfaccia utente.
  • È possibile usare percorsi relativi come builtin/YourData.txt per un'esplorazione rapida. Il mssparkutils.nbResPath metodo consente di comporre il percorso completo.
  • È possibile spostare facilmente i dati convalidati in una lakehouse tramite l'opzione Scrivi in lakehouse . Fabric include frammenti di codice avanzati incorporati per i tipi di file comuni che consentono di iniziare rapidamente.
  • Queste risorse sono disponibili anche per l'uso nel caso di esecuzione del notebook di riferimento tramite mssparkutils.notebook.run().

Nota

  • Attualmente Fabric supporta il caricamento di determinati tipi di file tramite l'interfaccia utente, tra cui, .py, whl, .jar, .txt, .json, .yml, .xml, .csv, .html, .png, .jpg e .xlsx. È possibile scrivere nella cartella predefinita con tipi di file non inclusi nell'elenco tramite codice, ma i notebook di Fabric non supportano la generazione di frammenti di codice su tipi di file non supportati.
  • Ogni dimensione del file deve essere inferiore a 50 MB e la cartella predefinita consente fino a 100 istanze di file/cartelle in totale.
  • Quando si usa mssparkutils.notebook.run(), usare il mssparkutils.nbResPath comando per accedere alla risorsa notebook di destinazione. Il percorso relativo "builtin/" punterà sempre alla cartella predefinita del notebook radice.

Collaborare in un notebook

Il notebook di Fabric è un elemento collaborativo che supporta più utenti che modificano lo stesso notebook.

Quando si apre un notebook, si passa alla modalità di modifica condivisa per impostazione predefinita e ogni modifica del notebook viene salvata automaticamente. Se i colleghi aprono contemporaneamente lo stesso notebook, vengono visualizzati il profilo, l'output dell'esecuzione, l'indicatore del cursore, l'indicatore di selezione e la modifica della traccia. Usando le funzionalità di collaborazione, è possibile eseguire facilmente la programmazione di coppie, il debug remoto e gli scenari di tutoring.

Screenshot che mostra una cella di codice con un altro utente che modifica.

Condividere un notebook

La condivisione di un notebook è un modo pratico per collaborare con i membri del team. I ruoli dell'area di lavoro autorizzati possono visualizzare o modificare/eseguire notebook per impostazione predefinita. È possibile condividere un notebook con le autorizzazioni specificate concesse.

  1. Selezionare Condividi sulla barra degli strumenti del notebook.

    Screenshot che mostra dove selezionare Condividi.

  2. Selezionare la categoria corrispondente di persone che possono visualizzare questo notebook. È possibile scegliere Condividi, Modifica o Esegui autorizzazioni per i destinatari.

    Screenshot che mostra dove selezionare le autorizzazioni.

  3. Dopo aver selezionato Applica, è possibile inviare il notebook direttamente o copiare il collegamento ad altri utenti. I destinatari possono quindi aprire il notebook con la visualizzazione corrispondente concessa dal livello di autorizzazione.

    Screenshot che mostra dove creare e inviare il collegamento.

  4. Per gestire ulteriormente le autorizzazioni del notebook, selezionare Elenco elementi dell'area>di lavoro Altre opzioni e quindi selezionare Gestisci autorizzazioni. Da questa schermata è possibile aggiornare l'accesso e le autorizzazioni esistenti del notebook.

    Screenshot che mostra dove gestire le autorizzazioni nell'area di lavoro.

Aggiungere un commento a una cella di codice

Il commento è un'altra funzionalità utile per gli scenari collaborativi. Attualmente Fabric supporta l'aggiunta di commenti a livello di cella.

  1. Selezionare il pulsante Commenti sulla barra degli strumenti del notebook o sull'indicatore di commento della cella per aprire il riquadro Commenti .

    Screenshot che mostra dove selezionare Commento.

  2. Selezionare il codice nella cella del codice, selezionare Nuovo nel riquadro Commenti , aggiungere commenti e quindi selezionare Pubblica commento per salvare.

    Screenshot che mostra dove selezionare Nuovo.

  3. Se sono necessari, trovare le opzioni Modifica commento, Risolvi thread ed Elimina thread selezionando l'opzione Altro accanto al commento.

Assegnazione di tag ad altri utenti in un commento

"Tagging" si riferisce alla menzione e alla notifica di un utente in un thread di commento, migliorando in modo efficiente la collaborazione sulle specifiche.

  1. Selezionare una sezione di codice in una cella e un nuovo thread di commento.

  2. Immettere il nome utente e scegliere quello corretto nell'elenco dei suggerimenti se si vuole menzionare qualcuno per una discussione su una determinata sezione.

  3. Condividere le informazioni dettagliate e pubblicarle .

  4. Verrà attivata una notifica tramite posta elettronica e l'utente fa clic sul collegamento Apri commenti per individuare rapidamente questa cella.

  5. Inoltre, autorizzare e configurare le autorizzazioni per gli utenti quando si contrassegnano utenti che non hanno accesso, assicurandosi che gli asset di codice siano ben gestiti.

GIF animata di aggiunta di tag ad altri in un commento.

Nota

Per un elemento di commento, l'utente con tag non riceverà più una notifica tramite posta elettronica se si aggiorna il commento entro un'ora. Ma invierà una notifica tramite posta elettronica al nuovo utente con tag.

Cambiare la modalità notebook

I notebook di Fabric supportano due modalità che è possibile passare facilmente tra: modalità di modifica e modalità di visualizzazione .

Screenshot che mostra dove cambia modalità.

  • Modalità di modifica: è possibile modificare ed eseguire le celle e collaborare con altri utenti nel notebook.
  • Modalità di visualizzazione: è possibile visualizzare solo il contenuto, l'output e i commenti della cella del notebook. Tutte le operazioni che apportano modifiche al notebook sono disabilitate.