Come usare i notebook di Microsoft Fabric
Il notebook di Microsoft Fabric è un elemento di codice principale per lo sviluppo di processi Apache Spark e esperimenti di Machine Learning. Si tratta di una superficie interattiva basata sul Web usata da data scientist e data engineer per scrivere codice che trae vantaggio dalle visualizzazioni avanzate e dal testo Markdown. I data engineer scrivono codice per l'inserimento dei dati, la preparazione dei dati e la trasformazione dei dati. I data scientist usano anche notebook per creare soluzioni di Machine Learning, tra cui la creazione di esperimenti e modelli, il rilevamento dei modelli e la distribuzione.
Con un notebook di Fabric è possibile:
- Introduzione a zero operazioni di configurazione.
- Esplorare ed elaborare facilmente i dati con un'esperienza intuitiva a basso codice.
- Mantenere i dati protetti con le funzionalità di sicurezza aziendali predefinite.
- Analizzare i dati in formati non elaborati (CSV, txt, JSON e così via), formati di file elaborati (parquet, Delta Lake e così via), usando potenti funzionalità spark.
- Ottenere produttività con funzionalità avanzate di creazione e visualizzazione dei dati predefinite.
Questo articolo descrive come usare i notebook nelle esperienze di data science e ingegneria dei dati.
Creare notebook
È possibile creare un nuovo notebook o importare un notebook esistente.
Creare un nuovo notebook
Analogamente ad altri processi di creazione di elementi di Fabric standard, è possibile creare facilmente un nuovo notebook dalla home page di Fabric Ingegneria dei dati, dall'opzione Nuovo dell'area di lavoro o dall'opzione Crea hub.
Importare notebook esistenti
È possibile importare uno o più notebook esistenti dal computer locale in un'area di lavoro infrastruttura dalla Ingegneria dei dati o dalla home page di Data Science. I notebook di Fabric riconoscono i file con estensione ipynb di Jupyter Notebook standard e i file di origine come py, scala e sql e creano di conseguenza nuovi elementi del notebook.
Esportare un notebook
È possibile esportare il notebook in altri formati standard. Il notebook synapse può essere esportato in:
- File di notebook standard (con estensione ipynb) usato per i notebook di Jupyter.
- Un file HTML (.html) che può essere aperto direttamente da un browser.
- Un file Python (con estensione py).
- Un file Latex (con estensione tex).
Salvare un notebook
In Fabric, un notebook verrà salvato automaticamente dopo l'apertura e la modifica; non è necessario preoccuparsi di perdere le modifiche al codice. È anche possibile usare Salva una copia per clonare un'altra copia nell'area di lavoro corrente o in un'altra area di lavoro.
Se si preferisce salvare manualmente un notebook, è possibile passare all'opzione Salvataggio manuale per avere un ramo locale dell'elemento del notebook e quindi usare Salva o CTRL+s per salvare le modifiche.
È anche possibile passare alla modalità di salvataggio manuale selezionando Modifica ->Salva opzioni ->Manuale. Per attivare un ramo locale del notebook e quindi salvarlo manualmente, selezionare Salva o usare la scelta rapida da tastiera CTRL+s .
Connessione lakehouses e notebook
I notebook di Infrastruttura supportano ora interazioni ravvicinate con i lakehouse; è possibile aggiungere facilmente una lakehouse nuova o esistente dallo strumento di esplorazione lakehouse.
È possibile passare a diversi lakehouse in Lakehouse Explorer e impostare una lakehouse come predefinita aggiungendola. Il valore predefinito viene quindi montato nella directory di lavoro del runtime ed è possibile leggere o scrivere nel lakehouse predefinito usando un percorso locale.
Nota
È necessario riavviare la sessione dopo aver aggiunto una nuova lakehouse o rinominare la lakehouse predefinita.
Aggiungere o rimuovere una lakehouse
Se si seleziona l'icona X accanto a un nome lakehouse, viene rimosso dalla scheda del notebook, ma l'elemento lakehouse esiste ancora nell'area di lavoro.
Selezionare Aggiungi lakehouse per aggiungere altri lakehouse al notebook aggiungendo uno esistente o creando un nuovo lakehouse.
Esplorare un file lakehouse
La sottocartella e i file nella sezione Tabelle e file della visualizzazione Lake vengono visualizzati in un'area di contenuto tra l'elenco lakehouse e il contenuto del notebook. Selezionare cartelle diverse nella sezione Tabelle e file per aggiornare l'area del contenuto.
Operazioni su cartelle e file
Se si seleziona un file (.csv, .parquet, .txt, .jpg, .png e così via) con un clic con il pulsante destro del mouse, è possibile usare l'API Spark o Pandas per caricare i dati. Viene generata e inserita una nuova cella di codice sotto la cella dello stato attivo.
È possibile copiare facilmente un percorso con un formato diverso dal file o dalla cartella di selezione e usare il percorso corrispondente nel codice.
Risorse del notebook
Esplora risorse notebook offre un file system simile a Unix che consente di gestire cartelle e file. Offre uno spazio di file system scrivibile in cui è possibile archiviare file di piccole dimensioni, ad esempio moduli di codice, modelli semantici e immagini. È possibile accedervi facilmente con il codice nel notebook come se si usasse il file system locale.
Questa cartella predefinita è una cartella predefinita di sistema per ogni istanza del notebook. Mantiene fino a 500 MB di archiviazione per archiviare le dipendenze del notebook corrente. Queste sono le funzionalità principali delle risorse del notebook:
- È possibile usare operazioni comuni, ad esempio creazione/eliminazione, caricamento/download, trascinamento/rilascio, ridenominazione, duplicato e ricerca nell'interfaccia utente.
- È possibile usare percorsi relativi come
builtin/YourData.txt
per un'esplorazione rapida. Ilmssparkutils.nbResPath
metodo consente di comporre il percorso completo. - È possibile spostare facilmente i dati convalidati in una lakehouse tramite l'opzione Scrivi in lakehouse . Fabric include frammenti di codice avanzati incorporati per i tipi di file comuni che consentono di iniziare rapidamente.
- Queste risorse sono disponibili anche per l'uso nel caso di esecuzione del notebook di riferimento tramite
mssparkutils.notebook.run()
.
Nota
- Attualmente Fabric supporta il caricamento di determinati tipi di file tramite l'interfaccia utente, tra cui, .py, .whl, .jar, .txt, .json, .yml, .xml, .csv, .html, .png, .jpg e file xlsx. È possibile scrivere nella cartella predefinita con tipi di file non inclusi nell'elenco tramite codice, ma i notebook di Fabric non supportano la generazione di frammenti di codice su tipi di file non supportati.
- Ogni dimensione del file deve essere inferiore a 50 MB e la cartella predefinita consente fino a 100 istanze di file/cartelle in totale.
- Quando si usa
mssparkutils.notebook.run()
, usare ilmssparkutils.nbResPath
comando per accedere alla risorsa notebook di destinazione. Il percorso relativo "builtin/" punterà sempre alla cartella predefinita del notebook radice.
Collaborare in un notebook
Il notebook di Fabric è un elemento collaborativo che supporta più utenti che modificano lo stesso notebook.
Quando si apre un notebook, si passa alla modalità di modifica condivisa per impostazione predefinita e ogni modifica del notebook viene salvata automaticamente. Se i colleghi aprono contemporaneamente lo stesso notebook, vengono visualizzati il profilo, l'output dell'esecuzione, l'indicatore del cursore, l'indicatore di selezione e la modifica della traccia. Usando le funzionalità di collaborazione, è possibile eseguire facilmente la programmazione di coppie, il debug remoto e gli scenari di tutoring.
Condividere un notebook
La condivisione di un notebook è un modo pratico per collaborare con i membri del team. I ruoli dell'area di lavoro autorizzati possono visualizzare o modificare/eseguire notebook per impostazione predefinita. È possibile condividere un notebook con le autorizzazioni specificate concesse.
Selezionare Condividi sulla barra degli strumenti del notebook.
Selezionare la categoria corrispondente di persone che possono visualizzare questo notebook. È possibile scegliere Condividi, Modifica o Esegui autorizzazioni per i destinatari.
Dopo aver selezionato Applica, è possibile inviare il notebook direttamente o copiare il collegamento ad altri utenti. I destinatari possono quindi aprire il notebook con la visualizzazione corrispondente concessa dal livello di autorizzazione.
Per gestire ulteriormente le autorizzazioni del notebook, selezionare Elenco elementi dell'area>di lavoro Altre opzioni e quindi selezionare Gestisci autorizzazioni. Da questa schermata è possibile aggiornare l'accesso e le autorizzazioni esistenti del notebook.
Aggiungere un commento a una cella di codice
Il commento è un'altra funzionalità utile per gli scenari collaborativi. Attualmente Fabric supporta l'aggiunta di commenti a livello di cella.
Selezionare il pulsante Commenti sulla barra degli strumenti del notebook o sull'indicatore di commento della cella per aprire il riquadro Commenti .
Selezionare il codice nella cella del codice, selezionare Nuovo nel riquadro Commenti , aggiungere commenti e quindi selezionare Pubblica commento per salvare.
Se sono necessari, trovare le opzioni Modifica commento, Risolvi thread ed Elimina thread selezionando l'opzione Altro accanto al commento.
Cambiare la modalità notebook
I notebook di Fabric supportano due modalità che è possibile passare facilmente tra: modalità di modifica e modalità di visualizzazione .
- Modalità di modifica: è possibile modificare ed eseguire le celle e collaborare con altri utenti nel notebook.
- Modalità di visualizzazione: è possibile visualizzare solo il contenuto, l'output e i commenti della cella del notebook. Tutte le operazioni che apportano modifiche al notebook sono disabilitate.
Contenuto correlato
Commenti e suggerimenti
https://aka.ms/ContentUserFeedback.
Presto disponibile: nel corso del 2024 verranno dismessi i problemi di GitHub come meccanismo di feedback per il contenuto e verranno sostituiti con un nuovo sistema di feedback. Per altre informazioni, vedere:Invia e visualizza il feedback per