Come usare i notebook di Microsoft Fabric
Il notebook di Microsoft Fabric è un elemento di codice principale per lo sviluppo di processi Apache Spark e esperimenti di Machine Learning. Si tratta di una superficie interattiva basata sul Web usata da data scientist e data engineer per scrivere codice che trae vantaggio dalle visualizzazioni avanzate e dal testo Markdown. I data engineer scrivono codice per l'inserimento dei dati, la preparazione dei dati e la trasformazione dei dati. I data scientist usano anche notebook per creare soluzioni di Machine Learning, tra cui la creazione di esperimenti e modelli, il rilevamento dei modelli e la distribuzione.
Con un notebook di Fabric è possibile:
- Introduzione a zero operazioni di configurazione.
- Esplorare ed elaborare facilmente i dati con un'esperienza intuitiva a basso codice.
- Mantenere i dati protetti con le funzionalità di sicurezza aziendali predefinite.
- Analizzare i dati in formati non elaborati (CSV, txt, JSON e così via), formati di file elaborati (parquet, Delta Lake e così via), usando potenti funzionalità spark.
- Ottenere produttività con funzionalità avanzate di creazione e visualizzazione dei dati predefinite.
Questo articolo descrive come usare i notebook nelle esperienze di data science e ingegneria dei dati.
Creare notebook
È possibile creare un nuovo notebook o importare un notebook esistente.
Creare un nuovo notebook
Analogamente ad altri processi di creazione di elementi di Fabric standard, è possibile creare facilmente un nuovo notebook dalla home page di Fabric Ingegneria dei dati, dall'opzione Nuovo dell'area di lavoro o dall'opzione Crea hub.
Importare notebook esistenti
È possibile importare uno o più notebook esistenti dal computer locale in un'area di lavoro infrastruttura dalla Ingegneria dei dati o dalla home page di Data Science. I notebook di Fabric riconoscono i file con estensione ipynb di Jupyter Notebook standard e i file di origine come .py, scala e .sql e creano di conseguenza nuovi elementi del notebook.
Esportare un notebook
È possibile esportare il notebook in altri formati standard. Il notebook synapse può essere esportato in:
- File di notebook standard (con estensione ipynb) usato per i notebook di Jupyter.
- Un file HTML (.html) che può essere aperto direttamente da un browser.
- Un file Python (.py).
- Un file latex (.tex).
Salvare un notebook
In Fabric, un notebook verrà salvato automaticamente dopo l'apertura e la modifica; non è necessario preoccuparsi di perdere le modifiche al codice. È anche possibile usare Salva una copia per clonare un'altra copia nell'area di lavoro corrente o in un'altra area di lavoro.
Se si preferisce salvare manualmente un notebook, è possibile passare all'opzione Salvataggio manuale per avere un ramo locale dell'elemento del notebook e quindi usare Salva o CTRL+s per salvare le modifiche.
È anche possibile passare alla modalità di salvataggio manuale selezionando Modifica ->Salva opzioni ->Manuale. Per attivare un ramo locale del notebook e quindi salvarlo manualmente, selezionare Salva o usare la scelta rapida da tastiera CTRL+s .
Connessione lakehouses e notebook
I notebook di Infrastruttura supportano ora interazioni ravvicinate con i lakehouse; è possibile aggiungere facilmente una lakehouse nuova o esistente dallo strumento di esplorazione lakehouse.
È possibile passare a diversi lakehouse in Lakehouse Explorer e impostare una lakehouse come predefinita aggiungendola. Il valore predefinito viene quindi montato nella directory di lavoro del runtime ed è possibile leggere o scrivere nel lakehouse predefinito usando un percorso locale.
Nota
È necessario riavviare la sessione dopo aver aggiunto una nuova lakehouse o rinominare la lakehouse predefinita.
Aggiungere o rimuovere una lakehouse
Se si seleziona l'icona X accanto a un nome lakehouse, viene rimosso dalla scheda del notebook, ma l'elemento lakehouse esiste ancora nell'area di lavoro.
Selezionare Aggiungi lakehouse per aggiungere altri lakehouse al notebook aggiungendo uno esistente o creando un nuovo lakehouse.
Esplorare un file lakehouse
La sottocartella e i file nella sezione Tabelle e file della visualizzazione Lake vengono visualizzati in un'area di contenuto tra l'elenco lakehouse e il contenuto del notebook. Selezionare cartelle diverse nella sezione Tabelle e file per aggiornare l'area del contenuto.
Operazioni su cartelle e file
Se si seleziona un file (.csv, parquet, .txt, .jpg, .png e così via) con un clic con il pulsante destro del mouse, è possibile usare l'API Spark o Pandas per caricare i dati. Viene generata e inserita una nuova cella di codice sotto la cella dello stato attivo.
È possibile copiare facilmente un percorso con un formato diverso dal file o dalla cartella di selezione e usare il percorso corrispondente nel codice.
Risorse del notebook
Esplora risorse notebook offre un file system simile a Unix che consente di gestire cartelle e file. Offre uno spazio di file system scrivibile in cui è possibile archiviare file di piccole dimensioni, ad esempio moduli di codice, modelli semantici e immagini. È possibile accedervi facilmente con il codice nel notebook come se si usasse il file system locale.
Questa cartella predefinita è una cartella predefinita di sistema per ogni istanza del notebook. Mantiene fino a 500 MB di archiviazione per archiviare le dipendenze del notebook corrente. Queste sono le funzionalità principali delle risorse del notebook:
- È possibile usare operazioni comuni, ad esempio creazione/eliminazione, caricamento/download, trascinamento/rilascio, ridenominazione, duplicato e ricerca nell'interfaccia utente.
- È possibile usare percorsi relativi come
builtin/YourData.txt
per un'esplorazione rapida. Ilmssparkutils.nbResPath
metodo consente di comporre il percorso completo. - È possibile spostare facilmente i dati convalidati in una lakehouse tramite l'opzione Scrivi in lakehouse . Fabric include frammenti di codice avanzati incorporati per i tipi di file comuni che consentono di iniziare rapidamente.
- Queste risorse sono disponibili anche per l'uso nel caso di esecuzione del notebook di riferimento tramite
mssparkutils.notebook.run()
.
Nota
- Attualmente Fabric supporta il caricamento di determinati tipi di file tramite l'interfaccia utente, tra cui, .py, whl, .jar, .txt, .json, .yml, .xml, .csv, .html, .png, .jpg e .xlsx. È possibile scrivere nella cartella predefinita con tipi di file non inclusi nell'elenco tramite codice, ma i notebook di Fabric non supportano la generazione di frammenti di codice su tipi di file non supportati.
- Ogni dimensione del file deve essere inferiore a 50 MB e la cartella predefinita consente fino a 100 istanze di file/cartelle in totale.
- Quando si usa
mssparkutils.notebook.run()
, usare ilmssparkutils.nbResPath
comando per accedere alla risorsa notebook di destinazione. Il percorso relativo "builtin/" punterà sempre alla cartella predefinita del notebook radice.
Collaborare in un notebook
Il notebook di Fabric è un elemento collaborativo che supporta più utenti che modificano lo stesso notebook.
Quando si apre un notebook, si passa alla modalità di modifica condivisa per impostazione predefinita e ogni modifica del notebook viene salvata automaticamente. Se i colleghi aprono contemporaneamente lo stesso notebook, vengono visualizzati il profilo, l'output dell'esecuzione, l'indicatore del cursore, l'indicatore di selezione e la modifica della traccia. Usando le funzionalità di collaborazione, è possibile eseguire facilmente la programmazione di coppie, il debug remoto e gli scenari di tutoring.
Condividere un notebook
La condivisione di un notebook è un modo pratico per collaborare con i membri del team. I ruoli dell'area di lavoro autorizzati possono visualizzare o modificare/eseguire notebook per impostazione predefinita. È possibile condividere un notebook con le autorizzazioni specificate concesse.
Selezionare Condividi sulla barra degli strumenti del notebook.
Selezionare la categoria corrispondente di persone che possono visualizzare questo notebook. È possibile scegliere Condividi, Modifica o Esegui autorizzazioni per i destinatari.
Dopo aver selezionato Applica, è possibile inviare il notebook direttamente o copiare il collegamento ad altri utenti. I destinatari possono quindi aprire il notebook con la visualizzazione corrispondente concessa dal livello di autorizzazione.
Per gestire ulteriormente le autorizzazioni del notebook, selezionare Elenco elementi dell'area>di lavoro Altre opzioni e quindi selezionare Gestisci autorizzazioni. Da questa schermata è possibile aggiornare l'accesso e le autorizzazioni esistenti del notebook.
Aggiungere un commento a una cella di codice
Il commento è un'altra funzionalità utile per gli scenari collaborativi. Attualmente Fabric supporta l'aggiunta di commenti a livello di cella.
Selezionare il pulsante Commenti sulla barra degli strumenti del notebook o sull'indicatore di commento della cella per aprire il riquadro Commenti .
Selezionare il codice nella cella del codice, selezionare Nuovo nel riquadro Commenti , aggiungere commenti e quindi selezionare Pubblica commento per salvare.
Se sono necessari, trovare le opzioni Modifica commento, Risolvi thread ed Elimina thread selezionando l'opzione Altro accanto al commento.
Assegnazione di tag ad altri utenti in un commento
"Tagging" si riferisce alla menzione e alla notifica di un utente in un thread di commento, migliorando in modo efficiente la collaborazione sulle specifiche.
Selezionare una sezione di codice in una cella e un nuovo thread di commento.
Immettere il nome utente e scegliere quello corretto nell'elenco dei suggerimenti se si vuole menzionare qualcuno per una discussione su una determinata sezione.
Condividere le informazioni dettagliate e pubblicarle .
Verrà attivata una notifica tramite posta elettronica e l'utente fa clic sul collegamento Apri commenti per individuare rapidamente questa cella.
Inoltre, autorizzare e configurare le autorizzazioni per gli utenti quando si contrassegnano utenti che non hanno accesso, assicurandosi che gli asset di codice siano ben gestiti.
Nota
Per un elemento di commento, l'utente con tag non riceverà più una notifica tramite posta elettronica se si aggiorna il commento entro un'ora. Ma invierà una notifica tramite posta elettronica al nuovo utente con tag.
Cambiare la modalità notebook
I notebook di Fabric supportano due modalità che è possibile passare facilmente tra: modalità di modifica e modalità di visualizzazione .
- Modalità di modifica: è possibile modificare ed eseguire le celle e collaborare con altri utenti nel notebook.
- Modalità di visualizzazione: è possibile visualizzare solo il contenuto, l'output e i commenti della cella del notebook. Tutte le operazioni che apportano modifiche al notebook sono disabilitate.
Contenuto correlato
Commenti e suggerimenti
https://aka.ms/ContentUserFeedback.
Presto disponibile: Nel corso del 2024 verranno gradualmente disattivati i problemi di GitHub come meccanismo di feedback per il contenuto e ciò verrà sostituito con un nuovo sistema di feedback. Per altre informazioni, vedereInvia e visualizza il feedback per