Leggere in inglese

Condividi tramite


Come usare i notebook di Microsoft Fabric

Il notebook Microsoft Fabric è un elemento di codice primario per lo sviluppo di processi Apache Spark e desperimenti di apprendimento automatico. È una superficie interattiva basata sul Web usata da data scientist e data engineer per scrivere codice che sfrutta visualizzazioni avanzate e testo Markdown. I data engineer scrivono codice per l'inserimento dei dati, la preparazione dei dati e la trasformazione dei dati. I data scientist usano notebook anche per creare soluzioni di apprendimento automatico, tra cui la creazione di esperimenti e modelli, il rilevamento di modelli e la distribuzione.

Con un notebook Fabric è possibile:

  • Iniziare senza attività di configurazione.
  • Esplorare ed elaborare facilmente i dati con un'esperienza intuitiva con poco codice.
  • Mantenere i dati protetti con le funzionalità di sicurezza aziendali predefinite.
  • Analizzare i dati in formati non elaborati (CSV, txt, JSON e così via), formati di file elaborati (Parquet, Delta Lake e così via), usando le potenti funzionalità di Spark.
  • Ottenere produttività con funzionalità avanzate di creazione e visualizzazione dei dati predefinite.

Questo articolo descrive come usare i notebook nelle esperienze di data science e ingegneria dei dati.

Contesto di protezione del notebook in esecuzione

L'esecuzione di un notebook può essere attivata in tre modi diversi in Fabric, con la massima flessibilità, per soddisfare scenari diversi:

  • Esecuzione interattiva: l'utente attiva manualmente l'esecuzione tramite le diverse voci UX o chiamando l'API REST. L'esecuzione avverrà nel contesto di protezione dell'utente corrente.
  • Esecuzione come attività della pipeline: l'esecuzione viene attivata dalla pipeline Data Factory di Fabric. È possibile trovare i passaggi dettagliati nell' attività del notebook. L'esecuzione avverrà nel contesto di protezione del proprietario della pipeline.
  • Utilità di pianificazione: l'esecuzione viene attivata da un piano dell'utilità di pianificazione. L'esecuzione avverrà nel contesto di protezione dell'utente che configura/aggiorna il piano dell'utilità di pianificazione.

La flessibilità di queste opzioni di esecuzione con diversi contesti di protezione consente di soddisfare diversi scenari e requisiti, ma richiede anche la consapevolezza del contesto di protezione durante la progettazione e lo sviluppo del notebook, altrimenti potrebbero verificarsi comportamenti imprevisti e anche alcuni problemi di sicurezza.

La prima volta che viene creato un notebook, verrà visualizzato un messaggio di avviso per ricordare il rischio di eseguire il codice senza esaminarlo.

Screenshot che mostra l'avviso relativo all'esecuzione del notebook.

Di seguito sono riportate alcune procedure consigliate per evitare problemi di sicurezza:

  • Prima di eseguire manualmente il notebook, aprire l'impostazione del notebook e controllare la sezione Dettagli nel pannello Informazioni per l'aggiornamento delle modifiche, e assicurarsi che la modifica più recente sia corretta.
  • Prima di aggiungere un'attività del notebook a una pipeline, aprire l'impostazione del notebook e controllare la sezione Dettagli nel pannello Informazioni per l'aggiornamento della modifica, e assicurarsi che la modifica più recente sia corretta. Se non si è certi della modifica più recente, aprire il notebook per rivedere la modifica prima di aggiungerla alla pipeline.
  • Prima di aggiornare il piano dell'utilità di pianificazione, aprire l'impostazione del notebook e controllare la sezione Dettagli nel pannello Informazioni per l'aggiornamento delle modifiche, e assicurarsi che la modifica più recente sia corretta. Se non si è certi della modifica più recente, aprire il notebook per rivedere la modifica prima di aggiornare il piano dell'utilità di pianificazione.
  • Separare l'area di lavoro in una fase diversa (sviluppo, test, produzione) e controllare l'accesso di una fase diversa per evitare il problema di sicurezza. Aggiungere solo l'utente attendibile alla fase di produzione.

Creare notebook

È possibile creare un nuovo notebook o importare un notebook esistente.

Creare un nuovo notebook

Analogamente ad altri processi di creazione di elementi di Fabric standard, è possibile creare facilmente un nuovo notebook dalla home page di Fabric Ingegneria dei dati, opzione Nuovo dell'area di lavoro oppure opzione Crea hub.

Importare notebook esistenti

È possibile importare uno o più notebook esistenti dal computer locale usando la voce nella barra degli strumenti dell'area di lavoro. I notebook di Fabric riconoscono i file standard di Jupyter Notebook con estensione .ipynb e i file di origine come .py, .scalae .sqle creano di conseguenza nuovi elementi del notebook.

Screenshot che visualizza dove trovare le opzioni del notebook nel menu Nuovo.

Esportare un notebook

È possibile esportare il notebook in altri formati standard. Il notebook Synapse può essere esportato in:

  • Il file del notebook standard (.ipynb) usato per i notebook Jupyter.
  • Un file HTML (.html) che può essere aperto direttamente da un browser.
  • Un file Python (.py).
  • Un file Latex (.tex).

Screenshot che mostra dove esportare il notebook.

Salvare un notebook

In Fabric, un notebook per impostazione predefinita verrà salvato automaticamente dopo l'apertura e la modifica; non è necessario preoccuparsi di perdere le modifiche al codice. È anche possibile usare Salva una copia per clonare un'altra copia nell'area di lavoro corrente o in un'altra area di lavoro.

Screenshot che mostra dove salvare una copia.

Se si preferisce salvare manualmente un notebook, è possibile passare all'opzione di salvataggio Manuale per avere un ramo locale dell'elemento del notebook e quindi usare Salva o CTRL+S per salvare le modifiche.

Screenshot che mostra dove passare al salvataggio manuale.

È possibile passare alla modalità di salvataggio manuale anche selezionando Modifica ->Salva opzioni ->Manuale. Per attivare un ramo locale del notebook e quindi salvarlo manualmente, selezionare Salva o usare l’abbreviazione da tastiera CTRL+S.

Connettere lakehouse e notebook

I notebook Fabric ora supportano interazioni ravvicinate con i lakehouse; è possibile aggiungere facilmente un lakehouse nuovo o esistente da Esplora lakehouse.

È possibile passare a diversi lakehouse in Esplora lakehouse e impostare un lakehouse come predefinito bloccandolo. Il lakehouse predefinito viene quindi montato nella directory di lavoro del runtime ed è possibile leggere o scrivere nel lakehouse predefinito usando un percorso locale.

Screenshot che mostra dove bloccare un lakehouse predefinito.

Nota

Dopo aver aggiunto un nuovo lakehouse o dopo aver rinominato il lakehouse predefinito, è necessario riavviare la sessione.

Aggiungere o rimuovere un lakehouse

Selezionando l'icona X accanto al nome di un lakehouse, il lakehouse viene rimosso dalla scheda del notebook, ma l'elemento lakehouse rimane nell'area di lavoro.

Selezionare Aggiungi lakehouse per aggiungere altri lakehouse al notebook, aggiungendone uno esistente o creando un nuovo lakehouse.

Esplorare un file lakehouse

La sottocartella e i file nella sezione Tabelle e File della visualizzazione Lake appaiono in un'area di contenuto tra l'elenco di lakehouse e il contenuto del notebook. Selezionare cartelle diverse nella sezione Tabelle e File per aggiornare l'area del contenuto.

Operazioni su cartelle e file

Se si seleziona un file (.csv, .parquet, .txt, .jpg, .png e così via) facendo cllic con il pulsante destro del mouse, è possibile usare l'API Spark o Pandas per caricare i dati. Viene generata e inserita una nuova cella di codice sotto la cella attivata.

È possibile copiare facilmente un percorso con un formato diverso dal file o cartella di selezione e usare il percorso corrispondente nel codice.

Screenshot che mostra il menu contestuale dei file in lakehouse.

Risorse del notebook

Esplora risorse del notebook offre un file system simile a Unix che consente di gestire cartelle e file. Offre uno spazio del file system scrivibile in cui è possibile archiviare file di piccole dimensioni, ad esempio moduli di codice, modelli semantici e immagini. È possibile accedervi facilmente con il codice nel notebook come se si usasse il file system locale.

GIF animata delle risorse del notebook.

Nota

  • Le risorse di archiviazione massime per la cartella predefinita e la cartella dell'ambiente sono 500 MB, con dimensioni di un singolo file fino a 100 MB. Entrambi consentono fino a 100 istanze di file/cartelle in totale.
  • Quando si usa notebookutils.notebook.run(), usare il comando notebookutils.nbResPath per accedere alla risorsa del notebook di destinazione. Il percorso relativo compilato/ punterà sempre alla cartella predefinita del notebook radice.

Cartella delle risorse predefinite

La cartella delle risorse predefinite è una cartella predefinita di sistema per ogni istanza dell'elemento del notebook. Ecco le funzionalità principali per le risorse del notebook.

  • È possibile usare operazioni comuni, ad esempio creazione/eliminazione, caricamento/download, trascinamento/rilascio, ridenominazione, duplicazione e ricerca nell'interfaccia utente.
  • È possibile usare percorsi relativi come builtin/YourData.txt per un'esplorazione rapida. Il metodo notebookutils.nbResPath consente di comporre il percorso completo.
  • È possibile spostare facilmente i dati convalidati in un lakehouse tramite l'opzione Scrivi nel lakehouse. Fabric incorpora frammenti di codice avanzati per i tipi di file comuni per iniziare rapidamente.
  • Queste risorse sono disponibili per l'uso anche nel caso di esecuzione del notebook di riferimento tramite notebookutils.notebook.run().

Cartella delle risorse dell'ambiente

Environment Resources Folder è un repository condiviso progettato per semplificare la collaborazione tra più notebook.

  • È possibile trovare la scheda Risorse all'interno dell'ambiente e disporre delle operazioni complete per gestire i file di risorse qui. Questi file possono essere condivisi tra più notebook dopo che il notebook è collegato all'ambiente corrente.

    Screenshot che mostra dove gestire le risorse nell'ambiente.

  • Nella pagina Notebook è possibile trovare facilmente una seconda cartella radice in Risorse ereditate dall'ambiente collegato.

    Screenshot che mostra dove aprire la cartella delle risorse dell'ambiente.

  • È anche possibile operare sui file o sulle cartelle stesse con la cartella Risorse predefinite.

  • Il percorso della risorsa Ambiente viene montato automaticamente nel cluster del notebook. È possibile usare il percorso relativo /env per accedere alle risorse dell'ambiente.

Nota

Attualmente, la cartella delle risorse dell'ambiente di lettura/scrittura nel codice del notebook non è supportata in una sessione di concorrenza elevata .

Editor di file

L'editor di file consente di visualizzare e modificare i file direttamente all'interno della cartella delle risorse del notebook e della cartella delle risorse dell'ambiente nel notebook. I tipi di file supportati includono CSV, TXT, HTML, YML, PY, SQL e altro ancora. Con l'editor di file, è possibile accedere e modificare facilmente i file all'interno del notebook, supporta l'evidenziazione delle parole chiave e fornisce il servizio di linguaggio necessario durante l'apertura e la modifica di file di codice come .py e .sql.

  • È possibile accedere a questa funzionalità tramite "Visualizza e modifica" nel menu file. Fare doppio clic sul file è un modo più rapido.

    Screenshot che mostra dove visualizzare e modificare i file.

  • La modifica del contenuto nell'editor di file deve essere salvata manualmente facendo clic sul pulsante Salva o sui tasti di scelta rapida: CTRL+S, l'editor di file non supporta il salvataggio automatico.

  • Anche l'editor di file è interessato dalla modalità notebook. È possibile visualizzare solo i file, ma non modificarli se si è in modalità notebook senza l'autorizzazione di modifica.

Nota

Ecco alcune limitazioni per l'editor di file.

  • Il limite di dimensioni del file è 1 MB.
  • Questi tipi di file non sono supportati per la visualizzazione e la modifica: .xlsx e parquet.

Collaborare in un notebook

Il notebook Fabric è un elemento collaborativo che supporta più utenti che modificano lo stesso notebook.

Quando si apre un notebook, si passa alla modalità di modifica condivisa per impostazione predefinita e ogni modifica del notebook viene salvata automaticamente. Se i colleghi aprono contemporaneamente lo stesso notebook, vengono visualizzati il profilo, l'output dell'esecuzione, l'indicatore del cursore, l'indicatore di selezione e la traccia della modifica. Usando le funzionalità di collaborazione, è possibile eseguire facilmente la programmazione in coppia, il debug remoto e scenari di tutoring.

Screenshot che mostra una cella di codice con un altro utente che modifica.

Condividere un notebook

La condivisione di un notebook è un modo comodo per collaborare con i membri del team. I ruoli dell'area di lavoro autorizzati possono visualizzare o modificare/eseguire notebook per impostazione predefinita. È possibile condividere un notebook con le autorizzazioni specificate concesse.

  1. Selezionare Condividi sulla barra degli strumenti del notebook.

    Screenshot che mostra dove selezionare Condividi.

  2. Selezionare la categoria corrispondente di persone che possono visualizzare questo notebook. È possibile scegliere le autorizzazioni Condividi, Modifica o Esegui per i destinatari.

    Screenshot che mostra dove selezionare le autorizzazioni.

  3. Dopo aver selezionato Applica, è possibile inviare il notebook direttamente o copiare il collegamento per altri utenti. I destinatari possono quindi aprire il notebook con la visualizzazione corrispondente concessa dal loro livello di autorizzazione.

    Screenshot che mostra dove creare e inviare il collegamento.

  4. Per gestire ulteriormente le autorizzazioni del notebook, selezionare Elenco elementi dell'area di lavoro>Altre opzioni e quindi selezionare Gestisci autorizzazioni. Da questa schermata è possibile aggiornare l'accesso e le autorizzazioni esistenti del notebook.

    Screenshot che mostra dove gestire le autorizzazioni nell'area di lavoro.

Aggiungere un commento a una cella di codice

L’aggiunta di commenti è un'altra funzionalità utile per gli scenari collaborativi. Attualmente Fabric supporta l'aggiunta di commenti a livello di cella.

  1. Selezionare il pulsante Commenti nella barra degli strumenti del notebook per aprire il riquadro Commenti.

    Screenshot che mostra dove selezionare Commenti.

  2. Selezionare il codice nella cella di codice, scegliere Nuovo nel riquadro Commenti, aggiungere commenti e quindi selezionare Pubblica commento per salvare.

    Screenshot che mostra dove selezionare Nuovo.

  3. Se sono necessarie, trovare le opzioni Modifica commento, Risolvi thread ed Elimina thread selezionando l'opzione Altro accanto al commento.

Tagging di altri utenti in un commento

Il "tagging" si riferisce alla menzione e alla notifica di un utente in un thread di commento, migliorando in modo efficiente la collaborazione sulle specifiche.

  1. Selezionare una sezione di codice in una cella e un nuovo thread di commento.

  2. Immettere il nome utente e scegliere quello corretto nell'elenco dei suggerimenti se si vuole menzionare qualcuno per una discussione su una determinata sezione.

  3. Condividere informazioni dettagliate e scegliere Pubblica.

  4. Viene attivata una notifica email e l'utente fa clic sul collegamento Apri commenti per individuare rapidamente questa cella.

  5. Inoltre, autorizzare e configurare le autorizzazioni per gli utenti quando si taggano utenti che non hanno accesso, assicurandosi che gli asset di codice siano gestiti correttamente.

GIF animata di taggare altri in un commento.

Nota

Per un elemento commento, l'utente taggato non riceverà più una notifica tramite posta elettronica se si aggiorna il commento entro un'ora. Verrà inviata invece una notifica tramite posta elettronica al nuovo utente taggato.

Cronologia delle versioni

Nota

Attualmente, la funzionalità è in anteprima.

La cronologia delle versioni consente di gestire facilmente le modifiche del notebook in tempo reale. Supporta il rilevamento della cronologia e la gestione dei notebook con potenti funzionalità di controllo della versione predefinite, particolarmente utili per collaborare con più collaboratori nello stesso notebook.

  1. Accedere alla cronologia della versione dalla barra degli strumenti globale del notebook.

    Screenshot che mostra l'accesso alla cronologia.

  2. Notebook supporta due modi per creare checkpoint.

    • Checkpoint manuale: è possibile creare manualmente una nuova versione per registrare i traguardi di sviluppo, offrendo flessibilità per gestire le versioni del tuo notebook.

      Screenshot che mostra come creare una nuova versione.

    • Checkpoint di sistema: Questi checkpoint vengono creati automaticamente ogni 5 minuti in base all'intervallo di tempo di modifica del Sistema Notebook, assicurando che il lavoro venga salvato e versionato in modo coerente. È possibile trovare i record di modifica di tutti i collaboratori nella cronologia dei checkpoint di sistema. Screenshot che mostra l'elenco dei checkpoint di espansione.

  3. È possibile fare clic su un checkpoint per aprire la visualizzazione diff , evidenzia le differenze di contenuto tra il checkpoint selezionato e la versione dinamica corrente, incluse le differenze tra il contenuto delle celle, l'output della cella e i metadati. La versione di questo checkpoint può essere gestita singolarmente nel menu 'ulteriori opzioni' .

    Screenshot che mostra le differenze di visualizzazione.

  4. Puoi gestire la versione dal menu a discesa del checkpoint; se vuoi mantenere una versione precedente, fai clic su ripristina dal checkpoint e sovrascrivi il notebook corrente, oppure usa salva come copia per clonarlo in un nuovo notebook.

    Screenshot che mostra altre opzioni con il checkpoint.

Nota

  • Limitazione nota: dopo aver fatto clic sul pulsante ripristina e su Torna al notebook, il notebook non sarà recuperato immediatamente dal checkpoint. Apparirà una barra dei messaggi che ti inviterà a visualizzare le modifiche. È necessario fare clic sul pulsante Visualizza modifiche e selezionare l'opzione per mantenere la versione salvata per completare il ripristino. Screenshot che mostra le modifiche della visualizzazione dopo il ripristino.
  • I checkpoint di sistema scadono dopo 1 un anno.

Interruttore modalità notebook

I notebook di Fabric supportano quattro modalità che è possibile cambiare facilmente: modalità sviluppo , modalità di sola esecuzione, modalità di modifica e modalità di visualizzazione . Ogni modalità esegue il mapping a una combinazione di autorizzazioni specifica. Quando si condivide il notebook ad altri membri del team, è possibile concedere autorizzazioni appropriate ai destinatari. Possono visualizzare la migliore modalità notebook disponibile in base ai loro permessi e sono in grado di passare tra le modalità per cui dispongono dei permessi.

Screenshot che mostra dove cambiare la modalità.

  • Modalità di sviluppo: lettura, esecuzione, autorizzazione di scrittura necessaria.
  • Modalità di sola esecuzione: autorizzazione di lettura ed esecuzione necessaria.
  • Modalità di modifica: autorizzazione di lettura e scrittura necessaria.
  • Modalità di visualizzazione: autorizzazione di lettura necessaria.