Så här använder du Microsoft Fabric-notebook-filer

Microsoft Fabric Notebook är ett primärt kodobjekt för att utveckla Apache Spark-jobb och maskininlärningsexperiment. Det är en webbaserad interaktiv yta som används av dataforskare och datatekniker för att skriva kod som drar nytta av omfattande visualiseringar och Markdown-text. Datatekniker skriver kod för datainmatning, förberedelse av data och datatransformering. Dataexperter använder också notebook-filer för att skapa maskininlärningslösningar, inklusive att skapa experiment och modeller, modellspårning och distribution.

Med en Fabric-anteckningsbok kan du:

  • Kom igång med noll set-up-arbete.
  • Utforska och bearbeta enkelt data med intuitiv lågkodsupplevelse.
  • Skydda data med inbyggda säkerhetsfunktioner för företag.
  • Analysera data i rådataformat (CSV, txt, JSON osv.), bearbetade filformat (parquet, Delta Lake osv.) med hjälp av kraftfulla Spark-funktioner.
  • Var produktiv med förbättrade redigeringsfunktioner och inbyggd datavisualisering.

Den här artikeln beskriver hur du använder notebook-filer i datavetenskap och datateknik.

Skapa notebook-filer

Du kan antingen skapa en ny notebook-fil eller importera en befintlig notebook-fil.

Skapa en ny notebook

Precis som andra standardprocesser för att skapa infrastrukturobjekt kan du enkelt skapa en ny notebook-fil från startsidan för Infrastruktur-Datateknik, alternativet Ny arbetsyta eller Skapa hubb.

Importera befintliga notebook-filer

Du kan importera en eller flera befintliga notebook-filer från din lokala dator till en Infrastruktur-arbetsyta från Datateknik eller startsidan för Datavetenskap. Infrastrukturanteckningsböcker känner igen standardfilerna Jupyter Notebook .ipynb och källfiler som .py, .scala och .sql och skapar nya notebook-objekt i enlighet med detta.

Screenshot showing where to find notebook options on the New menu.

Exportera en notebook-fil

Du kan exportera anteckningsboken till andra standardformat. Synapse Notebook kan exporteras till:

  • Standard notebook-filen (.ipynb) som används för Jupyter Notebooks.
  • En HTML-fil (.html) som kan öppnas direkt från en webbläsare.
  • En Python-fil (.py).
  • En Latex-fil (.tex).

Screenshot showing where to export notebook.

Spara en notebook-fil

I Infrastruktur sparar en notebook-fil som standard automatiskt när du har öppnat och redigerat den. du behöver inte oroa dig för att förlora kodändringar. Du kan också använda Spara en kopia för att klona en annan kopia på den aktuella arbetsytan eller till en annan arbetsyta.

Screenshot showing where to save a copy.

Om du föredrar att spara en notebook-fil manuellt kan du växla till alternativet Manuell spara för att ha en lokal gren av anteckningsboksobjektet och sedan använda Spara eller CTRL+s för att spara ändringarna.

Screenshot showing where to switch manual save.

Du kan också växla till manuellt spara-läge genom att välja Redigera ->Spara alternativ ->Manuell. Om du vill aktivera en lokal gren av anteckningsboken och sedan spara den manuellt väljer du Spara eller använder kortkommandot Ctrl+s.

Anslut sjöhus och anteckningsböcker

Infrastrukturanteckningsböcker stöder nu nära interaktioner med lakehouses. Du kan enkelt lägga till ett nytt eller befintligt sjöhus från Lakehouse Explorer.

Du kan navigera till olika sjöhus i Lakehouse Explorer och ange en lakehouse som standard genom att fästa den. Standardinställningen monteras sedan på arbetskatalogen runtime och du kan läsa eller skriva till standard lakehouse med hjälp av en lokal sökväg.

Screenshot showing where to pin a default lakehouse.

Kommentar

Du måste starta om sessionen när du har fäst ett nytt lakehouse eller bytt namn på standard lakehouse.

Lägga till eller ta bort ett sjöhus

Om du väljer X-ikonen bredvid ett lakehouse-namn tas den bort från anteckningsboksfliken, men lakehouse-objektet finns fortfarande på arbetsytan.

Välj Lägg till lakehouse för att lägga till fler sjöhus i notebook-filen, antingen genom att lägga till en befintlig eller skapa ett nytt sjöhus.

Utforska en lakehouse-fil

Undermappen och filerna under avsnittet Tabeller och filer i vyn Lake visas i ett innehållsområde mellan lakehouse-listan och notebook-innehållet. Välj olika mappar i avsnittet Tabeller och filer för att uppdatera innehållsområdet.

Mapp- och filåtgärder

Om du väljer en fil (.csv, .parquet, .txt, .jpg, .png osv.) med en högerklicka kan du använda Spark- eller Pandas-API:et för att läsa in data. En ny kodcell genereras och infogas under fokuscellen.

Du kan enkelt kopiera en sökväg med ett annat format än den valda filen eller mappen och använda motsvarande sökväg i koden.

Screenshot showing context menu of files in lakehouse.

Notebook-resurser

Notebook-resursutforskaren tillhandahåller ett Unix-liknande filsystem som hjälper dig att hantera dina mappar och filer. Det erbjuder ett skrivbart filsystemutrymme där du kan lagra små filer, till exempel kodmoduler, semantiska modeller och bilder. Du kan enkelt komma åt dem med kod i notebook-filen som om du arbetade med ditt lokala filsystem.

Animated GIF of notebook resources.

Den här inbyggda mappen är en systemdefinierad mapp för varje notebook-instans. Den bevarar upp till 500 MB lagring för att lagra beroenden för den aktuella notebook-filen. Det här är de viktigaste funktionerna i notebook-resurser:

  • Du kan använda vanliga åtgärder som att skapa/ta bort, ladda upp/ladda ned, dra/släppa, byta namn, duplicera och söka i användargränssnittet.
  • Du kan använda relativa sökvägar som builtin/YourData.txt för snabb utforskning. Metoden mssparkutils.nbResPath hjälper dig att skapa den fullständiga sökvägen.
  • Du kan enkelt flytta dina verifierade data till ett sjöhus via alternativet Skriv till lakehouse . Infrastrukturresurser har inbäddade kodfragment för vanliga filtyper som hjälper dig att snabbt komma igång.
  • Dessa resurser är också tillgängliga för användning i referensanteckningsbokens körningsfall via mssparkutils.notebook.run().

Kommentar

  • För närvarande stöder Fabric uppladdning av vissa filtyper via användargränssnittet, inklusive filerna .py, .whl, .jar, .txt, .json, .yml, .xml, .csv, .html, .png, .jpg och .xlsx . Du kan skriva till den inbyggda mappen med filtyper som inte finns i listan via kod, men fabric-notebook-filer har inte stöd för att generera kodfragment på filtyper som inte stöds.
  • Varje filstorlek måste vara mindre än 50 MB och den inbyggda mappen tillåter totalt upp till 100 fil-/mappinstanser.
  • När du använder mssparkutils.notebook.run()använder du mssparkutils.nbResPath kommandot för att komma åt resursen för målanteckningsboken. Den relativa sökvägen "builtin/" pekar alltid på rotanteckningsbokens inbyggda mapp.

Samarbeta i en notebook-fil

Anteckningsboken Fabric är ett samarbetsobjekt som stöder flera användare som redigerar samma notebook-fil.

När du öppnar en notebook-fil anger du samredigeringsläget som standard och varje redigering av notebook-filer sparas automatiskt. Om dina kollegor öppnar samma anteckningsbok samtidigt ser du deras profil, kör utdata, markörindikator, markeringsindikator och redigeringsspårning. Med hjälp av samarbetsfunktionerna kan du enkelt utföra parprogrammering, fjärrfelsökning och handledningsscenarier.

Screenshot showing a code cell with another user editing.

Dela en notebook-fil

Att dela en notebook-fil är ett bekvämt sätt för dig att samarbeta med gruppmedlemmar. Auktoriserade arbetsyteroller kan visa eller redigera/köra notebook-filer som standard. Du kan dela en notebook-fil med angivna behörigheter.

  1. Välj Dela i notebook-verktygsfältet.

    Screenshot showing where to select Share.

  2. Välj motsvarande kategori för personer som kan visa den här notebook-filen. Du kan välja Behörigheter för Dela, Redigera eller Kör för mottagarna.

    Screenshot showing where to select permissions.

  3. När du har valt Använd kan du antingen skicka anteckningsboken direkt eller kopiera länken till andra. Mottagarna kan sedan öppna anteckningsboken med motsvarande vy som beviljats av deras behörighetsnivå.

    Screenshot showing where to create and send link.

  4. Om du vill hantera dina notebook-behörigheter ytterligare väljer du Lista över>arbetsyteobjekt Fler alternativ och sedan Hantera behörigheter. Från den skärmen kan du uppdatera den befintliga åtkomsten och behörigheterna för notebook-filer.

    Screenshot showing where to manage permissions in workspace.

Kommentera en kodcell

Kommentarer är en annan användbar funktion för samarbetsscenarier. För närvarande har Fabric stöd för att lägga till kommentarer på cellnivå.

  1. Välj knappen Kommentarer i anteckningsbokens verktygsfält eller cellkommenterarindikator för att öppna fönstret Kommentarer.

    Screenshot showing where to select Comment.

  2. Välj kod i kodcellen, välj Nytt i fönstret Kommentarer , lägg till kommentarer och välj sedan Publicera kommentar för att spara.

    Screenshot showing where to select New.

  3. Om du behöver dem hittar du alternativen Redigera kommentar, Lös tråd och Ta bort tråd genom att välja alternativet Mer bredvid din kommentar.

Växla notebook-läge

Notebook-filer för infrastrukturresurser stöder två lägen som du enkelt kan växla mellan: Redigeringsläge och Visningsläge .

Screenshot showing where switch modes.

  • Redigeringsläge: Du kan redigera och köra cellerna och samarbeta med andra i anteckningsboken.
  • Visningsläge: Du kan bara visa cellinnehåll, utdata och kommentarer i anteckningsboken. Alla åtgärder som gör ändringar i notebook-filen är inaktiverade.