Share via


Microsoft Fabric-notebooks gebruiken

Het Microsoft Fabric-notebook is een primair code-item voor het ontwikkelen van Apache Spark-taken en machine learning-experimenten. Het is een interactief weboppervlak dat wordt gebruikt door gegevenswetenschappers en data engineers om code te schrijven die profiteert van rijke visualisaties en Markdown-tekst. Data engineers schrijven code voor gegevensopname, gegevensvoorbereiding en gegevenstransformatie. Gegevenswetenschappers gebruiken ook notebooks om machine learning-oplossingen te bouwen, waaronder het maken van experimenten en modellen, het bijhouden van modellen en implementatie.

Met een Fabric-notebook kunt u het volgende doen:

  • Ga aan de slag met nul instelinspanningen.
  • Verken en verwerkt eenvoudig gegevens met intuïtieve ervaring met weinig code.
  • Gegevens beveiligen met ingebouwde bedrijfsbeveiligingsfuncties.
  • Analyseer gegevens in onbewerkte indelingen (CSV, txt, JSON, enzovoort), verwerkte bestandsindelingen (parquet, Delta Lake, enzovoort), met behulp van krachtige Spark-mogelijkheden.
  • Wees productief met verbeterde ontwerpmogelijkheden en ingebouwde gegevensvisualisatie.

In dit artikel wordt beschreven hoe u notebooks gebruikt in data science- en data engineering-ervaringen.

Beveiligingscontext van het uitvoeren van notebook

De uitvoering van een notebook kan worden geactiveerd door drie verschillende manieren in Fabric met volledige flexibiliteit om te voldoen aan verschillende scenario's:

  • Interactieve uitvoering: De gebruiker activeert de uitvoering handmatig via de verschillende UX-vermeldingen of het aanroepen van de REST API. De uitvoering wordt uitgevoerd onder de beveiligingscontext van de huidige gebruiker.
  • Uitvoeren als pijplijnactiviteit: de uitvoering wordt geactiveerd vanuit de Fabric Data Factory-pijplijn. U vindt de detailstappen in de notebookactiviteit. De uitvoering wordt uitgevoerd onder de beveiligingscontext van de eigenaar van de pijplijn.
  • Scheduler: De uitvoering wordt geactiveerd vanuit een scheduler-plan. De uitvoering wordt uitgevoerd onder de beveiligingscontext van de gebruiker die het scheduler-plan instelt/bijwerkt.

Dankzij de flexibiliteit van deze uitvoeringsopties met verschillende beveiligingscontext kunt u voldoen aan verschillende scenario's en vereisten, maar moet u ook op de hoogte zijn van de beveiligingscontext wanneer u uw notebook ontwerpt en ontwikkelt, anders kan dit onverwacht gedrag en zelfs enkele beveiligingsproblemen veroorzaken.

De eerste keer dat een notebook wordt gemaakt, wordt een waarschuwingsbericht weergegeven om u te herinneren aan het risico dat de code wordt uitgevoerd zonder deze te controleren.

Schermopname met de waarschuwing over het uitvoeren van een notebook.

Hier volgen enkele aanbevolen procedures om beveiligingsproblemen te voorkomen:

  • Voordat u het notitieblok handmatig uitvoert, opent u de instelling Notitieblok en controleert u de sectie Details onder het deelvenster Info over de wijzigingsupdate, controleert u of u in orde bent met de meest recente wijziging.
  • Voordat u een notebookactiviteit aan een pijplijn toevoegt, opent u de instelling Notitieblok en controleert u de sectie Details onder het deelvenster Info over de wijzigingsupdate. Controleer of u in orde bent met de meest recente wijziging. Als u niet zeker weet wat de meest recente wijziging is, opent u het notitieblok om de wijziging te controleren voordat u deze toevoegt aan de pijplijn.
  • Voordat u het scheduler-plan bijwerkt, opent u de instelling Notitieblok en controleert u de sectie Details onder het deelvenster Info over de wijzigingsupdate, controleert u of u in orde bent met de meest recente wijziging. Als u niet zeker weet wat de meest recente wijziging is, opent u het notitieblok om de wijziging te controleren voordat u het scheduler-plan bijwerkt.
  • Scheid de werkruimte in een andere fase (dev, test, prod) en beheer de toegang van verschillende fasen om het beveiligingsprobleem te voorkomen. Voeg alleen de gebruiker toe die u vertrouwt aan de prod-fase.

Notitieblokken maken

U kunt een nieuw notitieblok maken of een bestaand notitieblok importeren.

Een nieuwe notebook maken

Net als bij andere standaardprocessen voor het maken van fabricitems kunt u eenvoudig een nieuw notitieblok maken op basis van de startpagina van Fabric Data-engineer ing, de optie Nieuw werkruimte of de hub maken.

Bestaande notebooks importeren

U kunt een of meer bestaande notitieblokken importeren vanaf uw lokale computer met behulp van de vermelding op de werkbalk van de werkruimte. Fabric-notebooks herkennen de standaard Jupyter Notebook .ipynb-bestanden en bronbestanden zoals .py, .scala en .sql en maken nieuwe notebookitems dienovereenkomstig.

Schermopname die laat zien waar u notitieblokopties kunt vinden in het menu Nieuw.

Een notebook exporteren

U kunt uw notitieblok exporteren naar andere standaardindelingen. Synapse-notebook kan worden geëxporteerd naar:

  • Het standaard notebookbestand (.ipynb) dat wordt gebruikt voor Jupyter-notebooks.
  • Een HTML-bestand (.html) dat rechtstreeks vanuit een browser kan worden geopend.
  • Een Python-bestand (.py).
  • Een Latex-bestand (.tex).

Schermopname die laat zien waar u een notitieblok kunt exporteren.

Een notitieblok opslaan

In Fabric wordt een notitieblok standaard automatisch opgeslagen nadat u het hebt geopend en bewerkt; U hoeft zich geen zorgen te maken over het verliezen van codewijzigingen. U kunt een kopie ook gebruiken om een andere kopie in de huidige werkruimte of naar een andere werkruimte te klonen.

Schermopname die laat zien waar een kopie moet worden opgeslagen.

Als u liever handmatig een notitieblok opslaat, kunt u overschakelen naar de optie Handmatig opslaan om een lokale vertakking van uw notitieblokitem te hebben en vervolgens Opslaan of Ctrl+s gebruiken om uw wijzigingen op te slaan.

Schermopname die laat zien waar u handmatig kunt opslaan.

U kunt ook overschakelen naar de modus voor handmatig opslaan door Bewerken -Save options ->Manual te selecteren.> Als u een lokale vertakking van uw notitieblok wilt inschakelen, slaat u deze handmatig op, selecteert u Opslaan of gebruikt u de sneltoets Ctrl+s.

Lakehouses en notebooks verbinden

Fabric-notebooks ondersteunen nu nauwe interacties met lakehouses; u kunt eenvoudig een nieuw of bestaand lakehouse toevoegen vanuit de Lakehouse Explorer.

U kunt naar verschillende lakehouses navigeren in de Lakehouse-verkenner en één lakehouse instellen als de standaardinstelling door deze vast te maken. Uw standaardwaarde wordt vervolgens gekoppeld aan de runtimewerkmap en u kunt lezen of schrijven naar het standaard lakehouse met behulp van een lokaal pad.

Schermopname die laat zien waar een standaard lakehouse moet worden vastgemaakt.

Notitie

U moet de sessie opnieuw starten nadat u een nieuw lakehouse hebt vastgemaakt of de naam van het standaard lakehouse hebt hernoemd.

Een lakehouse toevoegen of verwijderen

Als u het X-pictogram naast de naam van een lakehouse selecteert, wordt dit verwijderd uit het notitiebloktabblad, maar het lakehouse-item bestaat nog steeds in de werkruimte.

Selecteer Lakehouse toevoegen om meer lakehouses toe te voegen aan het notitieblok door een bestaande toe te voegen of door een nieuw lakehouse te maken.

Een Lakehouse-bestand verkennen

De submap en bestanden onder de sectie Tabellen en bestanden van de Lake-weergave worden weergegeven in een inhoudsgebied tussen de lakehouse-lijst en de inhoud van het notitieblok. Selecteer verschillende mappen in de sectie Tabellen en bestanden om het inhoudsgebied te vernieuwen.

Map- en bestandsbewerkingen

Als u met de rechtermuisknop een bestand (.csv, .parquet, .txt, .jpg, .png, enzovoort) selecteert, kunt u de Spark- of Pandas-API gebruiken om de gegevens te laden. Er wordt een nieuwe codecel gegenereerd en ingevoegd onder de focuscel.

U kunt eenvoudig een pad met een andere indeling kopiëren in het geselecteerde bestand of de geselecteerde map en het bijbehorende pad in uw code gebruiken.

Schermopname van het contextmenu van bestanden in Lakehouse.

Notebook-resources

De notebook-resourceverkenner biedt een Unix-achtig bestandssysteem om u te helpen bij het beheren van uw mappen en bestanden. Het biedt een schrijfbare bestandssysteemruimte waar u kleine bestanden kunt opslaan, zoals codemodules, semantische modellen en afbeeldingen. U kunt ze eenvoudig openen met code in het notebook alsof u met uw lokale bestandssysteem werkt.

GIF-animatie van notebookbronnen.

Notitie

  • De maximale resourceopslag voor zowel de ingebouwde map als de omgevingsmap is 500 MB, met één bestandsgrootte tot 100 MB. Ze staan in totaal maximaal 100 bestands-/mapexemplaren toe.
  • Wanneer u notebookutils.notebook.run()deze gebruikt, gebruikt u de notebookutils.nbResPath opdracht voor toegang tot de doelnotebookresource. Het relatieve pad is ingebouwd/ verwijst altijd naar de ingebouwde map van het hoofdnotebook.

Map met ingebouwde resources

De ingebouwde map met resources is een door het systeem vooraf gedefinieerde map voor elk exemplaar van het notebookitem. Dit zijn de belangrijkste mogelijkheden voor de notebook-resources.

  • U kunt algemene bewerkingen gebruiken, zoals maken/verwijderen, uploaden/downloaden, slepen/neerzetten, naam wijzigen, dupliceren en zoeken in de gebruikersinterface.
  • U kunt relatieve paden gebruiken, zoals builtin/YourData.txt voor snelle verkenning. De notebookutils.nbResPath methode helpt u bij het opstellen van het volledige pad.
  • U kunt uw gevalideerde gegevens eenvoudig naar een lakehouse verplaatsen via de optie Schrijven naar lakehouse . Fabric bevat ingesloten uitgebreide codefragmenten voor algemene bestandstypen, zodat u snel aan de slag kunt.
  • Deze resources zijn ook beschikbaar voor gebruik in de run case reference notebook via notebookutils.notebook.run().

Map Omgevingsbronnen

De map Omgevingsresources is een gedeelde opslagplaats die is ontworpen om de samenwerking tussen meerdere notebooks te stroomlijnen.

  • U vindt het tabblad Resources in de omgeving en hebt de volledige bewerkingen om de resourcebestanden hier te beheren. Deze bestanden kunnen worden gedeeld tussen meerdere notitieblokken zodra het notitieblok is gekoppeld aan de huidige omgeving.

    Schermopname die laat zien waar resources in de omgeving moeten worden beheerd.

  • Op de pagina Notitieblok kunt u eenvoudig een tweede hoofdmap vinden onder Resources die zijn overgenomen van de gekoppelde omgeving.

    Schermopname die laat zien waar de map omgevingsbronnen moet worden geopend.

  • U kunt ook dezelfde bestanden/mappen gebruiken als de map Ingebouwde resources.

  • Het pad naar de omgevingsresource wordt automatisch gekoppeld aan het notebookcluster. U kunt het relatieve pad /env gebruiken om toegang te krijgen tot de omgevingsresources.

Bestandseditor

Met de bestandseditor kunt u bestanden rechtstreeks in de resourcemap en omgevingsresourcemap van het notitieblok in notebook weergeven en bewerken. Ondersteunde bestandstypen zijn CSV, TXT, HTML, YML, PY, SQL en meer. Met de bestandseditor kunt u eenvoudig bestanden in het notitieblok openen en wijzigen, het ondersteunt het markeren van trefwoorden en biedt de benodigde taalservice bij het openen en bewerken van codebestanden zoals .py en .sql.

  • U kunt deze functie openen via 'Weergeven en bewerken' in het menu Bestand. Dubbelklik op bestand is een snellere manier.

    Schermopname die laat zien waar u bestanden kunt weergeven en bewerken.

  • Inhoudswijziging in bestandseditor moet handmatig worden opgeslagen door op de knop Opslaan of sneltoets te klikken: Ctrl+S, bestandseditor biedt geen ondersteuning voor automatisch opslaan.

  • Bestandseditor wordt ook beïnvloed door de notebookmodus. U kunt alleen bestanden weergeven, maar u kunt ze niet bewerken als u zich in de notitieblokmodus bevindt zonder bewerkingsmachtigingen.

Notitie

Hier volgen enkele beperkingen voor bestandseditor.

  • De maximale bestandsgrootte is 1 MB.
  • Deze bestandstypen worden niet ondersteund voor weergave en bewerking: .xlsx en PARQUET.

Samenwerken in een notitieblok

Het Fabric-notebook is een gezamenlijk item dat meerdere gebruikers ondersteunt die hetzelfde notitieblok bewerken.

Wanneer u een notitieblok opent, voert u standaard de modus voor co-bewerking in en wordt elke bewerking van het notitieblok automatisch opgeslagen. Als uw collega's hetzelfde notitieblok tegelijk openen, ziet u hun profiel, voert u uitvoer uit, cursorindicator, selectie-indicator en bewerkingstracering. Met behulp van de samenwerkingsfuncties kunt u eenvoudig pairprogrammering, externe foutopsporing en begeleidingsscenario's uitvoeren.

Schermopname van een codecel met een andere gebruiker bewerken.

Een notebook delen

Het delen van een notitieblok is een handige manier om samen te werken met teamleden. Geautoriseerde werkruimterollen kunnen standaard notebooks weergeven of bewerken/uitvoeren. U kunt een notitieblok delen met de opgegeven machtigingen die zijn verleend.

  1. Selecteer Delen op de werkbalk van het notitieblok.

    Schermopname die laat zien waar u Delen kunt selecteren.

  2. Selecteer de bijbehorende categorie personen die dit notitieblok kunnen bekijken. U kunt machtigingen voor delen, bewerken of uitvoeren voor de geadresseerden kiezen.

    Schermopname die laat zien waar machtigingen moeten worden geselecteerd.

  3. Nadat u Toepassen hebt geselecteerd, kunt u het notitieblok rechtstreeks verzenden of de koppeling naar anderen kopiëren. Ontvangers kunnen het notitieblok vervolgens openen met de bijbehorende weergave die is verleend door hun machtigingsniveau.

    Schermopname die laat zien waar u een koppeling maakt en verzendt.

  4. Als u uw notitieblokmachtigingen verder wilt beheren, selecteert u de lijst>Met werkruimte-items meer opties en selecteert u vervolgens Machtigingen beheren. Vanaf dat scherm kunt u de toegang en machtigingen van het bestaande notitieblok bijwerken.

    Schermopname die laat zien waar machtigingen in de werkruimte moeten worden beheerd.

Opmerking toevoegen aan een codecel

Opmerkingen maken is een andere handige functie voor samenwerkingsscenario's. Momenteel ondersteunt Fabric het toevoegen van opmerkingen op celniveau.

  1. Selecteer de knop Opmerkingen op de notitieblokwerkbalk of celopmerkingsindicator om het opmerkingenvenster te openen.

    Schermopname die laat zien waar u Opmerking kunt selecteren.

  2. Selecteer code in de codecel, selecteer Nieuw in het opmerkingenvenster, voeg opmerkingen toe en selecteer vervolgens Opmerking posten om op te slaan.

    Schermopname die laat zien waar u Nieuw moet selecteren.

  3. Als u deze nodig hebt, zoekt u de opties Opmerking bewerken, Thread oplossen en Thread verwijderen door de optie Meer naast uw opmerking te selecteren.

Anderen taggen in een opmerking

'Taggen' verwijst naar het vermelden en melden van een gebruiker in een opmerkingenthread, waardoor de samenwerking efficiënt wordt verbeterd voor de specifieke gegevens.

  1. Selecteer een codesectie in een cel en een nieuwe discussielijn voor opmerkingen.

  2. Voer de gebruikersnaam in en kies de juiste in de lijst met suggesties als u iemand wilt vermelden voor discussie over een bepaalde sectie.

  3. Deel uw inzichten en post ze.

  4. Er wordt een e-mailmelding geactiveerd en de gebruiker klikt op de koppeling Opmerkingen openen om deze cel snel te vinden.

  5. Bovendien autoriseert en configureert u de machtigingen voor gebruikers bij het taggen van iemand die geen toegang heeft, zodat uw codeassets goed worden beheerd.

GIF-animatie van het taggen van anderen in een opmerking.

Notitie

Voor een opmerkingsitem ontvangt de getagde gebruiker geen e-mailmelding meer als u de opmerking binnen één uur bijwerken. Maar er wordt een e-mailmelding verzonden naar de nieuwe getagde gebruiker.

Switcher voor notitieblokmodus

Fabric-notebooks ondersteunen vier modi die u eenvoudig kunt overschakelen: Ontwikkelmodus , Modus Alleen uitvoeren, Modus Bewerken en Weergavemodus . Elke modus wordt toegewezen aan een specifieke machtigingscombinatie. Wanneer u het notitieblok deelt met andere teamleden, kunt u de juiste machtigingen verlenen aan de geadresseerden en zien ze de best beschikbare notitieblokmodus op basis van hun machtiging en kunnen ze schakelen tussen de modus waarvoor ze gemachtigd zijn.

Schermopname die laat zien waar schakelen tussen modi.

  • Ontwikkelmodus: lees-, uitvoer-, schrijfmachtiging nodig.
  • Modus Alleen uitvoeren: lees- en uitvoeringsmachtiging nodig.
  • Bewerkingsmodus: lees-, schrijfmachtiging nodig.
  • Weergavemodus: leesmachtiging nodig.