Verwenden von Microsoft Fabric-Notebooks

Microsoft Fabric-Notebooks sind ein primäres Programmierelement für die Entwicklung von Apache Spark-Aufträgen und Machine Learning-Experimenten. Es handelt sich um eine webbasierte interaktive Oberfläche, die von Data Scientists und Data Engineers verwendet wird, um Code zu schreiben. Dabei profitieren diese von umfangreichen Visualisierungen und Markdown-Text. Technische Fachkräfte für Daten schreiben Code für die Datenerfassung, -aufbereitung und -transformation. Wissenschaftliche Fachkräfte für Daten verwenden Notebooks auch zum Erstellen von Machine Learning-Lösungen (einschließlich der Erstellung von Experimenten und Modellen, der Modellnachverfolgung und der Bereitstellung).

Mit einem Fabric-Notebook können Sie Folgendes tun:

  • Ohne Einrichtungsaufwand sofort loslegen
  • Einfaches Untersuchen und Verarbeiten von Daten mit intuitiver Low-Code-Umgebung
  • Daten mit integrierten Sicherheitsfeatures auf Unternehmensniveau schützen.
  • Daten in Rohformaten analysieren (z. B. CSV, TXT und JSON) und Dateiformate (z. B. Parquet und Delta Lake) mithilfe von leistungsstarken Spark-Funktionen verarbeiten
  • Produktiv sein mit erweiterten Funktionen zur Dokumenterstellung und integrierter Datenvisualisierung.

In diesem Artikel wird beschrieben, wie Sie Notebooks in Umgebungen für Data Science und Datentechnik verwenden.

Erstellen von Notebooks

Sie können entweder ein neues Notebook erstellen oder ein vorhandenes Notebook importieren.

Erstellen eines neuen Notebooks

Wie bei anderen Standardprozessen zur Erstellung von Fabric-Objekten können Sie ein neues Notebook einfach über die Datentechnik-Startseite von Fabric, die Arbeitsbereichsschaltfläche Neu oder die Option Hub erstellen.

Importieren vorhandener Notebooks

Über die Startseite für Datentechnik oder Data Science können Sie ein oder mehrere vorhandene Notebooks von Ihrem lokalen Computer in einen Fabric-Arbeitsbereich importieren. Fabric-Notebooks können die Jupyter Notebook-Standarddateien (IPYNB) und Quelldateien (z. B. PY, SCALA und SQL) erkennen und entsprechend neue Notebookelemente erstellen.

Screenshot showing where to find notebook options on the New menu.

Exportieren eines Notebooks

Sie können Ihr Notebook in andere Standardformate exportieren. Synapse-Notebooks können in die folgenden Formate exportiert werden:

  • Notebookstandarddateien (.ipynb), die normalerweise für Jupyter-Notebooks verwendet werden
  • HTML-Dateien (.html), die direkt im Browser geöffnet werden können
  • Python-Dateien (.py)
  • LaTeX-Dateien (.tex)

Screenshot showing where to export notebook.

Speichern eines Notebooks

In Fabric wird ein Notebook standardmäßig automatisch gespeichert, nachdem Sie es geöffnet und bearbeitet haben. Sie müssen sich keine Sorgen machen, dass Codeänderungen verloren gehen. Sie können auch Kopie speichern verwenden, um eine andere Kopie im aktuellen Arbeitsbereich oder in einen anderen Arbeitsbereich zu klonen.

Screenshot showing where to save a copy.

Wenn Sie ein Notebook lieber manuell speichern möchten, können Sie auch die manuelle Speicheroption verwenden, um einen lokalen Branch Ihres Notebookelements zu erhalten. Mithilfe von Speichern oder STRG+S können Sie Ihre Änderungen speichern.

Screenshot showing where to switch manual save.

Über Bearbeiten –>Speicheroptionen –>Manuell können Sie auch zum Modus für manuelles Speichern wechseln. Wenn Sie einen lokalen Branch Ihres Notebooks aktivieren und dann manuell speichern möchten, wählen Sie Speichern aus, oder verwenden Sie die Tastenkombination STRG+S.

Verbinden von Lakehouses und Notebooks

Fabric-Notebooks unterstützen jetzt enge Interaktionen mit Lakehouses: Sie können einfach ein neues oder bestehendes Lakehouse aus dem Lakehouse-Explorer hinzufügen.

Sie können im Lakehouse-Explorer zu verschiedenen Lakehouses navigieren und ein Lakehouse als Standard festlegen, indem Sie es anheften. Ihr Standardlakehouse wird in das Arbeitsverzeichnis der Runtime eingebunden, und Sie können mithilfe eines lokalen Pfads in das Standardlakehouse schreiben oder daraus lesen.

Screenshot showing where to pin a default lakehouse.

Hinweis

Sie müssen die Sitzung neu starten, nachdem Sie ein neues Lakehouse angeheftet oder das Standardlakehouse umbenannt haben.

Hinzufügen oder Entfernen eines Lakehouse

Wenn Sie auf das X-Symbol neben dem Namen eines Lakehouse klicken, wird es von der Notebook-Registerkarte entfernt, aber das Lakehouse-Element ist weiterhin im Arbeitsbereich vorhanden.

Klicken Sie auf Lakehouse hinzufügen, um dem Notebook weitere Lakehouses hinzuzufügen. Sie können entweder ein vorhandenes Lakehouse hinzufügen oder ein neues Lakehouse erstellen.

Durchsuchen einer Lakehouse-Datei

Der Unterordner und die Dateien in den Abschnitten Tabellen und Ordner der Lake-Ansicht werden in einem Inhaltsbereich zwischen der Lakehouse-Liste und dem Notebookinhalt angezeigt. Wählen Sie in den AbschnittenTabellen und Ordner verschiedene Ordner aus, um den Inhaltsbereich zu aktualisieren.

Ordner- und Dateivorgänge

Wenn Sie eine Datei (.csv, .parquet, .txt, .jpg, .png usw.) mit einem Rechtsklick auswählen, können Sie die Spark- oder Pandas-API zum Laden der Daten verwenden. Eine neue Codezelle wird generiert und unter der Fokuszelle eingefügt.

Sie können einfach einen Pfad mit einem anderen Format der ausgewählten Datei oder des Ordners kopieren und den entsprechenden Pfad in Ihrem Code verwenden.

Screenshot showing context menu of files in lakehouse.

Notebookressourcen

Der Ressourcen-Explorer für Notebooks stellt ein Unix-ähnliches Dateisystem bereit, mit dem Sie Ihre Ordner und Dateien verwalten können. Das System bietet einen beschreibbaren Dateisystemspeicher, in dem Sie kleine Dateien wie Codemodule, semantische Modelle und Images speichern können. Sie können problemlos mit Code im Notebook darauf zugreifen, so als würden Sie mit Ihrem lokalen Dateisystem arbeiten.

Animated GIF of notebook resources.

Dieser integrierte Ordner ist ein systemdefinierter Ordner für jede Notebookinstanz. In ihm werden bis zu 500 MB Speicherplatz zum Speichern der Abhängigkeiten des aktuellen Notebooks reserviert. Dies sind die wichtigsten Funktionen von Notebookressourcen:

  • Über die Benutzeroberfläche können Sie allgemeine Vorgänge zum Erstellen, Löschen, Hochladen, Herunterladen, Ziehen, Ablegen, Umbenennen, Duplizieren und Suchen verwenden.
  • Sie können relative Pfade wie builtin/YourData.txt für schnelle Suchvorgänge verwenden. Die mssparkutils.nbResPath-Methode hilft Ihnen beim Erstellen des vollständigen Pfads.
  • Sie können Ihre überprüften Daten ganz einfach über die Option In Lakehouse schreiben verschieben. Fabric hat umfangreiche Codeschnipsel für gängige Dateitypen eingebettet, um Ihnen den Einstieg zu erleichtern.
  • Diese Ressourcen sind auch für die Verwendung im Fall von Verweisnotebookausführungen über mssparkutils.notebook.run() verfügbar.

Hinweis

  • Derzeit unterstützt Fabric das Hochladen bestimmter Dateitypen über die Benutzeroberfläche, einschließlich von .py, .whl, .jar, . txt, .json, .yml, .xml, .csv, .html, .png, .jpg, und .xlsx. Sie können über Code in den integrierten Ordner mit Dateitypen schreiben, die nicht in der Liste enthalten sind. Fabric-Notebooks bieten jedoch keine Unterstützung für das Generieren von Codeschnipseln, wenn nicht unterstützte Dateitypen verwendet werden.
  • Jede Dateigröße muss kleiner als 50 MB sein, und der integrierte Ordner ermöglicht die Verwaltung von insgesamt bis zu 100 Datei- bzw. Ordnerinstanzen.
  • Wenn Sie mssparkutils.notebook.run() verwenden, benutzen Sie den Befehl mssparkutils.nbResPath, um auf die Notebookzielressource zuzugreifen. Der relative Pfad „builtin/“ verweist immer auf den integrierten Ordner des Stammnotebooks.

Zusammenarbeiten in einem Notebook

Das Fabric-Notebook ist ein Element für Zusammenarbeit, das die Bearbeitung desselben Notebooks durch mehrere Benutzer unterstützt.

Wenn Sie ein Notebook öffnen, wechseln Sie standardmäßig in den Bearbeitungsmodus für Zusammenarbeit, und jede Notebookänderung wird automatisch gespeichert. Wenn Ihre Kolleg*innen dasselbe Notebook gleichzeitig öffnen, wird deren Profil, die Ausführungsausgabe, der Cursorindikator, der Auswahlindikator und die Bearbeitungsablaufverfolgung angezeigt. Durch die Nutzung der Zusammenarbeitsfeatures sind Paarprogrammierungs-, Remotedebugging- und Tutorenunterrichtsszenarios problemlos möglich.

Screenshot showing a code cell with another user editing.

Teilen eines Notebooks

Das Freigeben eines Notebooks ist eine bequeme Möglichkeit zum Zusammenarbeiten mit Teammitgliedern. Autorisierte Arbeitsbereichsrollen können Notebooks standardmäßig anzeigen oder bearbeiten/ausführen. Sie können ein Notebook mit bestimmten erteilten Berechtigungen freigeben.

  1. Wählen Sie auf der Notebooksymbolleiste Freigeben aus.

    Screenshot showing where to select Share.

  2. Wählen Sie die entsprechende Kategorie von Personen, die dieses Notizbuch anzeigen können aus. Sie können die Berechtigungen Freigeben, Bearbeiten oder Ausführen für die Empfänger erteilen.

    Screenshot showing where to select permissions.

  3. Nachdem Sie Anwenden ausgewählt haben, können Sie das Notebook entweder direkt senden oder den Link für andere Personen kopieren. Empfänger können dann das Notebook mit der entsprechenden Ansicht öffnen, die ihrer Berechtigungsstufe entspricht.

    Screenshot showing where to create and send link.

  4. Um Ihre Notebookberechtigungen weiter zu verwalten, wählen Sie Liste der Arbeitselemente>Weitere Optionen und dann Berechtigungen verwalten aus. Auf diesem Bildschirm können Sie den bestehenden Notebookzugriff und die vorhandenen Berechtigungen aktualisieren.

    Screenshot showing where to manage permissions in workspace.

Kommentieren einer Codezelle

Das Kommentieren ist ein weiteres nützliches Feature in Szenarios für Zusammenarbeit. Derzeit unterstützt Fabric das Hinzufügen von Kommentaren auf Zellenebene.

  1. Klicken Sie auf die Schaltfläche Kommentare auf der Notebooksymbolleiste oder in der Zellenkommentaranzeige, um den Bereich Kommentare zu öffnen.

    Screenshot showing where to select Comment.

  2. Wählen Sie Code in der Codezelle aus, klicken Sie im Bereich Kommentare auf die Option Neu, fügen Sie Kommentare hinzu, und wählen Sie dann zum Speichern die Option Kommentar veröffentlichen aus.

    Screenshot showing where to select New.

  3. Wenn Sie sie benötigen, finden Sie die Optionen Kommentar bearbeiten, Thread auflösen und Thread löschen, indem Sie die Option „Mehr“ neben Ihrem Kommentar auswählen.

Wechseln des Notebookmodus

Fabric-Notebooks unterstützen zwei Modi, zwischen denen Sie ganz einfach wechseln können: den Bearbeitungsmodus und den Anzeigemodus.

Screenshot showing where switch modes.

  • Bearbeitungsmodus: Sie können die Zellen bearbeiten und ausführen und mit anderen Personen am Notebook zusammenarbeiten.
  • Anzeigemodus: Sie können nur den Zellinhalt, die Ausgabe und die Kommentare des Notebooks anzeigen. Alle Vorgänge, die zu einer Änderung des Notebooks führen können, werden deaktiviert.