Verwenden von Microsoft Fabric-Notebooks
Microsoft Fabric-Notebooks sind ein primäres Programmierelement für die Entwicklung von Apache Spark-Aufträgen und Machine Learning-Experimenten. Es handelt sich um eine webbasierte interaktive Oberfläche, die von Data Scientists und Data Engineers verwendet wird, um Code zu schreiben. Dabei profitieren diese von umfangreichen Visualisierungen und Markdown-Text. Technische Fachkräfte für Daten schreiben Code für die Datenerfassung, -aufbereitung und -transformation. Wissenschaftliche Fachkräfte für Daten verwenden Notebooks auch zum Erstellen von Machine Learning-Lösungen (einschließlich der Erstellung von Experimenten und Modellen, der Modellnachverfolgung und der Bereitstellung).
Mit einem Fabric-Notebook können Sie Folgendes tun:
- Ohne Einrichtungsaufwand sofort loslegen
- Einfaches Untersuchen und Verarbeiten von Daten mit intuitiver Low-Code-Umgebung
- Daten mit integrierten Sicherheitsfeatures auf Unternehmensniveau schützen.
- Daten in Rohformaten analysieren (z. B. CSV, TXT und JSON) und Dateiformate (z. B. Parquet und Delta Lake) mithilfe von leistungsstarken Spark-Funktionen verarbeiten
- Produktiv sein mit erweiterten Funktionen zur Dokumenterstellung und integrierter Datenvisualisierung.
In diesem Artikel wird beschrieben, wie Sie Notebooks in Umgebungen für Data Science und Datentechnik verwenden.
Erstellen von Notebooks
Sie können entweder ein neues Notebook erstellen oder ein vorhandenes Notebook importieren.
Erstellen eines neuen Notebooks
Wie bei anderen Standardprozessen zur Erstellung von Fabric-Objekten können Sie ein neues Notebook einfach über die Datentechnik-Startseite von Fabric, die Arbeitsbereichsschaltfläche Neu oder die Option Hub erstellen.
Importieren vorhandener Notebooks
Über die Startseite für Datentechnik oder Data Science können Sie ein oder mehrere vorhandene Notebooks von Ihrem lokalen Computer in einen Fabric-Arbeitsbereich importieren. Fabric-Notebooks können die Jupyter Notebook-Standarddateien (IPYNB) und Quelldateien (z. B. PY, SCALA und SQL) erkennen und entsprechend neue Notebookelemente erstellen.
Exportieren eines Notebooks
Sie können Ihr Notebook in andere Standardformate exportieren. Synapse-Notebooks können in die folgenden Formate exportiert werden:
- Notebookstandarddateien (.ipynb), die normalerweise für Jupyter-Notebooks verwendet werden
- HTML-Dateien (.html), die direkt im Browser geöffnet werden können
- Python-Dateien (.py)
- LaTeX-Dateien (.tex)
Speichern eines Notebooks
In Fabric wird ein Notebook standardmäßig automatisch gespeichert, nachdem Sie es geöffnet und bearbeitet haben. Sie müssen sich keine Sorgen machen, dass Codeänderungen verloren gehen. Sie können auch Kopie speichern verwenden, um eine andere Kopie im aktuellen Arbeitsbereich oder in einen anderen Arbeitsbereich zu klonen.
Wenn Sie ein Notebook lieber manuell speichern möchten, können Sie auch die manuelle Speicheroption verwenden, um einen lokalen Branch Ihres Notebookelements zu erhalten. Mithilfe von Speichern oder STRG+S können Sie Ihre Änderungen speichern.
Über Bearbeiten –>Speicheroptionen –>Manuell können Sie auch zum Modus für manuelles Speichern wechseln. Wenn Sie einen lokalen Branch Ihres Notebooks aktivieren und dann manuell speichern möchten, wählen Sie Speichern aus, oder verwenden Sie die Tastenkombination STRG+S.
Verbinden von Lakehouses und Notebooks
Fabric-Notebooks unterstützen jetzt enge Interaktionen mit Lakehouses: Sie können einfach ein neues oder bestehendes Lakehouse aus dem Lakehouse-Explorer hinzufügen.
Sie können im Lakehouse-Explorer zu verschiedenen Lakehouses navigieren und ein Lakehouse als Standard festlegen, indem Sie es anheften. Ihr Standardlakehouse wird in das Arbeitsverzeichnis der Runtime eingebunden, und Sie können mithilfe eines lokalen Pfads in das Standardlakehouse schreiben oder daraus lesen.
Hinweis
Sie müssen die Sitzung neu starten, nachdem Sie ein neues Lakehouse angeheftet oder das Standardlakehouse umbenannt haben.
Hinzufügen oder Entfernen eines Lakehouse
Wenn Sie auf das X-Symbol neben dem Namen eines Lakehouse klicken, wird es von der Notebook-Registerkarte entfernt, aber das Lakehouse-Element ist weiterhin im Arbeitsbereich vorhanden.
Klicken Sie auf Lakehouse hinzufügen, um dem Notebook weitere Lakehouses hinzuzufügen. Sie können entweder ein vorhandenes Lakehouse hinzufügen oder ein neues Lakehouse erstellen.
Durchsuchen einer Lakehouse-Datei
Der Unterordner und die Dateien in den Abschnitten Tabellen und Ordner der Lake-Ansicht werden in einem Inhaltsbereich zwischen der Lakehouse-Liste und dem Notebookinhalt angezeigt. Wählen Sie in den AbschnittenTabellen und Ordner verschiedene Ordner aus, um den Inhaltsbereich zu aktualisieren.
Ordner- und Dateivorgänge
Wenn Sie eine Datei (.csv, .parquet, .txt, .jpg, .png usw.) mit einem Rechtsklick auswählen, können Sie die Spark- oder Pandas-API zum Laden der Daten verwenden. Eine neue Codezelle wird generiert und unter der Fokuszelle eingefügt.
Sie können einfach einen Pfad mit einem anderen Format der ausgewählten Datei oder des Ordners kopieren und den entsprechenden Pfad in Ihrem Code verwenden.
Notebookressourcen
Der Ressourcen-Explorer für Notebooks stellt ein Unix-ähnliches Dateisystem bereit, mit dem Sie Ihre Ordner und Dateien verwalten können. Das System bietet einen beschreibbaren Dateisystemspeicher, in dem Sie kleine Dateien wie Codemodule, semantische Modelle und Images speichern können. Sie können problemlos mit Code im Notebook darauf zugreifen, so als würden Sie mit Ihrem lokalen Dateisystem arbeiten.
Dieser integrierte Ordner ist ein systemdefinierter Ordner für jede Notebookinstanz. In ihm werden bis zu 500 MB Speicherplatz zum Speichern der Abhängigkeiten des aktuellen Notebooks reserviert. Dies sind die wichtigsten Funktionen von Notebookressourcen:
- Über die Benutzeroberfläche können Sie allgemeine Vorgänge zum Erstellen, Löschen, Hochladen, Herunterladen, Ziehen, Ablegen, Umbenennen, Duplizieren und Suchen verwenden.
- Sie können relative Pfade wie
builtin/YourData.txt
für schnelle Suchvorgänge verwenden. Diemssparkutils.nbResPath
-Methode hilft Ihnen beim Erstellen des vollständigen Pfads. - Sie können Ihre überprüften Daten ganz einfach über die Option In Lakehouse schreiben verschieben. Fabric hat umfangreiche Codeschnipsel für gängige Dateitypen eingebettet, um Ihnen den Einstieg zu erleichtern.
- Diese Ressourcen sind auch für die Verwendung im Fall von Verweisnotebookausführungen über
mssparkutils.notebook.run()
verfügbar.
Hinweis
- Derzeit unterstützt Fabric das Hochladen bestimmter Dateitypen über die Benutzeroberfläche, einschließlich von .py, .whl, .jar, . txt, .json, .yml, .xml, .csv, .html, .png, .jpg, und .xlsx. Sie können über Code in den integrierten Ordner mit Dateitypen schreiben, die nicht in der Liste enthalten sind. Fabric-Notebooks bieten jedoch keine Unterstützung für das Generieren von Codeschnipseln, wenn nicht unterstützte Dateitypen verwendet werden.
- Jede Dateigröße muss kleiner als 50 MB sein, und der integrierte Ordner ermöglicht die Verwaltung von insgesamt bis zu 100 Datei- bzw. Ordnerinstanzen.
- Wenn Sie
mssparkutils.notebook.run()
verwenden, benutzen Sie den Befehlmssparkutils.nbResPath
, um auf die Notebookzielressource zuzugreifen. Der relative Pfad „builtin/“ verweist immer auf den integrierten Ordner des Stammnotebooks.
Zusammenarbeiten in einem Notebook
Das Fabric-Notebook ist ein Element für Zusammenarbeit, das die Bearbeitung desselben Notebooks durch mehrere Benutzer unterstützt.
Wenn Sie ein Notebook öffnen, wechseln Sie standardmäßig in den Bearbeitungsmodus für Zusammenarbeit, und jede Notebookänderung wird automatisch gespeichert. Wenn Ihre Kolleg*innen dasselbe Notebook gleichzeitig öffnen, wird deren Profil, die Ausführungsausgabe, der Cursorindikator, der Auswahlindikator und die Bearbeitungsablaufverfolgung angezeigt. Durch die Nutzung der Zusammenarbeitsfeatures sind Paarprogrammierungs-, Remotedebugging- und Tutorenunterrichtsszenarios problemlos möglich.
Teilen eines Notebooks
Das Freigeben eines Notebooks ist eine bequeme Möglichkeit zum Zusammenarbeiten mit Teammitgliedern. Autorisierte Arbeitsbereichsrollen können Notebooks standardmäßig anzeigen oder bearbeiten/ausführen. Sie können ein Notebook mit bestimmten erteilten Berechtigungen freigeben.
Wählen Sie auf der Notebooksymbolleiste Freigeben aus.
Wählen Sie die entsprechende Kategorie von Personen, die dieses Notizbuch anzeigen können aus. Sie können die Berechtigungen Freigeben, Bearbeiten oder Ausführen für die Empfänger erteilen.
Nachdem Sie Anwenden ausgewählt haben, können Sie das Notebook entweder direkt senden oder den Link für andere Personen kopieren. Empfänger können dann das Notebook mit der entsprechenden Ansicht öffnen, die ihrer Berechtigungsstufe entspricht.
Um Ihre Notebookberechtigungen weiter zu verwalten, wählen Sie Liste der Arbeitselemente>Weitere Optionen und dann Berechtigungen verwalten aus. Auf diesem Bildschirm können Sie den bestehenden Notebookzugriff und die vorhandenen Berechtigungen aktualisieren.
Kommentieren einer Codezelle
Das Kommentieren ist ein weiteres nützliches Feature in Szenarios für Zusammenarbeit. Derzeit unterstützt Fabric das Hinzufügen von Kommentaren auf Zellenebene.
Klicken Sie auf die Schaltfläche Kommentare auf der Notebooksymbolleiste oder in der Zellenkommentaranzeige, um den Bereich Kommentare zu öffnen.
Wählen Sie Code in der Codezelle aus, klicken Sie im Bereich Kommentare auf die Option Neu, fügen Sie Kommentare hinzu, und wählen Sie dann zum Speichern die Option Kommentar veröffentlichen aus.
Wenn Sie sie benötigen, finden Sie die Optionen Kommentar bearbeiten, Thread auflösen und Thread löschen, indem Sie die Option „Mehr“ neben Ihrem Kommentar auswählen.
Wechseln des Notebookmodus
Fabric-Notebooks unterstützen zwei Modi, zwischen denen Sie ganz einfach wechseln können: den Bearbeitungsmodus und den Anzeigemodus.
- Bearbeitungsmodus: Sie können die Zellen bearbeiten und ausführen und mit anderen Personen am Notebook zusammenarbeiten.
- Anzeigemodus: Sie können nur den Zellinhalt, die Ausgabe und die Kommentare des Notebooks anzeigen. Alle Vorgänge, die zu einer Änderung des Notebooks führen können, werden deaktiviert.
Zugehöriger Inhalt
Feedback
https://aka.ms/ContentUserFeedback.
Bald verfügbar: Im Laufe des Jahres 2024 werden wir GitHub-Issues stufenweise als Feedbackmechanismus für Inhalte abbauen und durch ein neues Feedbacksystem ersetzen. Weitere Informationen finden Sie unterFeedback senden und anzeigen für