Notebookausgaben und -ergebnisse

Nachdem Sie ein Notebook an einen Cluster angefügt und mindestens eine Zelle ausgeführt haben, weist das Notebook einen Status auf und zeigt Ergebnisse an. In diesem Abschnitt wird beschrieben, wie Sie den Status und die Ausgaben von Notebooks verwalten.

Löschen des Status und der Ausgaben von Notebooks

Um den Status und die Ausgaben von Notebooks zu löschen, wählen Sie unten im Menü Ausführen eine der Optionen zum Löschen aus.

Menüoption BESCHREIBUNG
Alle Zellenausgaben löschen Löscht die Zellenausgaben. Dies ist nützlich, wenn Sie das Notebook freigeben und keine Ergebnisse einschließen möchten.
Status löschen Löscht den Notebookstatus, einschließlich Funktions- und Variablendefinitionen, Daten und importierten Bibliotheken.
Löschen des Status und der Ausgaben Löscht sowohl Zellenausgaben als auch den Notebookstatus.
Status löschen und alle ausführen Löscht den Notebookstatus und startet eine neue Ausführung.

Ergebnisse anzeigen

Wenn eine Zelle ausgeführt wird, werden in Tabellenergebnisse maximal 10.000 Zeilen oder 2 MB zurückgegeben, je nachdem, welcher Wert kleiner ist.

Standardmäßig geben Textergebnisse maximal 50.000 Zeichen zurück. Mit Databricks Runtime 12.2 LTS und höher können Sie diesen Grenzwert erhöhen, indem Sie die Spark-Konfigurationseigenschaft spark.databricks.driver.maxReplOutputLength festlegen.

Natives Erkunden von SQL-Zellergebnissen in Python-Notebooks mithilfe von Python

Sie können Daten mithilfe von SQL laden und mit Python erkunden. In einem Databricks-Python-Notebook werden Tabellenergebnisse aus einer SQL-Sprachzelle automatisch als Python-DataFrame verfügbar gemacht. Weitere Informationen finden Sie unter Erkunden von SQL-Zellenergebnissen in Python-Notebooks.

Neue Zellen in Ergebnistabelle

Wichtig

Dieses Feature befindet sich in der Public Preview.

Sie können jetzt das Rendering für die Ergebnistabelle mit neuen Zellen auswählen. Mit der neuen Ergebnistabelle können Sie folgende Aktionen ausführen:

  • Kopieren Sie eine Spalte oder eine andere Teilmenge von tabellarischen Ergebnissen in die Zwischenablage.
  • Führen Sie eine Textsuche über die Ergebnistabelle aus.
  • Daten sortieren und filtern
  • Navigieren Sie mithilfe der Pfeiltasten auf der Tastatur zwischen Tabellenzellen.
  • Wählen Sie einen Teil eines Spaltennamens oder Zellwerts aus, indem Sie auf den gewünschten Text doppelklicken und ziehen.

Um die neue Ergebnistabelle zu aktivieren, wählen Sie in der rechten oberen Ecke der Zellergebnisse Neue Ergebnistabelle aus und ändern Umschaltfläche von AUS in EIN.

Selektor für neue Ergebnisanzeige

Wenn das Feature aktiviert ist, können Sie Spalten- oder Zeilenüberschriften zu markieren, um ganze Spalten oder Zeilen auszuwählen, und Sie können die linke obere Zelle der Tabelle auswählen, um die gesamte Tabelle zu markieren. Sie können den Cursor über eine beliebige rechteckige Zellgruppe ziehen, um sie auszuwählen.

Um die ausgewählten Daten in die Zwischenablage zu kopieren, drücken Sie Cmd + c unter macOS oder Ctrl + c unter Windows, oder klicken Sie mit der rechten Maustaste, und wählen Sie im Dropdownmenü Kopieren aus.

Um in der Ergebnistabelle Text zu suchen, geben Sie den Text in das Suchfeld ein. Übereinstimmende Zellen werden hervorgehoben.

Zum Öffnen eines Seitenbereichs mit Informationen zur Auswahl wählen Sie in der rechten oberen Ecke neben dem Suchfeld das Bereichssymbol Panelsymbol aus.

Position des Panelsymbols

Spaltenüberschriften geben den Datentyp der Spalte an. So gibt Indikator für Spalte mit Ganzzahltyp z. B. den Datentyp „Integer“ an. Zeigen Sie mit dem Cursor auf den Indikator, um den Datentyp anzuzeigen.

Sortieren und Filtern von Ergebnissen

Wenn Sie das Rendern der neuen Ergebnistabelle für Zellen verwenden, können Sie Ergebnisse sortieren und filtern.

Um die Tabelle in einer Spalte nach Wert zu sortieren, zeigen Sie mit Ihrem Mauszeiger auf den Spaltennamen. Rechts neben der Zelle, die den Spaltennamen enthält, wird ein Symbol angezeigt. Klicken Sie auf den Pfeil, um die Spalte zu sortieren. Wenn Sie durchgängig Klicken, wechseln Sie durch die Sortierung in aufsteigender Reihenfolge, absteigender Reihenfolge oder zufällig.

So sortieren Sie eine Spalte

Um nach mehreren Spalten zu sortieren, halten Sie die UMSCHALTTASTE gedrückt, während Sie auf den Sortierpfeil für die Spalten klicken.

Um einen Filter zu erstellen, klicken Sie oben rechts neben den Zellergebnissen auf Filtersymbol. Wählen Sie im daraufhin angezeigten Dialogfeld die zu filternde Spalte und die anzuwendende Filterregel und den anzuwendenden Wert aus. Zum Beispiel:

Filterbeispiel

Um einen weiteren Filter hinzuzufügen, klicken Sie auf Schaltfläche „Filter hinzufügen“.

Um einen Filter vorübergehend zu aktivieren oder zu deaktivieren, verschieben Sie im Dialogfeld die Umschaltfläche Aktiviert/Deaktiviert. Um einen Filter zu löschen, klicken Sie auf das X neben dem Filternamen Löschen eines Filters über X.

Um nach einem bestimmten Wert zu filtern, klicken Sie mit der rechten Maustaste auf eine Zelle mit diesem Wert, und wählen Sie im Dropdownmenü Nach diesem Wert filtern aus.

Spezifischer Wert

Sie können auch einen Filter aus dem Dropdownmenü im Spaltennamen erstellen:

Dropdownmenü filtern

Filter werden nur auf die Ergebnisse angewendet, die in der Ergebnistabelle angezeigt werden. Wenn die zurückgegebenen Daten abgeschnitten werden (z. B. wenn eine Abfrage mehr als 64.000 Zeilen zurückgibt), wird der Filter nur auf die zurückgegebenen Zeilen angewendet.

Herunterladen von Ergebnissen

Das Herunterladen von Ergebnissen ist standardmäßig aktiviert. Informationen zum Umschalten dieser Einstellung finden Sie unter Verwalten der Möglichkeit zum Herunterladen von Ergebnissen aus Notebooks.

Sie können ein Zellenergebnis mit tabellarischer Ausgabe auf Ihren lokalen Computer herunterladen. Klicken Sie auf den nach unten zeigenden Pfeil neben dem Registerkartentitel. Die Menüoptionen hängen von der Anzahl der Zeilen im Ergebnis und der Databricks Runtime-Version ab. Heruntergeladene Ergebnisse werden auf Ihrem lokalen Computer als CSV-Datei mit dem Namen gespeichert export.csv.

Herunterladen von Zellergebnissen

Anzeigen mehrerer Ausgaben pro Zelle

Python-Notebooks und %python-Zellen in Nicht-Python-Notebooks unterstützen mehrere Ausgaben pro Zelle. Die Ausgabe des folgenden Codes enthält beispielsweise sowohl die Grafik als auch die Tabelle:

import pandas as pd
from sklearn.datasets import load_iris

data = load_iris()
iris = pd.DataFrame(data=data.data, columns=data.feature_names)
ax = iris.plot()
print("plot")
display(ax)
print("data")
display(iris)

Committen von Notebookausgaben in Databricks Git-Ordnern

Weitere Informationen zum Committen der Ausgaben von IPYNB-Notebooks finden Sie unter Zulassen des Commits für die Ausgabe von IPYNB-Notebooks.

  • Das Notebook muss eine IPYNB-Datei sein.
  • Die Administratoreinstellungen des Arbeitsbereichs müssen das Committen von Notebookausgaben zulassen.