Visualisierungen in Databricks-Notebooks

Azure Databricks bietet integrierte Unterstützung für Diagramme und Visualisierungen sowohl in Databricks SQL als auch in Notebooks. Auf dieser Seite wird beschrieben, wie Sie mit Visualisierungen in einem Databricks-Notebook arbeiten. Informationen zur Verwendung von Visualisierungen in Databricks SQL finden Sie unter Visualisierungen in Databricks SQL.

Informationen zum Anzeigen der Visualisierungstypen finden Sie unter Visualisierungstypen.

Wichtig

Informationen zu einer Vorschauversion von Azure Databricks-Diagrammen finden Sie unter Vorschaudiagrammvisualisierungen.

Erstellen einer neuen Visualisierung

Verwenden Sie den folgenden Code, um das Beispiel in diesem Abschnitt nachzustellen:

sparkDF = spark.read.csv("/databricks-datasets/bikeSharing/data-001/day.csv", header="true", inferSchema="true")
display(sparkDF)

Klicken Sie zum Erstellen einer Visualisierung über einem Ergebnis auf + und wählen Sie Visualisierung aus. Der Visualisierungs-Editor wird angezeigt.

Neues Visualisierungsmenü

  1. Wählen Sie in der Dropdownliste Visualisierungstyp einen Typ aus.

    Editor für Visualisierung

  2. Wählen Sie die Daten aus, die in der Visualisierung angezeigt werden sollen. Die verfügbaren Felder hängen vom ausgewählten Typ ab.

  3. Klicken Sie auf Speichern.

Visualisierungstools

Wenn Sie mit der Maus auf die obere rechte Ecke eines Diagramms im Visualisierungs-Editor zeigen, wird eine Plotly-Symbolleiste angezeigt, über die Sie Vorgänge wie Auswählen, Vergrößern und Schwenken ausführen können.

Symbolleiste des Editors zur Notebookvisualisierung

Wenn Sie auf die obere rechte Seite eines Diagramms außerhalb des Visualisierungs-Editors zeigen, wird eine kleinere Teilmenge von Tools angezeigt:

Symbolleiste von Notebookdiagrammen

Erstellen eines neuen Datenprofils

Hinweis

Verfügbar in Databricks Runtime 9.1 LTS und höheren Versionen.

Datenprofile zeigen Zusammenfassungsstatistiken eines Apache Spark-DataFrame, eines Pandas-DataFrame oder einer SQL-Tabelle im Tabellen- und Grafikformat an. Um ein Datenprofil aus einer Ergebniszelle zu erstellen, klicken Sie auf + und wählen Sie Datenprofil.

Azure Databricks berechnet und zeigt die Zusammenfassungsstatistiken an.

Datenprofil

  • Numerische und kategorische Features werden in separaten Tabellen angezeigt.
  • Oben auf der Registerkarte können Sie nach Features sortieren oder suchen.
  • Oben in der Diagrammspalte können Sie ein Histogramm (Standard) oder Quantile anzeigen.
  • Aktivieren Sie das Kontrollkästchen Erweitern, um die Diagramme zu vergrößern.
  • Aktivieren Sie das Kontrollkästchen Protokoll, um die Diagramme auf einer Protokollskala anzuzeigen.
  • Sie können den Cursor über die Diagramme bewegen, um ausführlichere Informationen zu erhalten, z. B. die Grenzen einer Histogrammspalte und die Anzahl der darin enthaltenen Zeilen oder den Quantilwert.

Sie können Datenprofile auch programmgesteuert generieren. Informationen dazu finden Sie unter dem summarize-Befehl (dbutils.data.summarize).

Arbeiten mit Visualisierungen und Datenprofilen

Hinweis

Datenprofile sind in Databricks Runtime 9.1 LTS und höher verfügbar.

Umbenennen, Duplizieren oder Entfernen einer Visualisierung oder eines Datenprofils

Um eine Visualisierung oder ein Datenprofil umzubenennen, zu duplizieren oder zu entfernen, klicken Sie auf den nach unten zeigenden Pfeil rechts neben dem Namen der Registerkarte.

Dropdownmenü in der Notebookvisualisierung

Sie können den Namen auch ändern, indem Sie direkt darauf klicken und den Namen bearbeiten.

Bearbeiten einer Visualisierung

Klicken Sie unter der Visualisierung auf Die Schaltfläche „Edit visualization“ (Visualisierung bearbeiten), um den Visualisierungs-Editor zu öffnen. Wenn Sie die Änderungen vorgenommen haben, klicken Sie auf Speichern.

Bearbeiten von Farben

Sie können die Farben einer Visualisierung anpassen, wenn Sie die Visualisierung erstellen oder bearbeiten.

  1. Erstellen oder bearbeiten Sie eine Visualisierung.
  2. Klicken Sie auf Farben.
  3. Klicken Sie zum Ändern einer Farbe auf das Quadrat, und wählen Sie die neue Farbe aus, indem Sie eine der folgenden Aktionen ausführen:
    • Klicken Sie in der Farbauswahl auf die gewünschte Farbe.
    • Geben Sie einen Hexadezimalwert ein.
  4. Klicken Sie auf eine beliebige Stelle außerhalb der Farbauswahl, um sie zu schließen und Änderungen zu speichern.

Vorübergehendes Ausblenden oder Anzeigen einer Serie

Um eine Reihe in einer Visualisierung auszublenden, klicken Sie in der Legende auf die Reihe. Wenn Sie die Reihe erneut anzeigen möchten, klicken Sie in der Legende erneut darauf.

Um nur eine einzelne Reihe anzuzeigen, doppelklicken Sie in der Legende auf die Reihe. Wenn Sie andere Reihen anzeigen möchten, klicken Sie auf jede Reihe.

Herunterladen einer Visualisierung

Klicken Sie auf das Kamerasymbol Kamerasymbol in der Notebookzelle oder dem Visualisierungs-Editor, um eine Visualisierung im PNG-Format herunterzuladen.

  • In einer Ergebniszelle erscheint das Kamerasymbol oben rechts, wenn Sie den Cursor über die Zelle bewegen.

    Kamerasymbol in der Notebookzelle

  • Im Visualisierungs-Editor wird das Kamerasymbol angezeigt, wenn Sie mit dem Mauszeiger auf das Diagramm zeigen. Weitere Informationen finden Sie unter Visualisierungstools.

Hinzufügen einer Visualisierung oder eines Datenprofils zu einem Dashboard

  1. Klicken Sie auf den nach unten zeigenden Pfeil rechts neben dem Namen der Registerkarte.
  2. Wählen Sie Zum Dashboard hinzufügen aus. Eine Liste der verfügbaren Dashboardansichten wird zusammen mit der Menüoption Add to new dashboard (Zum neuen Dashboard hinzufügen) angezeigt.
  3. Wählen Sie ein Dashboard oder Add to new dashboard aus. Das Dashboard wird angezeigt, einschließlich der neu hinzugefügten Visualisierung oder des Datenprofils.