Freigeben über


Lernprogramm: Abfragen und Visualisieren von Daten aus einem Notizbuch

Dieses Lernprogramm führt Sie durch die Verwendung eines Azure Databricks-Notizbuchs zum Abfragen von Beispieldaten, die im Unity-Katalog mit SQL, Python, Scala und R gespeichert sind, und visualisieren dann die Abfrageergebnisse im Notizbuch.

Anforderungen

Um die Aufgaben in diesem Artikel abzuschließen, müssen die folgenden Anforderungen erfüllt sein:

  • Ihr Arbeitsbereich muss für Unity Catalog aktiviert sein. Informationen zu den ersten Schritten mit Dem Unity-Katalog finden Sie unter "Erste Schritte mit Unity-Katalog".
  • Sie müssen über die Berechtigung verfügen, eine vorhandene Computeressource zu verwenden oder eine neue Computeressource zu erstellen. Siehe Compute oder wenden Sie sich an Ihren Databricks-Administrator.

Schritt 1: Erstellen eines neuen Notebooks

Wenn Sie ein Notebook in Ihrem Arbeitsbereich erstellen möchten, wählen Sie in der Randleiste Neues SymbolNeu aus, und wählen Sie dann Notebook aus. Im Arbeitsbereich wird ein leeres Notebook geöffnet.

Weitere Informationen zum Erstellen und Verwalten von Notebooks finden Sie unter Verwalten von Notebooks.

Schritt 2: Abfragen einer Tabelle

Fragen Sie die Tabelle samples.nyctaxi.trips in Unity Catalog mithilfe Ihrer bevorzugten Sprache ab.

  1. Kopieren Sie den folgenden Code, und fügen Sie ihn in die neue leere Notebookzelle ein. Dieser Code zeigt die Ergebnisse der Abfrage der Tabelle samples.nyctaxi.trips in Unity Catalog an.

    SQL

    SELECT * FROM samples.nyctaxi.trips
    

    Python

    display(spark.read.table("samples.nyctaxi.trips"))
    

    Scala

    display(spark.read.table("samples.nyctaxi.trips"))
    

    R

    library(SparkR)
    display(sql("SELECT * FROM samples.nyctaxi.trips"))
    
  2. Drücken Sie Shift+Enter, um die Zelle auszuführen, und wechseln Sie dann zur nächsten Zelle.

    Die Abfrageergebnisse werden im Notebook angezeigt.

Schritt 3: Anzeigen der Daten

Zeigen Sie den durchschnittlichen Fahrpreis nach Fahrstrecke an, gruppiert nach der Postleitzahl des Startpunkts.

  1. Klicken Sie neben der Registerkarte Tabelle auf + und klicken Sie dann auf Visualisierung.

    Der Visualisierungs-Editor wird angezeigt.

  2. Vergewissern Sie sich, dass in der Dropdownliste VisualisierungstypLeiste ausgewählt ist.

  3. Wählen Sie fare_amount für die X-Spalte aus.

  4. Wählen Sie trip_distance für die Y-Spalte aus.

  5. Wählen Sie Average als Aggregationstyp aus.

  6. Wählen Sie pickup_zip als Gruppieren nach-Spalte aus, nach der gruppiert werden soll.

    Balkendiagramm

  7. Klicken Sie auf Speichern.

Nächste Schritte