Delen via


Aan de slag: Gegevens opvragen en visualiseren vanuit een notebook

In dit aan de slag-artikel wordt u begeleid bij het gebruik van een Azure Databricks-notebook om een query uit te voeren op voorbeeldgegevens die zijn opgeslagen in Unity Catalog met behulp van SQL, Python, Scala en R en vervolgens de queryresultaten in het notebook te visualiseren.

Vereisten

Als u de taken in dit artikel wilt uitvoeren, moet u voldoen aan de volgende vereisten:

  • Voor uw werkruimte moet Unity Catalog zijn ingeschakeld. Zie Unity Catalog instellen en beheren voor meer informatie over hoe u aan de slag gaat met Unity Catalog.
  • U moet gemachtigd zijn om een bestaande rekenresource te gebruiken of een nieuwe rekenresource te maken. Zie Aan de slag: Account en werkruimte instellen of uw Databricks-beheerder zien.

Stap 1: Een nieuw notitieblok maken

Als u een notitieblok in uw werkruimte wilt maken, klikt u op Nieuw pictogram Nieuw in de zijbalk en vervolgens op Notitieblok. Er wordt een leeg notitieblok geopend in de werkruimte.

Zie Notitieblokken beheren voor meer informatie over het maken en beheren van notitieblokken.

Stap 2: Een query uitvoeren op een tabel

Voer een query uit op de samples.nyctaxi.trips tabel in Unity Catalog met behulp van de taal van uw keuze.

  1. Kopieer en plak de volgende code in de nieuwe lege notebookcel. Met deze code worden de resultaten weergegeven van het opvragen van de samples.nyctaxi.trips tabel in Unity Catalog.

    SQL

    SELECT * FROM samples.nyctaxi.trips
    

    Python

    display(spark.read.table("samples.nyctaxi.trips"))
    

    Scala

    display(spark.read.table("samples.nyctaxi.trips"))
    

    R

    library(SparkR)
    display(sql("SELECT * FROM samples.nyctaxi.trips"))
    
  2. Druk Shift+Enter om de cel uit te voeren en naar de volgende cel te gaan.

    De queryresultaten worden weergegeven in het notebook.

Stap 3: de gegevens weergeven

Geef het gemiddelde tarief op reisafstand weer, gegroepeerd op de postcode voor ophalen.

  1. Klik naast het tabblad Tabel op + Visualisatie en klik vervolgens op Visualisatie.

    De visualisatie-editor wordt weergegeven.

  2. Controleer in de vervolgkeuzelijst Visualisatietype of Balk is geselecteerd.

  3. Selecteer fare_amount voor de X-kolom.

  4. Selecteer trip_distance deze optie voor de Y-kolom.

  5. Selecteer Average het aggregatietype.

  6. Selecteer pickup_zip deze optie als de kolom Groeperen op .

    Staafdiagram

  7. Klik op Opslaan.

Volgende stappen