Aan de slag: Gegevens opvragen en visualiseren vanuit een notebook
In dit aan de slag-artikel wordt u begeleid bij het gebruik van een Azure Databricks-notebook om een query uit te voeren op voorbeeldgegevens die zijn opgeslagen in Unity Catalog met behulp van SQL, Python, Scala en R en vervolgens de queryresultaten in het notebook te visualiseren.
Vereisten
Als u de taken in dit artikel wilt uitvoeren, moet u voldoen aan de volgende vereisten:
- Voor uw werkruimte moet Unity Catalog zijn ingeschakeld. Zie Unity Catalog instellen en beheren voor meer informatie over hoe u aan de slag gaat met Unity Catalog.
- U moet gemachtigd zijn om een bestaande rekenresource te gebruiken of een nieuwe rekenresource te maken. Zie Aan de slag: Account en werkruimte instellen of uw Databricks-beheerder zien.
Stap 1: Een nieuw notitieblok maken
Als u een notitieblok in uw werkruimte wilt maken, klikt u op Nieuw in de zijbalk en vervolgens op Notitieblok. Er wordt een leeg notitieblok geopend in de werkruimte.
Zie Notitieblokken beheren voor meer informatie over het maken en beheren van notitieblokken.
Stap 2: Een query uitvoeren op een tabel
Voer een query uit op de samples.nyctaxi.trips
tabel in Unity Catalog met behulp van de taal van uw keuze.
Kopieer en plak de volgende code in de nieuwe lege notebookcel. Met deze code worden de resultaten weergegeven van het opvragen van de
samples.nyctaxi.trips
tabel in Unity Catalog.SQL
SELECT * FROM samples.nyctaxi.trips
Python
display(spark.read.table("samples.nyctaxi.trips"))
Scala
display(spark.read.table("samples.nyctaxi.trips"))
R
library(SparkR) display(sql("SELECT * FROM samples.nyctaxi.trips"))
Druk
Shift+Enter
om de cel uit te voeren en naar de volgende cel te gaan.De queryresultaten worden weergegeven in het notebook.
Stap 3: de gegevens weergeven
Geef het gemiddelde tarief op reisafstand weer, gegroepeerd op de postcode voor ophalen.
Klik naast het tabblad Tabel op + Visualisatie en klik vervolgens op Visualisatie.
De visualisatie-editor wordt weergegeven.
Controleer in de vervolgkeuzelijst Visualisatietype of Balk is geselecteerd.
Selecteer
fare_amount
voor de X-kolom.Selecteer
trip_distance
deze optie voor de Y-kolom.Selecteer
Average
het aggregatietype.Selecteer
pickup_zip
deze optie als de kolom Groeperen op .Klik op Opslaan.
Volgende stappen
- Zie Aan de slag met het importeren en visualiseren van CSV-gegevens uit een notebook voor meer informatie over het toevoegen van gegevens uit een CSV-bestand aan Unity Catalog en het visualiseren van gegevens.
- Voor meer informatie over het laden van gegevens in Databricks met behulp van Apache Spark, raadpleegt u zelfstudie: Gegevens laden en transformeren met Apache Spark DataFrames.
- Zie Gegevens opnemen in een Databricks Lakehouse voor meer informatie over het opnemen van gegevens in Databricks.
- Zie Querygegevens voor meer informatie over het uitvoeren van query's op gegevens met Databricks.
- Zie Visualisaties in Databricks-notebooks voor meer informatie over visualisaties.