Tutorial: Mengkueri dan memvisualisasikan data dari buku catatan

Tutorial ini memandu Anda menggunakan buku catatan Azure Databricks untuk mengkueri data sampel yang disimpan di Unity Catalog menggunakan SQL, Python, Scala, dan R lalu memvisualisasikan hasil kueri di buku catatan.

Petunjuk / Saran

Sampaikan kepada Genie Code (mode Agen) agar melaksanakan ini untuk Anda:

Create a new notebook that queries @samples.nyctaxi.trips and displays a bar chart showing the average fare amount by trip distance, grouped by the pickup zip code.

Persyaratan

Untuk menyelesaikan tugas dalam artikel ini, Anda harus memenuhi persyaratan berikut:

  • Ruang kerja Anda harus memiliki Katalog Unity diaktifkan. Untuk informasi tentang mulai menggunakan Katalog Unity, lihat Mulai menggunakan Katalog Unity.
  • Anda harus memiliki izin untuk menggunakan sumber daya komputasi yang sudah ada atau membuat sumber daya komputasi baru. Lihat Compute atau hubungi administrator Databricks Anda.

Langkah 1: Membuat buku catatan baru

Untuk membuat buku catatan di ruang kerja Anda, klik Ikon BaruBaru di bilah samping, lalu klik Buku Catatan. Buku catatan kosong terbuka di ruang kerja.

Untuk mempelajari selengkapnya tentang membuat dan mengelola buku catatan, lihat Mengelola buku catatan.

Langkah 2: Mengkueri tabel

samples.nyctaxi.trips Kueri tabel di Unity Catalog menggunakan bahasa pilihan Anda.

  1. Salin dan tempel kode berikut ke dalam sel buku catatan kosong baru. Kode ini menampilkan hasil dari mengkueri samples.nyctaxi.trips tabel di Katalog Unity.

    SQL

    SELECT * FROM samples.nyctaxi.trips
    

    Phyton

    display(spark.read.table("samples.nyctaxi.trips"))
    

    Scala

    display(spark.read.table("samples.nyctaxi.trips"))
    

    R

    library(SparkR)
    display(sql("SELECT * FROM samples.nyctaxi.trips"))
    
  2. Tekan Shift+Enter untuk menjalankan sel lalu berpindah ke sel berikutnya.

    Hasil kueri muncul di buku catatan.

Langkah 3: Menampilkan data

Tampilkan jumlah tarif rata-rata berdasarkan jarak perjalanan, dikelompokkan menurut kode pos penjemputan.

  1. Di samping tab Tabel , klik + lalu klik Visualisasi.

    Editor visualisasi ditampilkan.

  2. Di menu dropdown Jenis Visualisasi, verifikasi bahwa Bar dipilih.

  3. Pilih fare_amount untuk kolom X.

  4. Pilih trip_distance untuk kolom Y.

  5. Pilih Average sebagai jenis agregasi.

  6. Pilih pickup_zip sebagai kolom Group by.

    Bagan batang

  7. Klik Simpan.

Langkah berikutnya