Öğretici: Not defterinden verileri sorgulama ve görselleştirme

Bu öğreticide SQL, Python, Scala ve R kullanarak Unity Kataloğu'nda depolanan örnek verileri sorgulamak ve ardından sorgu sonuçlarını not defterinde görselleştirmek için Azure Databricks not defteri kullanma adımları gösterilir.

Tip

Genie Code'a (Aracı modu) bunu sizin için gerçekleştirmesini söyleyin:

Create a new notebook that queries @samples.nyctaxi.trips and displays a bar chart showing the average fare amount by trip distance, grouped by the pickup zip code.

Gereksinimler

Bu makaledeki görevleri tamamlamak için aşağıdaki gereksinimleri karşılamanız gerekir:

  • Çalışma alanınızda Unity Kataloğu etkinleştirilmiş olmalıdır. Unity Kataloğu'nu kullanmaya başlama hakkında bilgi için bkz. Unity Kataloğu'nu kullanmaya başlama.
  • Mevcut bir işlem kaynağını kullanma veya yeni bir işlem kaynağı oluşturma izniniz olmalıdır. Compute'a bakın veya Databricks yöneticinize başvurun.

1. Adım: Yeni not defteri oluşturma

Çalışma alanınızda not defteri oluşturmak için kenar çubuğunda Yeni SimgeYeni'ye ve ardından Not Defteri'ne tıklayın. Çalışma alanında boş bir not defteri açılır.

Not defterlerini oluşturma ve yönetme hakkında daha fazla bilgi edinmek için bkz. Not defterlerini yönetme.

2. Adım: Tabloyu sorgulama

samples.nyctaxi.trips Unity Kataloğu'nda, seçtiğiniz dili kullanarak tabloyu sorgular.

  1. Aşağıdaki kodu kopyalayıp yeni boş not defteri hücresine yapıştırın. Bu kod, Unity Kataloğu'nda tabloyu sorgulamanın samples.nyctaxi.trips sonuçlarını görüntüler.

    SQL

    SELECT * FROM samples.nyctaxi.trips
    

    Piton

    display(spark.read.table("samples.nyctaxi.trips"))
    

    Scala programlama dili

    display(spark.read.table("samples.nyctaxi.trips"))
    

    R

    library(SparkR)
    display(sql("SELECT * FROM samples.nyctaxi.trips"))
    
  2. Hücreyi çalıştırmak için basın Shift+Enter ve ardından sonraki hücreye geçin.

    Sorgu sonuçları not defterinde görünür.

3. Adım: Verileri görüntüleme

Ortalama ücret miktarını, teslim alma posta koduna göre gruplandırılmış seyahat mesafesine göre görüntüleyin.

  1. Tablo sekmesinin yanındaki + alanına tıklayın ve ardından Görselleştirme'ye tıklayın.

    Görselleştirme düzenleyicisi görüntülenir.

  2. Görselleştirme Türü açılan listesinde Çubuğun seçili olduğunu doğrulayın.

  3. X sütunufare_amountseçin.

  4. trip_distance Y sütununu seçin.

  5. Toplama türü olarak seçin Average .

  6. pickup_zip sütununu Gruplandırma olarak seçin.

    Çubuk grafik

  7. Kaydet'e tıklayın.

Sonraki adımlar