Wprowadzenie: wykonywanie zapytań i wizualizowanie danych z notesu
Ten artykuł wprowadzający przeprowadzi Cię przez proces używania notesu usługi Azure Databricks do wykonywania zapytań dotyczących przykładowych danych przechowywanych w wykazie aparatu Unity przy użyciu języków SQL, Python, Scala i R, a następnie wizualizowania wyników zapytania w notesie.
Wymagania
Aby wykonać zadania opisane w tym artykule, musisz spełnić następujące wymagania:
- Obszar roboczy musi mieć włączony katalog aparatu Unity. Aby uzyskać informacje na temat rozpoczynania pracy z wykazem aparatu Unity, zobacz Konfigurowanie wykazu aparatu Unity i zarządzanie nim.
- Musisz mieć uprawnienia do używania istniejącego zasobu obliczeniowego lub utworzenia nowego zasobu obliczeniowego. Zobacz Wprowadzenie: Konfiguracja konta i obszaru roboczego lub zobacz administratora usługi Databricks.
Krok 1. Tworzenie nowego notesu
Aby utworzyć notes w obszarze roboczym, kliknij pozycję Nowy na pasku bocznym, a następnie kliknij przycisk Notes. W obszarze roboczym zostanie otwarty pusty notes.
Aby dowiedzieć się więcej na temat tworzenia notesów i zarządzania nimi, zobacz Zarządzanie notesami.
Krok 2. Wykonywanie zapytań względem tabeli
Wykonaj zapytanie dotyczące samples.nyctaxi.trips
tabeli w katalogu aparatu Unity przy użyciu wybranego języka.
Skopiuj i wklej następujący kod do nowej pustej komórki notesu. Ten kod wyświetla wyniki z wykonywania
samples.nyctaxi.trips
zapytań dotyczących tabeli w wykazie aparatu Unity.SQL
SELECT * FROM samples.nyctaxi.trips
Python
display(spark.read.table("samples.nyctaxi.trips"))
Scala
display(spark.read.table("samples.nyctaxi.trips"))
R
library(SparkR) display(sql("SELECT * FROM samples.nyctaxi.trips"))
Naciśnij ,
Shift+Enter
aby uruchomić komórkę, a następnie przejdź do następnej komórki.Wyniki zapytania są wyświetlane w notesie.
Krok 3. Wyświetlanie danych
Wyświetl średnią kwotę taryfy według odległości podróży pogrupowane według kodu pocztowego odbioru.
Obok karty Tabela kliknij+, a następnie kliknij pozycję Wizualizacja.
Zostanie wyświetlony edytor wizualizacji.
Na liście rozwijanej Typ wizualizacji sprawdź, czy wybrano pasek .
Wybierz
fare_amount
kolumnę X.Wybierz
trip_distance
kolumnę Y.Wybierz
Average
jako typ agregacji.Wybierz
pickup_zip
jako kolumnę Grupuj według .Kliknij przycisk Zapisz.
Następne kroki
- Aby dowiedzieć się więcej na temat dodawania danych z pliku CSV do wykazu aparatu Unity i wizualizowania danych, zobacz Wprowadzenie: importowanie i wizualizowanie danych CSV z notesu.
- Aby dowiedzieć się, jak ładować dane do usługi Databricks przy użyciu platformy Apache Spark, zobacz Samouczek: ładowanie i przekształcanie danych przy użyciu ramek danych platformy Apache Spark.
- Aby dowiedzieć się więcej na temat pozyskiwania danych do usługi Databricks, zobacz Pozyskiwanie danych do usługi Databricks lakehouse.
- Aby dowiedzieć się więcej na temat wykonywania zapytań dotyczących danych za pomocą usługi Databricks, zobacz Query data (Wykonywanie zapytań o dane).
- Aby dowiedzieć się więcej na temat wizualizacji, zobacz Wizualizacje w notesach usługi Databricks.