Začínáme: Dotazování a vizualizace dat z poznámkového bloku

Tento úvodní článek vás provede použitím poznámkového bloku Azure Databricks k dotazování ukázkových dat uložených v Katalogu Unity pomocí SQL, Pythonu, Scaly a R a následné vizualizace výsledků dotazu v poznámkovém bloku.

Požadavky

K dokončení úkolů v tomto článku musíte splňovat následující požadavky:

  • Váš pracovní prostor musí mít povolený katalog Unity. Informace o tom, jak začít s katalogem Unity, najdete v tématu Nastavení a správa katalogu Unity.
  • Musíte mít oprávnění k používání existujícího výpočetního prostředku nebo k vytvoření nového výpočetního prostředku. Viz Začínáme: Nastavení účtu a pracovního prostoru nebo se obraťte na správce Databricks.

Krok 1: Vytvoření nového poznámkového bloku

Vytvoření poznámkového bloku v pracovním prostoru:

  1. Na bočním panelu klikněte na Nová ikonaNový a potom na Poznámkový blok.
  2. Na stránce Vytvořit poznámkový blok:
    • Zadejte jedinečný název poznámkového bloku.
    • Nastavte výchozí jazyk poznámkového bloku a po zobrazení výzvy klikněte na Potvrdit .
    • Pomocí rozevírací nabídky Připojení vyberte výpočetní prostředek. Pokud chcete vytvořit nový výpočetní prostředek, přečtěte si téma Použití výpočetních prostředků.

Další informace o vytváření a správě poznámkových bloků najdete v tématu Správa poznámkových bloků.

Krok 2: Dotazování na tabulku

Dotazování tabulky samples.nyctaxi.trips v katalogu Unity pomocí jazyka podle vašeho výběru

SQL

  1. Zkopírujte a vložte následující kód do nové prázdné buňky poznámkového bloku. Tento kód zobrazí výsledky dotazování samples.nyctaxi.trips tabulky v katalogu Unity.
SELECT * FROM samples.nyctaxi.trips

Python

  1. Zkopírujte a vložte následující kód do nové prázdné buňky poznámkového bloku. Tento kód zobrazí výsledky dotazování samples.nyctaxi.trips tabulky v katalogu Unity.
display(spark.read.table("samples.nyctaxi.trips"))

Scala

  1. Zkopírujte a vložte následující kód do nové prázdné buňky poznámkového bloku. Tento kód zobrazí výsledky dotazování samples.nyctaxi.trips tabulky v katalogu Unity.
display(spark.read.table("samples.nyctaxi.trips"))

R

  1. Zkopírujte a vložte následující kód do nové prázdné buňky poznámkového bloku. Tento kód zobrazí výsledky dotazování samples.nyctaxi.trips tabulky v katalogu Unity.
library(SparkR)
display(sql("SELECT * FROM samples.nyctaxi.trips"))
  1. Stisknutím klávesy Shift+Enter spusťte buňku a přejděte na další buňku.

    Výsledky dotazu se zobrazí v poznámkovém bloku.

Krok 3: Zobrazení dat

Zobrazí průměrnou částku jízdného podle vzdálenosti jízdy seskupené podle PSČ vyzvednutí.

  1. Vedle karty Tabulka klikněte a + potom klikněte na Vizualizace.

    Zobrazí se editor vizualizací.

  2. V rozevíracím seznamu Typ vizualizace ověřte, že je vybraný pruh .

  3. Vyberte fare_amount sloupec X.

  4. Vyberte trip_distance sloupec Y.

  5. Vyberte Average jako typ agregace.

  6. Vyberte pickup_zip jako sloupec Seskupovat podle .

    Pruhový graf

  7. Klikněte na Uložit.

Další kroky