Udostępnij za pośrednictwem


Wizualizacje w notesach Databricks i edytorze SQL

Usługa Azure Databricks ma zaawansowane, wbudowane narzędzia do tworzenia wykresów i wizualizacji bezpośrednio z danych podczas pracy z notesami lub edytorem SQL. Na tej stronie wyjaśniono, jak tworzyć, edytować i zarządzać wizualizacjami w notesach i edytorze SQL. Aby dowiedzieć się więcej o wizualizacjach pulpitów nawigacyjnych sztucznej inteligencji/analizy biznesowej, zobacz Wizualizacje pulpitu nawigacyjnego.

Aby wyświetlić typy wizualizacji, które można utworzyć na podstawie notesów lub edytora SQL, zobacz typy wizualizacji.

Generowanie zestawu wyników w celu wizualizacji

Aby wygenerować zestaw wyników używany na tej stronie, użyj następującego kodu:

SQL

Uruchom następujące zapytanie w edytorze SQL.

USE CATALOG samples;
   SELECT
      hour(tpep_dropoff_datetime) as dropoff_hour,
      COUNT(*) AS num
   FROM samples.nyctaxi.trips
   WHERE pickup_zip in ['10001', '10002']
   GROUP BY 1;

Pyton

Uruchom następujący kod z komórki języka Python w notesie.

from pyspark.sql.functions import hour, col

pickupzip = '10001'  # Example value for pickupzip
df = spark.table("samples.nyctaxi.trips")
result_df = df.filter(col("pickup_zip") == pickupzip) \
              .groupBy(hour(col("tpep_dropoff_datetime")).alias("dropoff_hour")) \
              .count() \
              .withColumnRenamed("count", "num")
display(result_df)

Tworzenie nowej wizualizacji

Wizualizacje można tworzyć w tym samym interfejsie użytkownika, w którym jest wyświetlana tabela wyników. Jeśli pracujesz w notesie, możesz również wygenerować profil danych, który udostępnia podsumowanie statystyk i wizualne szczegółowe informacje dotyczące ramek danych i tabel. Aby dowiedzieć się więcej na temat profilów danych, zobacz Generowanie profilu danych.

  1. Aby utworzyć wizualizację, kliknij + powyżej wyniku i wybierz pozycję Wizualizacja , aby otworzyć edytor wizualizacji.

    Edytor SQL

    Tabela wyników edytora SQL z wyświetloną opcją Wizualizacja.

    Notatnik

    Tabela wyników notatnika z opcją wizualizacji.

  2. Z listy rozwijanej Typ wizualizacji wybierz typ. Następnie wybierz dane do wyświetlenia w wizualizacji. Edytor wizualizacji

  3. Po podjęciu wyborów konfiguracji kliknij przycisk Zapisz.

Usuwanie, duplikowanie lub edytowanie wizualizacji

Aby usunąć, zduplikować lub edytować wizualizację lub profil danych, kliknij strzałkę skierowaną w dół po prawej stronie nazwy karty. Pulpit nawigacyjny można również utworzyć z menu.

Uwaga

Jeśli komórka zawiera profil danych lub uruchamia język inny niż SQL, skojarzona wizualizacja i profil danych można dodać tylko do pulpitu nawigacyjnego notesu. W przypadku komórek SQL zobaczysz dodatkowy element menu Dodaj do pulpitu nawigacyjnego na liście rozwijanej. Zobacz Dodawanie wizualizacji do pulpitu nawigacyjnego.

Edytor SQL

Opcje menu wizualizacji w edytorze SQL.

Notatnik

Opcje menu wizualizacji w notatniku.

Możesz również zmienić nazwę karty, klikając bezpośrednio nazwę i edytując ją na miejscu.

Edytowanie wizualizacji

Aby edytować wizualizację:

  1. Kliknij strzałkę skierowaną w dół na karcie wizualizacji. Następnie kliknij pozycję Edytuj.
  2. Użyj kart w edytorze wizualizacji , aby uzyskać dostęp do różnych części wykresu i edytować je.

Filtrowanie wizualizacji

Aby zastosować filtr w wizualizacji, kliknij ikonę Filtruj. W prawym górnym rogu i wprowadź warunki filtrowania do zastosowania.

Filtry zastosowane w wizualizacji będą również stosowane do tabeli wyników. Filtry zastosowane w tabeli wyników będą również stosowane do wizualizacji.

Zastosowanie filtru w wizualizacji powoduje również filtrowanie tabeli wyników.

Klonowanie wizualizacji

Aby sklonować wizualizację, kliknij strzałkę skierowaną w dół na karcie wizualizacji. Następnie kliknij pozycję Duplikuj.

Włączanie agregacji w wizualizacji

W przypadku wykresów słupkowych, liniowych, warstwowych, kołowych i cieplnych agregację dodaje się bezpośrednio w wizualizacji, a nie poprzez modyfikację zapytania w celu dodania kolumny agregującej. Ta metoda ma następujące zalety:

  • Nie trzeba modyfikować kodu, który generuje tabelę wyników.
  • Modyfikowanie agregacji umożliwia szybkie wykonywanie analizy danych opartych na scenariuszu.
  • Agregacja dotyczy całego zestawu danych, a nie tylko pierwszych 64 000 wierszy wyświetlanych w tabeli.

Agregacja jest dostępna w następujących wizualizacjach:

  • Linia
  • Bar
  • Obszar
  • Placek
  • Mapa cieplna
  • Histogram

Agregacje nie obsługują wizualizacji kombinacji, takich jak wyświetlanie linii i słupków na tym samym wykresie.

Aby zagregować kolumny osi Y dla wizualizacji:

  1. Otwórz edytor wizualizacji, tworząc nowy wykres lub edytując istniejący wykres. Jeśli zostanie wyświetlony komunikat This visualization uses an old configuration. New visualizations support aggregating data directly within the editor, musisz ponownie utworzyć wizualizację przed użyciem agregacji.

  2. Obok kolumn osi Y wybierz typ agregacji z następujących typów liczbowych:

    • Suma (wartość domyślna)
    • Średnia
    • Liczba
    • Zlicz unikatowe
    • Maks
    • Minuta
    • Mediana

    Lub z następujących elementów dla typów ciągów:

    • Liczba
    • Zlicz unikatowe
  3. Kliknij przycisk Zapisz. Wizualizacja pokazuje liczbę wierszy, które agreguje.

W niektórych przypadkach możesz nie chcieć użyć agregacji w kolumnach osi Y. Aby wyłączyć agregację, kliknij ikonę menu kebab. obok pozycji Kolumny Y i usuń zaznaczenie pola Użyj agregacji.

Edytowanie kolorów wizualizacji

Kolory wizualizacji można dostosować podczas tworzenia wizualizacji lub edytowania.

  1. Tworzenie lub edytowanie wizualizacji.
  2. Kliknij pozycję Kolory.
  3. Aby zmodyfikować kolor, kliknij kwadrat i wybierz nowy kolor, wykonując jedną z następujących czynności:
    • Kliknij go w selektorze kolorów.
    • Wprowadź wartość szesnastkową.
  4. Kliknij dowolne miejsce poza selektorem kolorów, aby go zamknąć.
  5. Kliknij pozycję Zapisz w edytorze wizualizacji , aby zapisać zmiany.

Tymczasowo ukryj lub pokaż serię

Aby ukryć serię w wizualizacji, kliknij serię w legendzie. Aby ponownie wyświetlić serię, kliknij ją ponownie w legendzie.

Aby wyświetlić tylko jedną serię, kliknij dwukrotnie serię w legendzie. Aby wyświetlić inną serię, kliknij każdą z nich.

Wybór serii

Aby wybrać określoną serię do analizy na wykresie, użyj następujących poleceń:

  • Kliknij pojedynczy element legendy, aby wybrać tę serię
  • Cmd/Ctrl + kliknij na element legendy, aby zaznaczyć lub odznaczyć wiele serii

wybór serii

Posortowane etykietki narzędzi

Użyj etykiet narzędziowych na wykresach liniowych i nieskupionych wykresach słupkowych, uporządkowanych według wielkości, aby ułatwić analizę.

posortowane etykietki narzędzi

Powiększenie

W przypadku wykresów zawierających dużo danych powiększanie poszczególnych punktów danych może być przydatne do zbadania szczegółów i przycinania wartości odstających. Aby powiększyć wykres, kliknij i przeciągnij na kanwę. Aby wyczyścić powiększenie, umieść kursor na kanwie i kliknij przycisk Wyczyść powiększenie w prawym górnym rogu wizualizacji.

powiększ, aby zobaczyć szczegóły

Pobieranie wizualizacji jako pliku PNG

Aby załadować wizualizację jako plik PNG, umieść kursor na kanwie i kliknij ikonę pobierania w prawym górnym rogu.

kliknij przycisk pobierania, aby wyeksportować wizualizację jako plik PNG

Plik png jest pobierany na urządzenie.

Dodawanie wizualizacji do pulpitu nawigacyjnego

  1. Kliknij strzałkę skierowaną w dół po prawej stronie nazwy karty.
  2. Wybierz opcję Dodaj do panelu. Zostanie wyświetlona lista dostępnych widoków pulpitu nawigacyjnego wraz z opcją menu Dodaj do nowego pulpitu nawigacyjnego.
  3. Wybierz pulpit nawigacyjny lub wybierz opcję Dodaj do nowego pulpitu nawigacyjnego. Zostanie wyświetlony pulpit nawigacyjny, w tym nowo dodana wizualizacja.

Starsze wizualizacje

Najnowsza wersja wizualizacji wykresu jest domyślnie włączona. Ustawienia w tej sekcji opisują starszą wizualizację, którą można napotkać podczas pracy ze starszym wykresem lub jeśli masz wyłączoną najnowszą wersję.

Narzędzia do wizualizacji

Po umieszczeniu wskaźnika myszy na prawym górnym rogu wykresu w edytorze wizualizacji zostanie wyświetlony pasek narzędzi Plotly, na którym można wykonywać operacje, takie jak wybieranie, powiększanie i przesuwanie.

Pasek narzędzi Plotly

Jeśli pasek narzędzi nie jest widoczny, administrator ma wyłączone wyświetlanie paska narzędzi.

niestandardowe palety kolorów

Uwaga

Domyślnie jeśli starszy pulpit nawigacyjny używa niestandardowej palety kolorów, opcje kolorów wizualizacji są ignorowane. Aby zastąpić to ustawienie, zobacz Używanie innego koloru palatte do wizualizacji.