Samouczek dotyczący analizy wykresów przy użyciu pakietu GraphFrames

W tym notesie samouczka pokazano, jak używać elementów GraphFrame do przeprowadzania analizy grafu. Usługa Databricks zaleca używanie klastra z uruchomionym środowiskiem Databricks Runtime for Machine Edukacja, ponieważ obejmuje zoptymalizowaną instalację elementów GraphFrames.

Aby uruchomić notes:

  1. Jeśli nie używasz klastra z uruchomionym środowiskiem Databricks Runtime ML, użyj jednej z tych metod, aby zainstalować bibliotekę GraphFrames.

  2. Pobierz dane sf Bay Area Bike Share z narzędzia Kaggle i rozpakuj je. Musisz zalogować się do aplikacji Kaggle przy użyciu uwierzytelniania innej firmy lub utworzyć i zalogować się do konta Kaggle.

  3. Przekazywanie station.csv i trip.csv używanie interfejsu użytkownika dodawania danych.

    Tabele mają nazwy station_csv i trip_csv.

Analiza grafu za pomocą notesu GraphFrames

Pobierz notes