Jak používat GraphFrames v Azure Databricks
Tento článek obsahuje ukázkové poznámkové bloky, které vám pomůžou začít používat GraphFrames v Azure Databricks. GraphFrames je balíček pro Apache Spark, který poskytuje grafy založené na datových rámcích. Poskytuje rozhraní API vysoké úrovně v Javě, Pythonu a Scale. Cílem je poskytnout jak funkce GraphX, tak rozšířené funkce, které využívají datové rámce Spark. Tyto rozšířené funkce zahrnují vyhledávání Motif, serializaci na základě datových rámců a bohaté dotazy na grafy.
Tento článek obsahuje tři ukázkové poznámkové bloky: úvodní poznámkový blok dostupný v Pythonu a v jazyce Scala a uživatelskou příručku k Pythonu. Další příklady použití GraphFrames se scalou najdete v uživatelské příručce GraphFrames – Scala.
Doporučení k Modulu runtime Databricks pro GraphFrames
Databricks doporučuje používat cluster s modulem Databricks Runtime pro Machine Learning, protože zahrnuje optimalizovanou instalaci GraphFrames.
Pokud nepoužíváte cluster s modulem Databricks Runtime ML, stáhněte si soubor JAR z knihovny GraphFrames, načtěte ho do svazku a nainstalujte ho do clusteru.
Začínáme s GraphFrames
Následující poznámkové bloky ukazují, jak pomocí GraphFrames provádět analýzu grafu.
Graph Analysis with GraphFrames (Python)
Graph Analysis with GraphFrames (Scala)
Uživatelská příručka k GraphFrames (Python)
Následující poznámkový blok obsahuje příklady kódu Pythonu, jak používat GraphFrames.