Sdílet prostřednictvím


Jak používat GraphFrames v Azure Databricks

Tento článek obsahuje ukázkové poznámkové bloky, které vám pomůžou začít používat GraphFrames v Azure Databricks. GraphFrames je balíček pro Apache Spark, který poskytuje grafy založené na datových rámcích. Poskytuje rozhraní API vysoké úrovně v Javě, Pythonu a Scale. Cílem je poskytnout jak funkce GraphX, tak rozšířené funkce, které využívají datové rámce Spark. Tyto rozšířené funkce zahrnují vyhledávání Motif, serializaci na základě datových rámců a bohaté dotazy na grafy.

Tento článek obsahuje tři ukázkové poznámkové bloky: úvodní poznámkový blok dostupný v Pythonu a v jazyce Scala a uživatelskou příručku k Pythonu. Další příklady použití GraphFrames se scalou najdete v uživatelské příručce GraphFrames – Scala.

Doporučení k Modulu runtime Databricks pro GraphFrames

Databricks doporučuje používat cluster s modulem Databricks Runtime pro Machine Learning, protože zahrnuje optimalizovanou instalaci GraphFrames.

Pokud nepoužíváte cluster s modulem Databricks Runtime ML, stáhněte si soubor JAR z knihovny GraphFrames, načtěte ho do svazku a nainstalujte ho do clusteru.

Začínáme s GraphFrames

Následující poznámkové bloky ukazují, jak pomocí GraphFrames provádět analýzu grafu.

Graph Analysis with GraphFrames (Python)

Získat poznámkový blok

Graph Analysis with GraphFrames (Scala)

Získat poznámkový blok

Uživatelská příručka k GraphFrames (Python)

Následující poznámkový blok obsahuje příklady kódu Pythonu, jak používat GraphFrames.

Poznámkový blok Pythonu pro GraphFrames

Získat poznámkový blok