Sdílet prostřednictvím


Jak používat GraphFrames v Azure Databricks

Tento článek obsahuje ukázkové poznámkové bloky, které vám pomůžou začít používat GraphFrames v Azure Databricks. GraphFrames je balíček pro Apache Spark, který poskytuje grafy založené na datových rámcích. Poskytuje rozhraní API vysoké úrovně v Javě, Pythonu a Scale. Cílem je poskytnout jak funkce GraphX, tak rozšířené funkce, které využívají datové rámce Spark. Tyto rozšířené funkce zahrnují vyhledávání motivu, serializaci založenou na datových rámcích a bohaté dotazy na grafy.

Tento článek obsahuje tři ukázkové poznámkové bloky: úvodní poznámkový blok dostupný v Pythonu a v jazyce Scala a uživatelskou příručku k Pythonu. Další příklady použití GraphFrames se scalou najdete v uživatelské příručce GraphFrames – Scala.

Doporučení pro Databricks Runtime pro GraphFrames

Databricks doporučuje používat cluster s modulem Databricks Runtime pro Machine Learning, protože zahrnuje optimalizovanou instalaci GraphFrames.

Pokud nepoužíváte cluster s modulem Databricks Runtime ML, stáhněte si soubor JAR z knihovny GraphFrames, načtěte ho do svazku a nainstalujte ho do clusteru.

Začínáme s GraphFrames

Následující poznámkové bloky ukazují, jak pomocí GraphFrames provádět analýzu grafu.

Analýza grafů s GraphFrames (Python)

Získat notebook

Analýza grafů pomocí GraphFrames (Scala)

Získat notebook

Uživatelská příručka k GraphFrames (Python)

Následující poznámkový blok obsahuje příklady kódu Pythonu, jak používat GraphFrames.

Pythonový poznámkový blok GraphFrames

Získat notebook