分享方式:


GraphFrames

GraphFrames 是適用於 Apache Spark 的套件,可提供基於 DataFrame 的圖表。 它可在 Java、Python 和 Scala 中提供高階 API。 其目標是提供 GraphX 的功能以及利用 Spark DataFrame 的擴充功能。 此擴充功能包括圖案查找、以 DataFrame 為基礎的序列化,以及高度表達的圖形查詢。

本文包含三個範例筆記本:Python 和 Scala 中提供的教學課程筆記本,以及 Python 使用者指南。 如需有關搭配使用 GraphFrames 與 Scala 的其他範例,請參閱 GraphFrames 使用者指南 - Scala

Databricks 建議使用執行 Databricks Runtime for Machine Learning 的叢集,因為它包含 GraphFrame 的最佳化安裝。

如果您不使用執行 Databricks Runtime ML 的叢集,請從 GraphFrames 媒體櫃下載 JAR 檔案,將它載入磁碟區,並安裝到叢集中

GraphFrames 教學課程

下列筆記本示範如何使用 GraphFrame 來執行圖表分析。

使用 GraphFrame 進行圖表分析 (Python)

取得筆記本

使用 GraphFrame 進行圖表分析 (Scala)

取得筆記本

GraphFrames 使用者指南 (Python)

下列筆記本包含如何使用 GraphFrame 的 Python 程式碼範例。

GraphFrames Python 筆記本

取得筆記本