如何在 Azure Databricks 上使用 GraphFrames
本文包含示例笔记本,可帮助你开始在 Azure Databricks 上使用 GraphFrames。 GraphFrames 是 Apache Spark 的包,它提供基于数据帧的图形。 它在 Java、Python 和 Scala 中提供高级 API。 它旨在利用 Spark 数据帧提供 GraphX 的功能和扩展功能。 此扩展功能包括主题查找、基于 DataFrame 的序列化和表现性强的图形查询。
本文包含三个示例笔记本:Python 和 Scala 介绍性笔记本以及 Python 用户指南。 有关将 GraphFrames 与 Scala 配合使用的其他示例,请参阅 GraphFrames 用户指南 - Scala。
针对 GraphFrames 的 Databricks Runtime 建议
Databricks 建议使用运行用于机器学习的 Databricks Runtime 的群集,因为它包括 GraphFrames 的优化安装。
如果不使用运行 Databricks Runtime ML 的群集,请从 GraphFrames 库下载 JAR 文件,将 JAR 文件加载到卷,并将其安装到群集。
GraphFrames 入门
以下笔记本介绍如何使用 GraphFrames 执行图形分析。
使用 GraphFrames 进行图形分析 (Python)
使用 GraphFrames (Scala) 执行图形分析
GraphFrames 用户指南 (Python)
以下笔记本采用 Python 代码示例的形式介绍了如何使用 GraphFrame。