GraphFrames
GraphFrames — это пакет для Apache Spark, который предоставляет графы на основе DataFrame. Он предоставляет высокоуровневые API для Java, Python и Scala, Она предназначена для предоставления функциональных возможностей GraphX и расширенных функциональных возможностей, используя преимущества кадров данных Spark. Эти расширенные возможности включают поиск в Motif, сериализацию на основе DataFrame и выразительные запросы графов.
В этой статье содержится три примера записных книжек: записная книжка учебника, доступная в Python и в Scala, а также руководство пользователя Python. Дополнительные примеры использования GraphFrames с Scala см . в руководстве пользователя GraphFrames — Scala.
Databricks рекомендует использовать кластер со средой Databricks Runtime для Машинного обучения, так как он включает оптимизированную установку GraphFrames.
Если вы не используете кластер под управлением Databricks Runtime ML, скачайте JAR-файл из библиотеки GraphFrames, загрузите его в том и установите его в кластер.
Руководство по GraphFrames
В следующих записных книжках показано, как использовать ГрафФреймы для выполнения анализа графов.
Анализ графов с помощью GraphFrames (Python)
Анализ графов с помощью GraphFrames (Scala)
Руководство пользователя GraphFrames (Python)
В следующей записной книжке приведены примеры кода Python по использованию GraphFrames.