Freigeben über


GraphFrames

GraphFrames ist ein Paket für Apache Spark, das auf Datenrahmen basierende Graphen bereitstellt. Es bietet High-Level-APIs in Java, Python und Scala. Das Ziel ist es, sowohl die Funktionen von Graphx als auch die erweiterte Funktionen bereitzustellen und die Vorteile von Spark-DataFrames zu nutzen. Diese erweiterte Funktionalität umfasst das Suchen von Motiven, die auf Datenrahmen basierende Serialisierung und äußerst ausdrucksvolle Diagrammabfragen.

Dieser Artikel enthält zwei Beispiel-Notebooks: ein Notebook für ein Scala-Tutorial und ein Python-Benutzerhandbuch. Weitere Beispiele zur Verwendung von GraphFrames mit Scala finden Sie unter GraphFrames-Benutzerhandbuch – Scala.

Databricks empfiehlt die Verwendung eines Clusters, in dem Databricks Runtime für Machine Learning ausgeführt wird, da diese Version eine optimierte Installation von GraphFrames beinhaltet.

Wenn Sie keinen Cluster mit Databricks Runtime ML verwenden, laden Sie die JAR-Datei aus der GraphFrames-Bibliothek herunter, laden Sie sie auf ein Volume, und installieren Sie es in Ihrem Cluster.

GraphFrames-Tutorial (Scala)

Im folgenden Notebook wird beschrieben, wie Sie GraphFrames zur Graphenanalyse mithilfe von Scala verwenden können.

Graphenanalyse mit GraphFrames (Scala)

Notebook abrufen

GraphFrames-Benutzerhandbuch (Python)

Das folgende Notebook enthält Python-Codebeispiele für die Verwendung von GraphFrames.

GraphFrames-Python-Notebook

Notebook abrufen