Verwenden von GraphFrames auf Azure Databricks
Dieser Artikel enthält Beispielnotizbücher, die Ihnen bei den ersten Schritten mit GraphFrames in Azure Databricks helfen. GraphFrames ist ein Paket für Apache Spark, das DataFrame-basierte Diagramme bereitstellt. Es bietet High-Level-APIs in Java, Python und Scala. Das Ziel ist es, sowohl die Funktionen von Graphx als auch die erweiterte Funktionen bereitzustellen und die Vorteile von Spark-DataFrames zu nutzen. Diese erweiterte Funktionalität umfasst das Suchen von Motiven, die auf Datenrahmen basierende Serialisierung und äußerst ausdrucksvolle Diagrammabfragen.
Dieser Artikel enthält drei Beispielnotizbücher: ein einführungsnotizbuch, das in Python und Scala verfügbar ist, und ein Python-Benutzerhandbuch. Weitere Beispiele zur Verwendung von GraphFrames mit Scala finden Sie unter GraphFrames-Benutzerhandbuch – Scala.
Databricks-Runtime-Empfehlung für GraphFrames
Databricks empfiehlt die Verwendung eines Clusters, in dem Databricks Runtime für Machine Learning ausgeführt wird, da diese Version eine optimierte Installation von GraphFrames beinhaltet.
Wenn Sie keinen Cluster mit Databricks Runtime ML verwenden, laden Sie die JAR-Datei aus der GraphFrames-Bibliothek herunter, laden Sie sie auf ein Volume, und installieren Sie es in Ihrem Cluster.
Erste Schritte mit GraphFrames
In den folgenden Notebooks wird beschrieben, wie Sie GraphFrames zur Graphenanalyse verwenden können.
Graphenanalyse mit GraphFrames (Python)
Graphenanalyse mit GraphFrames (Scala)
GraphFrames-Benutzerhandbuch (Python)
Das folgende Notebook enthält Python-Codebeispiele für die Verwendung von GraphFrames.