Uso de GraphFrames en Azure Databricks
En este artículo se incluyen cuadernos de ejemplo que le ayudarán a empezar a usar GraphFrames en Azure Databricks. GraphFrames es un paquete para Apache Spark que proporciona grafos basados en dataframes. Proporciona API de alto nivel en Java, Python y Scala. El objetivo es proporcionar tanto la funcionalidad de GraphX como la funcionalidad ampliada que saca partido de los DataFrames de Spark. Esta funcionalidad extendida incluye la búsqueda de motivos, la serialización basada en dataframes y las consultas de grafos muy expresivos.
En este artículo se incluyen tres cuadernos de ejemplo: un cuaderno introductorio disponible en Python y en Scala y una guía de usuario de Python. Para obtener ejemplos adicionales con GraphFrames con Scala, consulte Guía de usuario de GraphFrames: Scala.
Recomendación de Databricks Runtime para GraphFrames
Databricks recomienda usar un clúster que ejecute Databricks Runtime para Machine Learning, ya que incluye una instalación optimizada de GraphFrames.
Si no usa un clúster que ejecuta Databricks Runtime ML, descargue el archivo JAR de la biblioteca GraphFrames, cárguelo en un volumen e instálelo en el clúster.
Introducción a GraphFrames
Los siguientes cuadernos muestran cómo utilizar GraphFrames para realizar análisis de gragos.
Análisis de grafos con GraphFrames (Python)
Análisis de grafos con GraphFrames (Scala)
Guía del usuario de GraphFrames: (Python)
En el cuaderno siguiente se incluyen ejemplos de código de Python sobre cómo usar GraphFrames.