Compartir vía


Uso de GraphFrames en Azure Databricks

En este artículo se incluyen cuadernos de ejemplo que le ayudarán a empezar a usar GraphFrames en Azure Databricks. GraphFrames es un paquete para Apache Spark que proporciona grafos basados en dataframes. Proporciona API de alto nivel en Java, Python y Scala. El objetivo es proporcionar tanto la funcionalidad de GraphX como la funcionalidad ampliada que saca partido de los DataFrames de Spark. Esta funcionalidad extendida incluye la búsqueda de motivos, la serialización basada en dataframes y las consultas de grafos muy expresivos.

En este artículo se incluyen tres cuadernos de ejemplo: un cuaderno introductorio disponible en Python y en Scala y una guía de usuario de Python. Para obtener ejemplos adicionales con GraphFrames con Scala, consulte Guía de usuario de GraphFrames: Scala.

Recomendación de Databricks Runtime para GraphFrames

Databricks recomienda usar un clúster que ejecute Databricks Runtime para Machine Learning, ya que incluye una instalación optimizada de GraphFrames.

Si no usa un clúster que ejecuta Databricks Runtime ML, descargue el archivo JAR de la biblioteca GraphFrames, cárguelo en un volumen e instálelo en el clúster.

Introducción a GraphFrames

Los siguientes cuadernos muestran cómo utilizar GraphFrames para realizar análisis de gragos.

Análisis de grafos con GraphFrames (Python)

Obtener el cuaderno

Análisis de grafos con GraphFrames (Scala)

Obtener el cuaderno

Guía del usuario de GraphFrames: (Python)

En el cuaderno siguiente se incluyen ejemplos de código de Python sobre cómo usar GraphFrames.

Cuaderno de Python de GraphFrames

Obtener el cuaderno