Condividi tramite


Come usare GraphFrames in Azure Databricks

Questo articolo include notebook di esempio che consentono di iniziare a usare GraphFrames in Azure Databricks. GraphFrames è un pacchetto per Apache Spark che fornisce grafici basati su dataframe. Offre API di alto livello in Java, Python e Scala. Ha lo scopo di fornire sia la funzionalità di GraphX che le funzionalità estese che sfruttano i DataFrame Spark in Python e Scala. Queste funzionalità estese includono la ricerca di motivi, la serializzazione basata su dataframe e le query per grafi altamente espressive.

Questo articolo include tre notebook di esempio: un notebook introduttivo disponibile in Python e in Scala e una guida utente python. Per altri esempi relativi all’uso di GraphFrames con Scala, vedere La Guida dell’utente di GraphFrames - Scala.

Raccomandazione di Databricks Runtime per GraphFrame

Se si usa GraphFrames, Databricks consiglia di usare un cluster che esegue Databricks Runtime per Machine Learning, in quanto include un’installazione ottimizzata di GraphFrames.

Se non si usa un cluster che esegue Databricks Runtime ML, scaricare il file JAR dalla libreria GraphFrames, caricarlo in un volume e installarlo nel cluster.

Introduzione a GraphFrames

I notebook seguenti illustrano come usare GraphFrame per eseguire l'analisi del grafo.

Esercitazione sull'analisi di grafi con GraphFrames (Python)

Ottenere il notebook

Esercitazione sull'analisi di grafi con GraphFrames (Scala)

Ottenere il notebook

Manuale dell’utente di GraphFrames (Python)

Il notebook seguente include esempi di codice Python per l’uso di GraphFrame.

Notebook Python graphFrames

Ottenere il notebook