Cara menggunakan GraphFrames di Azure Databricks
Artikel ini menyertakan contoh buku catatan untuk membantu Anda mulai menggunakan GraphFrames di Azure Databricks. GraphFrames adalah paket untuk Apache Spark yang menyediakan grafik berbasis DataFrame. Ini menyediakan API tingkat tinggi di Java, Python, dan Scala. Ini bertujuan untuk menyediakan fungsionalitas GraphX dan fungsionalitas yang diperluas memanfaatkan Spark DataFrames. Fungsionalitas yang diperluas ini mencakup pencarian motif, serialisasi berbasis DataFrame, dan kueri grafik yang sangat ekspresif.
Artikel ini mencakup tiga contoh notebook: notebook pengantar yang tersedia di Python dan di Scala, dan panduan pengguna Python. Untuk contoh tambahan menggunakan GraphFrames dengan Scala, lihat Panduan pengguna GraphFrames - Scala.
Rekomendasi Runtime Databricks untuk GraphFrames
Databricks merekomendasikan untuk menggunakan kluster yang menjalankan Databricks Runtime untuk Azure Machine Learning, karena mencakup instalasi GraphFrames yang dioptimalkan.
Jika Anda tidak menggunakan kluster yang menjalankan Databricks Runtime ML, unduh file JAR dari pustaka GraphFrames, muat ke volume, dan instal ke kluster Anda.
Mulai menggunakan GraphFrames
Buku catatan berikut ini memperlihatkan kepada Anda cara menggunakan GraphFrames untuk melakukan analisis grafik.
Analisis Grafik dengan GraphFrames (Python)
Analisis Grafik dengan GraphFrames (Scala)
Panduan pengguna GraphFrames (Python)
Notebook berikut menyertakan contoh kode Python tentang cara menggunakan GraphFrames.