Bagikan melalui


Cara menggunakan GraphFrames di Azure Databricks

Artikel ini menyertakan contoh buku catatan untuk membantu Anda mulai menggunakan GraphFrames di Azure Databricks. GraphFrames adalah paket untuk Apache Spark yang menyediakan grafik berbasis DataFrame. Ini menyediakan API tingkat tinggi di Java, Python, dan Scala. Ini bertujuan untuk menyediakan fungsionalitas GraphX dan fungsionalitas yang diperluas memanfaatkan Spark DataFrames. Fungsionalitas yang diperluas ini mencakup pencarian motif, serialisasi berbasis DataFrame, dan kueri grafik yang sangat ekspresif.

Artikel ini mencakup tiga contoh notebook: notebook pengantar yang tersedia di Python dan di Scala, dan panduan pengguna Python. Untuk contoh tambahan menggunakan GraphFrames dengan Scala, lihat Panduan pengguna GraphFrames - Scala.

Rekomendasi Databricks Runtime untuk GraphFrames

Databricks merekomendasikan untuk menggunakan kluster yang menjalankan Databricks Runtime for Machine Learning, karena mencakup pemasangan GraphFrames yang telah dioptimalkan.

Jika Anda tidak menggunakan kluster yang menjalankan Databricks Runtime ML, unduh file JAR dari pustaka GraphFrames, muat ke volume, dan instal ke kluster Anda.

Mulai menggunakan GraphFrames

Buku catatan berikut ini memperlihatkan kepada Anda cara menggunakan GraphFrames untuk melakukan analisis grafik.

Analisis Grafik dengan GraphFrames (Python)

Ambil buku catatan

Analisis Grafik dengan GraphFrames (Scala)

Ambil buku catatan

Panduan pengguna GraphFrames (Python)

Notebook berikut menyertakan contoh kode Python tentang cara menggunakan GraphFrames.

Buku catatan Python GraphFrames

Ambil buku catatan