Bagikan melalui


Apa itu database grafik?

Nota

Fitur ini saat ini dalam pratinjau publik. Pratinjau ini disediakan tanpa perjanjian tingkat layanan, dan tidak disarankan untuk beban kerja produksi. Fitur tertentu mungkin tidak didukung atau mungkin memiliki kemampuan terbatas. Untuk informasi selengkapnya, lihat Ketentuan Penggunaan Tambahan untuk Pratinjau Microsoft Azure.

Database grafik menawarkan cara yang kuat untuk memodelkan dan mengkueri data yang terhubung. Tidak seperti database relasional tradisional yang menyimpan data dalam tabel, database grafik mewakili informasi sebagai simpul (entitas) dan tepi (hubungan), membuatnya lebih mudah untuk lebih fleksibel menjelajahi koneksi dan pola yang kompleks. Artikel ini menjelaskan konsep inti database grafik, cara kerja kueri grafik, dan menguraikan kapan harus mempertimbangkan penggunaan database grafik untuk beban kerja Anda. Ini juga membandingkan graf di Microsoft Fabric dengan implementasi database graf mandiri.

Jenis database grafik yang paling umum digunakan mengimplementasikan model grafik properti berlabel (LPG): entitas (simpul) dan hubungan (tepi) dapat memiliki label dan properti (pasangan kunci–nilai). Model fleksibel ini memungkinkan desain opsional skema dan berbasis skema, dan memungkinkan Anda mengekspresikan semantik yang kaya. Karena koneksi disimpan secara eksplisit sebagai tepi, kueri melintasi hubungan dengan mengikuti tepi alih-alih menghitung gabungan mahal pada waktu kueri.

Penting

Artikel ini secara eksklusif menggunakan himpunan data grafik contoh jejaring sosial.

Konsep inti database graf

  • Simpul mewakili entitas seperti orang, produk, atau tempat. Simpul dapat memiliki label dan properti yang menjelaskan atributnya. Misalnya, simpul Orang mungkin memiliki properti seperti firstName, lastName, dan usia.
  • Sisi mewakili bagaimana entitas terhubung, misalnya FRIENDS_WITH, PURCHASED, atau LOCATED_IN. Tepi juga dapat memuat properti dan label untuk mengenkode metadata hubungan.
  • Properti melampirkan detail ke simpul dan tepi (misalnya, nama seseorang atau tepi sejak tanggal). Karena hubungan disimpan secara eksplisit sebagai tepi, kueri menavigasi grafik dengan mengikuti koneksi daripada menghitungnya pada waktu kueri.

Cara kerja relasi kueri

Kueri grafik mengambil informasi yang terhubung dengan melintas dari simpul awal ke tetangganya, kemudian ke tetangga mereka, dan sebagainya. Upaya yang dilakukan oleh traversal terkait dengan jumlah tepi yang disentuhnya (lingkungan lokal), bukan ukuran total himpunan data. Karakteristik ini membuat pertanyaan tentang jalur, koneksi, dan pola—seperti teman teman, jalur terpendek, atau dependensi multi-hop—alami dan efisien untuk diekspresikan.

Database grafik menggunakan bahasa kueri berbasis pola, seperti Graph Query Language (GQL) yang semakin diadopsi, untuk menjelaskan traversal ini secara ringkas. Grup kerja internasional yang sama yang mengawasi SQL (ISO/IEC 39075) menstandarkan GQL, yang menyelaraskan kueri grafik dengan standar database yang ditetapkan.

Contoh (pencocokan pola dengan GQL):

MATCH (p:Person {firstName: "Annemarie"})-[:knows]->(friend)-[:likes]->(c:Comment)
RETURN c
ORDER BY c.creationDate
LIMIT 100

Pola ini dibaca sebagai: mulai dari simpul Person untuk Annemarie, mengikuti sisi :knows ke setiap simpul teman, lalu mengikuti sisi :likes ke simpul terkait :Comment. Mengembalikan 100 komentar terbaru yang diurutkan berdasarkan tanggal pembuatannya.

Pemodelan dan skema

Model data grafik bersifat opsional terhadap skema: Anda dapat bekerja dengan skema tetap saat membutuhkan pengelolaan yang kuat, atau mengembangkan model seiring munculnya jenis node, hubungan, atau properti baru. Pendekatan ini mengurangi kebutuhan akan duplikasi data dan memungkinkan tim menyatukan data dari beberapa sumber tanpa desain ulang di muka yang berat.

Penggunaan umum untuk database grafik

Database graf selaras dengan domain di mana koneksi mendorong nilai, seperti:

  • Jejaring sosial
  • Grafik pengetahuan
  • Sistem rekomendasi
  • Jaringan penipuan dan risiko
  • Topologi jaringan dan TI
  • Analisis dependensi rantai pasokan

Dalam skenario ini, pertanyaan lebih jarang ditujukan pada catatan tunggal dan lebih fokus pada berapa banyak entitas yang terkait dan berinteraksi melalui beberapa tahap.

Kapan harus mempertimbangkan database grafik

Pilih database grafik saat:

  • Pertanyaan utama Anda melibatkan jalur, lingkungan, dan pola dalam data yang terhubung.
  • Jumlah hop bervariasi atau tidak diketahui sebelumnya.
  • Anda perlu menggabungkan dan menavigasi hubungan di seluruh himpunan data yang berbeda.

Jika Anda secara teratur mengajukan pertanyaan semacam ini, model grafik sangat cocok.

Bagaimana grafik di Microsoft Fabric dibandingkan dengan database grafik mandiri

Mewakili data Anda sebagai graf dan menyimpannya dalam database graf mandiri sering memperkenalkan ETL (ekstrak, transformasi, muat) dan beban tata kelola. Sebaliknya, grafik beroperasi langsung di OneLake, yang mengurangi atau menghilangkan kebutuhan akan alur ETL terpisah dan duplikasi data. Pertimbangkan kompromi-kompromi berikut:

  • Pergerakan dan duplikasi data: Database grafik mandiri biasanya memerlukan ekstraksi, transformasi, dan pemuatan data ke penyimpanan terpisah, yang meningkatkan kompleksitas dan dapat menyebabkan himpunan data duplikat. Grafik beroperasi di OneLake sehingga Anda dapat memodelkan dan mengkueri data yang terhubung tanpa memindahkannya.
  • Biaya operasional: Tumpukan grafik mandiri berjalan sebagai kluster atau layanan terpisah dan sering membawa biaya kapasitas diam. Dalam grafik, beban kerja memanfaatkan unit kapasitas yang dikumpulkan (CUs) dengan pengurangan skala otomatis dan metrik terpusat, yang menyederhanakan operasi serta dapat mengurangi biaya.
  • Skalabilitas: Beberapa database grafik mandiri bergantung pada peningkatan skala atau pengklusteran khusus vendor. Grafik dirancang untuk grafik skala besar dan menggunakan sharding peluasan skala di beberapa pekerja untuk menangani beban kerja big-data secara efisien.
  • Alat dan keterampilan: Sistem grafik khusus vendor dapat memerlukan bahasa khusus dan kerangka kerja analitik terpisah. Grafik menyediakan pemodelan terpadu, kueri berbasis standar (GQL), algoritma analitik grafik bawaan, integrasi BI, dan AI, dan alat eksplorasi rendah/tanpa kode. Kemampuan ini memungkinkan sekumpulan pengguna yang lebih luas untuk bekerja dengan data yang terhubung.
  • Tata kelola dan keamanan: Penyebaran grafik terpisah memerlukan tata kelola independen dan penyiapan keamanan. Grafik menggunakan tata kelola OneLake, silsilah data, dan kontrol akses berbasis peran ruang kerja (RBAC) sehingga kepatuhan, audit, dan izin tetap konsisten dengan sisa lingkungan Fabric Anda.