Aracılığıyla paylaş


Graf veritabanı nedir?

Uyarı

Bu özellik şu anda genel önizlemededir. Bu önizleme, hizmet düzeyi sözleşmesi olmadan sağlanır ve üretim iş yükleri için önerilmez. Bazı özellikler desteklenmiyor olabileceği gibi özellikleri sınırlandırılmış da olabilir. Daha fazla bilgi için bkz. Microsoft Azure Önizlemeleri için Uygun Kullanım Koşulları.

Graph veritabanları, bağlı verileri modellemek ve sorgulamak için güçlü bir yol sunar. Tablolarda veri depolayan geleneksel ilişkisel veritabanlarının aksine, grafik veritabanları bilgileri düğümler (varlıklar) ve kenarlar (ilişkiler) olarak temsil ederek karmaşık bağlantıları ve desenleri daha esnek bir şekilde keşfetmeyi kolaylaştırır. Bu makalede, grafik veritabanlarının temel kavramları, grafik sorgularının nasıl çalıştığı ve iş yükünüz için bir graf veritabanı kullanmayı ne zaman göz önünde bulundurmanız gerekenler açıklanmaktadır. Ayrıca Microsoft Fabric'teki grafı tek başına grafik veritabanı dağıtımlarıyla karşılaştırır.

En yaygın kullanılan grafik veritabanı türü etiketli özellik grafı (LPG) modelini uygular: varlıklar (düğümler) ve ilişkiler (kenarlar) etiketlere ve özelliklere (anahtar-değer çiftleri) sahip olabilir. Bu esnek model hem şema isteğe bağlı hem de şema temelli tasarımlar sağlar ve zengin semantiği ifade etmenizi sağlar. Bağlantılar açıkça kenar olarak depolandığından sorgular, sorgu zamanında pahalı birleşimleri hesaplama yerine kenarları takip ederek ilişkiler arasında geçiş yapar.

Önemli

Bu makale yalnızca sosyal ağ örnek grafik veri setini kullanmaktadır.

Graph veritabanı temel kavramları

  • Düğümler kişiler, ürünler veya yerler gibi varlıkları temsil eder. Düğümler özniteliklerini açıklayan etiketlere ve özelliklere sahip olabilir. Örneğin, bir Kişi düğümünde firstName, lastName ve age gibi özellikler olabilir.
  • Kenarlar, varlıkların nasıl bağlandığını, örnek olarak "FRIENDS_WITH", "PURCHASED" veya "LOCATED_IN" şeklinde gösterir. Kenarlar, ilişki meta verilerini kodlamak için özellikleri ve etiketleri de taşıyabilir.
  • Özellikler , düğümlere ve kenarlara (örneğin, bir kişinin adı veya bir kenarın bu tarihten itibaren) ayrıntılarını ekler. İlişkiler açıkça kenar olarak depolandığından sorgular, sorgu zamanında hesaplama yerine bağlantıları izleyerek grafikte geziniyor.

İlişkilerin sorgulanması nasıl çalışır?

Graf sorguları, bir başlangıç düğümünden komşularına, ardından komşularına vb. geçiş yaparak bağlı bilgileri alır. Çapraz geçişin gerçekleştirdiği çaba, veri kümesinin toplam boyutuna değil dokunduğu kenar sayısına (yerel mahalle) bağlıdır. Bu özellik, arkadaş arkadaşları, en kısa yollar veya çok atlamalı bağımlılıklar gibi yollar, bağlantılar ve desenler hakkındaki soruların doğal ve verimli bir şekilde ifade edilmesine neden olur.

Graf veritabanları, bu geçişleri kısa sürede açıklamak için giderek benimsenen Graph Sorgu Dili (GQL) gibi desen tabanlı sorgu dillerini kullanır. SQL'i (ISO/IEC 39075) denetleyen aynı uluslararası çalışma grubu, graf sorgulamayı yerleşik veritabanı standartlarıyla uyumlu hale getiren GQL'yi standartlaştırmaktadır.

Örnek (GQL ile desen eşleştirme):

MATCH (p:Person {firstName: "Annemarie"})-[:knows]->(friend)-[:likes]->(c:Comment)
RETURN c
ORDER BY c.creationDate
LIMIT 100

Bu desen şu şekilde okunur: Annemarie için Kişi düğümünden başlayarak :knows kenarlarını her arkadaş düğümüne takip edin, ardından :likes kenarlarını ilgili :Comment düğümlerine kadar izleyin. Bu açıklamalardan en yeni 100'ünü oluşturma tarihlerine göre sıralanmış olarak döndürür.

Modelleme ve şema

Grafik veri modelleri opsiyonel şemalara sahiptir: Güçlü bir idareye ihtiyacınız olduğunda sabit bir şemayla çalışabilir veya yeni düğüm türleri, ilişkiler veya özellikler ortaya çıktığında veri modelini geliştirebilirsiniz. Bu yaklaşım, veri yineleme gereksinimini azaltır ve ekiplerin birden çok kaynaktan gelen verileri büyük bir ön tasarıma gerek kalmadan birleştirmesine olanak tanır.

Grafik veritabanları için yaygın kullanımlar

Graph veritabanları, bağlantıların değer yarattığı alanlarla yakın bir şekilde hizalanır, örneğin:

  • Sosyal ağlar
  • Bilgi grafikleri
  • Öneri sistemleri
  • Sahtekarlık ve risk ağları
  • Ağ ve BT topolojisi
  • Tedarik zinciri bağımlılık analizi

Bu senaryolarda, sorular tek kayıtlardan ziyade, birkaç adımda kaç varlığın birbiriyle ilişkili ve etkileşimde olduğuna odaklanır.

Graf veritabanı ne zaman dikkate alınır?

Şu durumlarda bir grafik veritabanı seçin:

  • Birincil sorularınız arasında bağlantılı verilerdeki yollar, mahalleler ve desenler yer alır.
  • Atlama sayısı değişkendir veya önceden bilinmemektedir.
  • Farklı veri kümelerindeki ilişkileri birleştirmeniz ve bunlarda gezinmeniz gerekir.

Bu tür soruları düzenli olarak sorarsanız graf modeli doğal bir uyum sağlar.

Microsoft Fabric'teki grafın tek başına grafik veritabanlarıyla karşılaştırması

Verilerinizi grafik olarak temsil etmek ve ayrı, tek başına bir grafik veritabanında depolamak genellikle ETL (ayıklama, dönüştürme, yükleme) ve idare ek yükü getirir. Buna karşılık, graf doğrudan OneLake üzerinde çalışır ve bu da ayrı ETL işlem hatları ve veri yineleme ihtiyacını azaltır veya ortadan kaldırır. Şu avantajları göz önünde bulundurun:

  • Veri taşıma ve yineleme: Tek başına grafik veritabanları genellikle verilerin ayrı bir depoya ayıklanması, dönüştürülmesi ve yüklenmesini gerektirir; bu da karmaşıklığı artırır ve yinelenen veri kümelerine yol açabilir. Graph OneLake üzerinde çalışır, böylece bağlı verileri taşımadan modelleyebilir ve sorgulayabilirsiniz.
  • operasyonel maliyetler: Tek başına grafik yığınları ayrı kümeler veya hizmetler olarak çalışır ve genellikle boşta kapasite ücretleri taşır. Grafikte, iş yükleri, otomatik ölçek küçültme ve merkezi ölçümlerle havuza alınan kapasite birimlerini (CU) kullanır, bu da uygulamaları kolaylaştırır ve maliyeti düşürebilir.
  • Ölçeklenebilirlik: Bazı tek başına grafik veritabanları ölçeği artırmaya veya satıcıya özgü kümeleme işlemlerine bağlıdır. Graf, büyük ölçekli grafikler için tasarlanmıştır ve büyük veri iş yüklerini verimli bir şekilde işlemek için birden çok işçi arasında ölçeklenebilir parçalama kullanır.
  • Araçlar ve beceriler: Satıcıya özgü grafik sistemleri özel diller ve ayrı analiz çerçeveleri gerektirebilir. Graph birleşik modelleme, standartlara dayalı sorgulama (GQL), yerleşik graf analizi algoritmaları, BI ve yapay zeka tümleştirmesi ve düşük/kod içermeyen keşif araçları sağlar. Bu özellikler, daha geniş bir kullanıcı kümesinin bağlı verilerle çalışmasını sağlar.
  • İdare ve güvenlik: Ayrı grafik dağıtımları için bağımsız idare ve güvenlik kurulumları gerekir. Graph, uyumluluk, denetim ve izinlerin Fabric ortamınızın geri kalanıyla tutarlı kalması için OneLake yönetişimi, köken izleme ve çalışma alanı rol tabanlı erişim kontrolünü (RBAC) kullanır.