共用方式為


什麼是圖形資料庫?

備註

這項功能目前處於公開預覽狀態。 此預覽版是在沒有服務等級協定的情況下提供,不建議用於生產工作負載。 可能不支援特定功能,或可能已經限制功能。 如需詳細資訊,請參閱 Microsoft Azure 預覽版增補使用條款

圖資料庫提供了一種強大的方式來建模與查詢連結資料。 與傳統將資料存放在表格中的關聯式資料庫不同,圖式資料庫以節點(實體)與邊(關係)來表示資訊,使得更靈活地探索複雜的連結與模式。

最常用的圖資料庫類型實作了 標籤屬性圖 (LPG)模型:實體(節點)與關係(邊)可以有標籤與屬性(鍵值對)。 此彈性模型可啟用結構描述選擇性和結構描述驅動設計,並可讓您表達豐富的語意。 由於連線會明確儲存為邊緣,因此查詢會透過追蹤邊緣來周遊關係,而不是在查詢時計算昂貴的聯結。

這很重要

本文僅使用 社群網路範例圖集

圖形資料庫核心概念

  • 節點 代表實體,如人、產品或地點。 節點可以具有描述其屬性的標籤和屬性。 例如,Person 節點可能有 firstName、lastName 和 age 等屬性。
  • 邊緣 代表實體之間的連結方式,例如 FRIENDS_WITH、已購買 或 LOCATED_IN。 Edge 也可以攜帶屬性和標籤來編碼關係中繼資料。
  • 屬性 會將細節附加到節點和邊上(例如,某人的名字或某條邊的起始日期)。 由於關聯性會明確儲存為邊緣,因此查詢會透過追蹤連線來導覽圖形,而不是在查詢時計算它們。

查詢關係的運作方式

圖形查詢會透過從起始節點遍歷其鄰居節點,然後遍歷其鄰居,依此類推來擷取連線的資訊。 遍歷執行的工作量與它接觸的邊緣數量 (本地鄰域) 相關,而不是資料集的總大小。 這使得有關路徑、連結和模式(例如朋友的朋友、最短路徑或多跳依賴關係)的問題能夠自然且有效率地表達。

圖資料庫使用基於模式的查詢語言,例如越來越多地採用的 圖查詢語言(GQL)來簡潔地描述這些遍歷。 GQL 正在由監督 SQL (ISO/IEC 39075) 的同一國際工作組標準化,使圖形查詢與既定的資料庫標準保持一致。

範例 (使用 GQL 進行模式比對):

MATCH (p:Person {firstName: "Annemarie"})-[:knows]->(friend)-[:likes]->(c:Comment)
RETURN c
ORDER BY c.creationDate
LIMIT 100

這個模式的讀法是:從 Annemarie 的 Person 節點開始,沿著 :knows 邊走到每個朋友節點,然後沿著 :likes 邊走到相關的 :Comment 節點。 請回傳這些評論中,依創建日期排序的 100 則最新留言。

建模和結構描述

圖形資料模型是結構描述選擇性的:當您需要強式控管時,您可以使用固定結構描述,或隨著新節點類型、關聯性或屬性的出現而發展模型。 這種方法減少了資料複製的需求,並允許團隊統一來自多個來源的資料,而無需大量的前期重新設計。

圖形資料庫的常見用途

圖資料庫與連結驅動價值的領域高度契合,例如:

  • 社交網路
  • 知識圖譜
  • 推薦系統
  • 詐騙與風險網絡
  • 網路與資訊技術拓撲
  • 供應鏈依賴性分析

在這些案例中,問題不是單一記錄,而是有多少實體在數個躍點上關聯和互動。

何時考慮圖形資料庫

選擇圖形資料庫時:

  • 你主要的問題是關於連結資料中的路徑、鄰里和模式
  • 跳數會變動或事先不確定
  • 你需要結合並導航跨不同資料集的關係

如果你經常問這類問題,圖形模型自然會很適合。

Microsoft Fabric 中的圖形

將資料表示為圖形並儲存在獨立的圖資料庫中,通常會引入 ETL(提取、轉換、載入)及治理負擔。 相比之下,Microsoft Fabric 中的 Graph 直接在 OneLake 上運行,這減少或消除了單獨的 ETL 管線和數據複製的需求。 請考慮以下取捨:

  • 資料移動與重複:獨立的圖資料庫通常需要擷取、轉換並載入資料到獨立的儲存庫,這增加了複雜度,可能導致資料集重複。 Microsoft Fabric 中的圖形會在 OneLake 上運作,因此您可以建立模型和查詢連線的資料,而不需要移動它。
  • 營運成本:獨立圖形堆疊作為單獨的叢集或服務執行,並且通常會收取閒置容量費用。 Fabric 中的圖形工作負載消耗集區容量單位(CU),這些單位具備自動縮減和集中式計量功能,從而簡化作業並降低成本。
  • 擴展性:一些獨立的圖形資料庫依賴於縱向擴展或特定於供應商的叢集。 Microsoft Fabric 中的圖是專為大規模圖設計的,並使用跨多個工作者的橫向擴展分片來有效率地處理大數據工作負載。
  • 工具與技能:廠商專屬的圖系統可能需要專門語言及獨立的分析框架。 Microsoft Fabric 中的圖形提供統一建模、標準基礎查詢(GQL)、內建圖分析演算法、商業智慧與人工智慧整合,以及低程式碼/無程式碼探索工具。 這些功能讓更廣泛的使用者能夠使用連網資料。
  • 治理與安全性:獨立的圖部署需要獨立的治理與安全設定。 Microsoft Fabric 中的 Graph 會使用 OneLake 治理、譜系和工作區角色型存取控制 (RBAC),因此合規性、稽核和許可權會與 Fabric 環境的其餘部分保持一致。