備註
這項功能目前處於公開預覽狀態。 此預覽版是在沒有服務等級協定的情況下提供,不建議用於生產工作負載。 可能不支援特定功能,或可能已經限制功能。 如需詳細資訊,請參閱 Microsoft Azure 預覽版增補使用條款。
圖形資料庫將資料建模為連接實體和關係的網路。 最常使用的圖形數據庫類型採用標記屬性圖模型:實體(節點)和關係(邊)可以有標籤和屬性(鍵值對)。 此彈性模型可啟用結構描述選擇性和結構描述驅動設計,並可讓您表達豐富的語意。 由於連線會明確儲存為邊緣,因此查詢會透過追蹤邊緣來周遊關係,而不是在查詢時計算昂貴的聯結。
圖形資料庫核心概念
- 節點代表人、產品或地點等事物。 節點可以具有描述其屬性的標籤和屬性。
- 邊緣代表這些事物的連接方式,例如 FRIENDS_WITH、PURCHASED 或 LOCATED_IN。 Edge 也可以攜帶屬性和標籤來編碼關係中繼資料。
- 屬性將詳細資料附加至節點和邊(例如,人員的姓名或邊的起始日期)。 由於關聯性會明確儲存為邊緣,因此查詢會透過追蹤連線來導覽圖形,而不是在查詢時計算它們。
查詢關係的運作方式
圖形查詢會透過從起始節點遍歷其鄰居節點,然後遍歷其鄰居,依此類推來擷取連線的資訊。 遍歷執行的工作量與它接觸的邊緣數量 (本地鄰域) 相關,而不是資料集的總大小。 這使得有關路徑、連結和模式(例如朋友的朋友、最短路徑或多跳依賴關係)的問題能夠自然且有效率地表達。
圖資料庫使用基於模式的查詢語言,例如越來越多地採用的 圖查詢語言(GQL)來簡潔地描述這些遍歷。 GQL 正在由監督 SQL (ISO/IEC 39075) 的同一國際工作組標準化,使圖形查詢與既定的資料庫標準保持一致。
範例 (使用 GQL 進行模式比對):
MATCH (p:Person {name: "Alice"})-[:FRIENDS_WITH]->(friend)-[:PURCHASED]->(o:Order)
RETURN o
此模式表現為:從 Alice 的 Person 節點開始,跟隨 FRIENDS_WITH 邊到每個朋友,然後跟隨 PURCHASED 邊到相關的 Order 節點,並返回這些訂單。
建模和結構描述
圖形資料模型是結構描述選擇性的:當您需要強式控管時,您可以使用固定結構描述,或隨著新節點類型、關聯性或屬性的出現而發展模型。 這種方法減少了資料複製的需求,並允許團隊統一來自多個來源的資料,而無需大量的前期重新設計。
圖形資料庫的常見用途
圖形資料庫與連接驅動價值的領域密切相關,例如社交網路、知識圖譜、推薦系統、詐欺和風險網路、網路和 IT 拓撲,以及供應鏈依賴性分析。 在這些案例中,問題不是單一記錄,而是有多少實體在數個躍點上關聯和互動。
何時考慮圖形資料庫
當您的主要問題涉及連接資料中的路徑、鄰域和模式時,請選擇圖形資料庫;當跳數可變或事先不知道時;或者當您需要合併和導覽不同資料集之間的關係時。 如果這些是您需要重複回答的問題,那麼圖形模型是自然而然的選擇。
ETL 呢?
將資料表示為圖形並將其儲存在單獨的獨立圖形資料庫中,通常會引入 ETL 和治理額外負荷。 相比之下,Microsoft Fabric 中的圖形直接在 OneLake 上運行,這減少或消除了單獨的 ETL 管線和數據重複的需求。 請考慮以下取捨:
- 資料移動和複製:獨立的圖形資料庫通常需要將資料擷取、轉換和載入 (ETL) 到單獨的儲存中,這會增加複雜性並可能導致資料集重複。 Microsoft Fabric 中的圖形會在 OneLake 上運作,因此您可以建立模型和查詢連線的資料,而不需要移動它。
- 營運成本:獨立圖形堆疊作為單獨的叢集或服務執行,並且通常會收取閒置容量費用。 Fabric 中的圖形工作負載消耗集區容量單位(CU),這些單位具備自動縮減和集中式計量功能,從而簡化作業並降低成本。
- 可擴展性:一些獨立的圖形資料庫依賴於縱向擴展或特定於供應商的叢集。 Microsoft Fabric 中的圖是專為大規模圖設計的,並使用跨多個工作者的橫向擴展分片來有效率地處理大數據工作負載。
- 工具和技能:特定於供應商的圖形系統可能需要專門的語言和單獨的分析框架。 Microsoft Fabric 中的圖形提供統一的模型化、標準型查詢 (GQL)、內建圖形分析演算法、BI 和 AI 整合,以及低/無程式碼探索工具,讓更廣泛的使用者可以使用連線的資料。
- 治理與安全性:個別的圖形部署需要獨立的治理和安全設定。 Microsoft Fabric 中的 Graph 會使用 OneLake 治理、譜系和工作區角色型存取控制 (RBAC),因此合規性、稽核和許可權會與 Fabric 環境的其餘部分保持一致。