Azure Cosmos DB 對 Gremlin 圖形資料庫的支援以及與 TinkerPop 功能的相容性

適用於: ✅ Apache Gremlin

Important

您是否正在尋找一種適用於高擴展性場景的資料庫解決方案，且具有 99.999% 可用性的服務等級協定（SLA）、即時自動擴展，以及跨多個區域的自動容錯切換？考慮使用Azure Cosmos DB作為NoSQL的選擇。

您是否想要實作線上分析處理（OLAP）圖表或移轉現有的 Apache Gremlin 應用程式？考慮Microsoft Fabric中的圖表。

Azure Cosmos DB 支援 Apache Tinkerpop 的圖遍歷語言，稱為 Gremlin。您可以使用 Gremlin 語言建立圖表實體 (頂點和邊緣)、修改這些實體內的屬性、執行查詢和周遊，以及刪除實體。

Azure Cosmos DB Graph 引擎緊貼 Apache TinkerPop 遍歷步驟規範，但實作上有針對特定 Azure Cosmos DB 的差異。在本文中，我們提供 Gremlin 的快速逐步解說，並列舉 API for Gremlin 所支援的 Gremlin 功能。

相容的用戶端程式庫

下表展示了你可以用來對抗 Azure Cosmos DB 的熱門 Gremlin 驅動程式：

Download	Source	使用者入門	支援/建議的連接器版本
.NET	Gremlin.NET 在 GitHub	使用 .NET	3.4.13
Java	Gremlin JavaDoc	使用 Java	3.4.13
Python	Gremlin-Python 在GitHub	使用 Python	3.4.13
Gremlin 主控台	TinkerPop 文件	使用 Gremlin 主控台建立圖表	3.4.13
Node.js	在 GitHub 上的 Gremlin-JavaScript	使用 Node.js 建立圖表	3.4.13
PHP	Gremlin-PHP GitHub	使用 PHP 建立圖表	3.1.0
高朗	高朗		此程式庫是由外部參與者所建立。 Azure Cosmos DB 團隊不提供任何支援或維護函式庫。

Note

Gremlin 用戶端驅動程式的 3.5.*、3.6.* 版本有已知的相容性問題，因此建議使用上面所列可支援的最近期 3.4.* 驅動程式版本。當較新版的驅動程式版本解決相容性問題後，將會更新此資料表。

支援的圖形物件

TinkerPop 是一套涵蓋各種圖表技術的標準。因此，它採用標準術語來描述圖表提供者所提供的功能。 Azure Cosmos DB 提供一個持久、高並發、可寫入的圖形資料庫，可分割於多台伺服器或叢集之間。

下表列出 Azure Cosmos DB 實作的 TinkerPop 功能：

類別	Azure Cosmos DB 實施	Notes
圖形特性	提供 Persistence 和 ConcurrentAccess。設計為支援交易	可以透過 Spark 連接器實作電腦方法。
變數功能	支援布林值、整數、位元組、雙精度、浮點數、長整數、字串	支援基本類型、透過資料模型而與複雜類型相容
頂點功能	支援 RemoveVertices、MetaProperties、AddVertices、MultiProperties、StringIds、UserSuppliedIds、AddProperty、RemoveProperty	支援建立、修改和刪除端點
頂點屬性功能	StringIds、UserSuppliedIds、AddProperty、RemoveProperty、BooleanValues、ByteValues、DoubleValues、FloatValues、IntegerValues、LongValues、StringValues	支援建立、修改和刪除頂點屬性
邊緣功能	AddEdges、RemoveEdges、StringIds、UserSuppliedIds、AddProperty、RemoveProperty	支援建立、修改和刪除邊緣
邊緣屬性功能	Properties、BooleanValues、ByteValues、DoubleValues、FloatValues、IntegerValues、LongValues、StringValues	支援建立、修改和刪除邊緣屬性

Gremlin 電傳格式

Azure Cosmos DB 在返回 Gremlin 操作結果時使用 JSON 格式。 Azure Cosmos DB 目前支援 JSON 格式。例如，以下片段展示了從 Azure Cosmos DB 傳送到客戶端的頂點的 JSON 表示法：

  {
    "id": "a7111ba7-0ea1-43c9-b6b2-efc5e3aea4c0",
    "label": "person",
    "type": "vertex",
    "outE": {
      "knows": [
        {
          "id": "3ee53a60-c561-4c5e-9a9f-9c7924bc9aef",
          "inV": "04779300-1c8e-489d-9493-50fd1325a658"
        },
        {
          "id": "21984248-ee9e-43a8-a7f6-30642bc14609",
          "inV": "a8e3e741-2ef7-4c01-b7c8-199f8e43e3bc"
        }
      ]
    },
    "properties": {
      "firstName": [
        {
          "value": "Thomas"
        }
      ],
      "lastName": [
        {
          "value": "Andersen"
        }
      ],
      "age": [
        {
          "value": 45
        }
      ]
    }
  }

JSON 格式用於頂點的屬性說明如下︰

房產	Description
`id`	頂點的識別碼。必須是唯一的 (適合的話，與 `_partition` 的值結合)。如果未提供任何值，則會自動使用 GUID 來提供
`label`	頂點的標籤。此屬性可用來描述實體類型。
`type`	用來區別頂端和非圖表文件
`properties`	與頂點相關聯的使用者定義屬性包。每個屬性可以有多個值。
`_partition`	頂點的資料分割索引鍵。用於圖表分割。
`outE`	此屬性包含頂點的外邊緣清單。儲存頂點的相鄰資訊可以加速周遊。邊緣會根據標籤而分組。

每個屬性可以將多個值儲存在陣列中。

房產	Description
`value`	屬性的值

邊緣還包含下列資訊，有助於瀏覽至圖表的其他部分。

房產	Description
`id`	邊緣的識別碼。必須是唯一的 (適合的話，與 `_partition` 的值結合)
`label`	邊緣的標籤。這是選擇性屬性，用來描述關聯性類型。
`inV`	此屬性包含特定邊緣的頂點清單。儲存邊緣的相鄰資訊可以加速周遊的執行。頂點會根據標籤而分組。
`properties`	與邊緣相關聯的使用者定義屬性包。

Gremlin 步驟

現在讓我們來看看 Azure Cosmos DB 支援的 Gremlin 步驟。如需 Gremlin 的完整參考，請參閱 TinkerPop 參考。

步驟	Description	TinkerPop 3.2 文件
`addE`	在兩個頂點之間新增邊緣	addE 步驟
`addV`	將頂點新增至圖表	addV 步驟
`and`	確保所有周遊都會傳回值	and 步驟
`as`	將變數指派給步驟輸出的步驟調變器	as 步驟
`by`	搭配 `group` 和 `order` 一起使用的步驟調變器	by 步驟
`coalesce`	傳回第一次有傳回結果的周遊	coalesce 步驟
`constant`	傳回常數值。搭配 `coalesce` 使用	constant 步驟
`count`	從周遊傳回計數	count 步驟
`dedup`	傳回已移除重複項的值	dedup 步驟
`drop`	捨棄值 (頂點/邊緣)	drop 步驟
`executionProfile`	會針對已執行的 Gremlin 步驟所產生的所有作業建立描述	`executionProfile` 步驟
`fold`	作為屏障來計算結果的彙總	fold 步驟
`group`	根據指定的標籤將值分組	group 步驟
`has`	用於篩選屬性、頂點和邊緣。支援 `hasLabel`、`hasId`、`hasNot` 和 `has` 變體。	has 步驟
`inject`	將值插入資料流	inject 步驟
`is`	用來執行使用布林運算式的篩選條件	is 步驟
`limit`	用來限制周遊中的項目數	limit 步驟
`local`	局部包裝周遊的一個區段，類似於子查詢	local 步驟
`not`	用來否定篩選條件	not 步驟
`optional`	如果指定的周遊產生結果，則傳回結果，否則傳回呼叫端元素	optional 步驟
`or`	確保至少一個周遊會傳回值	or 步驟
`order`	依指定的排序次序傳回結果	order 步驟
`path`	傳回周遊的完整路徑	path 步驟
`project`	將屬性投射為 Map	project 步驟
`properties`	傳回指定之標籤的屬性	properties 步驟
`range`	篩選為指定的值範圍	range 步驟
`repeat`	將步驟重複執行指定的次數。用於迴圈處理	repeat 步驟
`sample`	用於取樣周遊的結果	sample 步驟
`select`	用於投射周遊的結果	select 步驟
`store`	用於來自周遊的非封鎖彙總	store 步驟
`TextP.startingWith(string)`	字串篩選函式。此函式是作為 `has()` 步驟的述詞使用，以比對屬性與指定字串的開頭	TextP 述詞 \(英文\)
`TextP.endingWith(string)`	字串篩選函式。此函式是作為 `has()` 步驟的述詞使用，以比對屬性與指定字串的結尾	TextP 述詞 \(英文\)
`TextP.containing(string)`	字串篩選函式。此函式是作為 `has()` 步驟的述詞使用，以比對屬性與指定字串的內容	TextP 述詞 \(英文\)
`TextP.notStartingWith(string)`	字串篩選函式。此函式是作為 `has()` 步驟的述詞使用，以比對不是以指定字串開頭的屬性	TextP 述詞 \(英文\)
`TextP.notEndingWith(string)`	字串篩選函式。此函式是作為 `has()` 步驟的述詞使用，以比對不是以指定字串結尾的屬性	TextP 述詞 \(英文\)
`TextP.notContaining(string)`	字串篩選函式。此函式是作為 `has()` 步驟的述詞使用，以比對未包含指定字串的屬性	TextP 述詞 \(英文\)
`tree`	將頂點的路徑彙總至樹狀目錄	tree 步驟
`unfold`	將迭代器展開為步驟	unfold 步驟
`union`	合併來自多個周遊的結果	unfold 步驟
`V`	包含頂點和邊緣之間周遊的必要步驟 `V`、`E`、`out`、`in`、`both`、`outE`、`inE`、`bothE`、`outV`、`inV`、`bothV` 和 `otherV`	vertex 步驟
`where`	用於篩選周遊的結果。支援 `eq`、`neq`、`lt`、`lte`、`gt`、`gte` 和 `between` 運算子	where 步驟

Azure Cosmos DB 提供的寫入優化引擎預設支援頂點與邊內所有屬性的自動索引。因此，在任何屬性上執行附有篩選條件的查詢、範圍查詢、排序或彙總時，都是從索引來處理，而且有效率地提供。欲了解更多有關 Azure Cosmos DB 中索引的運作方式，請參閱我們的論文《與結構無關的索引》。

行為差異

Azure Cosmos DB Graph 引擎以 廣度優先進行遍歷，而 TinkerPop Gremlin 則是深度優先。這種行為在像 Azure Cosmos DB 這類可水平擴展系統中表現更佳。

不支援的功能

Gremlin 位元組程式碼是不限程式設計語言的圖形周遊規格。 Azure Cosmos DB Graph 目前還不支援這個功能。請使用 GremlinClient.SubmitAsync()，並以文字字串的形式傳遞周遊。
目前不支援 property(set, 'xyz', 1) 集合基數。請改用 property(list, 'xyz', 1)。若要深入了解，請參閱 TinkerPop 的頂點屬性。
目前無法使用 match() 步驟。此步驟可提供宣告式查詢功能。
以物件做為屬性在頂點或邊緣上不受支援。屬性只能是基本類型或陣列。
依陣列屬性排序order().by(<array property>)不受支援。僅支援依據基本類型排序。
非基本 JSON 類型不受支援。請使用 string、number 或 true/false 類型。不支援 null 值。
GraphSONv3 序列化程式目前不受支援。在連線設定中，請使用 GraphSONv2 序列化程式、讀取器和寫入器類別。 Azure Cosmos DB 為 Gremlin 所回傳的結果格式與 GraphSON 格式不同。
目前不支援 Lambda 運算式和函式。這包括 .map{<expression>}、.by{<expression>} 和 .filter{<expression>} 函式。若要深入了解，並了解如何使用 Gremlin 步驟來重寫這些函式，請參閱 Lambda 的注意事項。
交易不受支援，這是由於系統的分散式本質所致。在 Gremlin 帳戶上設定適當的一致性模型以「「讀取自己的寫入」，並使用開放式同步存取來解決衝突的寫入。

已知的限制

使用 mid-traversal .V() 步驟所進行的 Gremlin 查詢索引使用率：目前只有周遊的第一個 .V() 呼叫會使用索引來解析其附加的任何篩選或述詞。後續的呼叫則不會查閱索引，這可能會增加查詢的延遲和成本。

採用預設索引編制時，以 .V() 步驟開頭的典型讀取 Gremlin 查詢會在其附加的篩選步驟中使用參數 (例如 .has() 或 .where()) 來將查詢的成本和效能最佳化。例如：

g.V().has('category', 'A')

不過，如果 Gremlin 查詢中包含多個 .V() 步驟，則查詢的資料解析可能不會有最佳效能。以下列查詢為例：

g.V().has('category', 'A').as('a').V().has('category', 'B').as('b').select('a', 'b')

此查詢會根據稱為 category 的屬性，傳回兩個頂點群組。在此情況下，只有第一次呼叫 g.V().has('category', 'A') 會使用索引來根據屬性值解析頂點。

此查詢的因應措施是使用子周遊步驟，例如 .map() 和 union()。舉例如下：

// Query workaround using .map()
g.V().has('category', 'A').as('a').map(__.V().has('category', 'B')).as('b').select('a','b')

// Query workaround using .union()
g.V().has('category', 'A').fold().union(unfold(), __.V().has('category', 'B'))

您可以使用 Gremlin executionProfile() 步驟來檢閱查詢的效能。

意見反應

此頁面對您有幫助嗎？

Last updated on 2026-04-27