Gremlin グラフのサポートと TinkerPop 機能との互換性に関するAzure Cosmos DB

適用対象: ✅ Apache Gremlin

Important

99.999% 可用性サービスレベルアグリーメント (SLA)、インスタント自動スケール、および複数のリージョン間の自動フェールオーバーを使用した 大規模 なシナリオ向けのデータベースソリューションをお探しですか? [c0]NoSQL 用に Azure Cosmos DB を検討してください。[c0]

オンライン分析処理 (OLAP) グラフを実装するか、既存の Apache Gremlin アプリケーションを移行しますか? Microsoft Fabric のGraphを検討。

Azure Cosmos DB では、Apache Tinkerpop のグラフトラバーサル言語 (Gremlin と呼ばれます) がサポートされます。 Gremlin 言語を使用して、グラフエンティティ (頂点と辺) の作成、エンティティ内のプロパティの変更、クエリとトラバーサルの実行、エンティティの削除を行うことができます。

Azure Cosmos DB Graph エンジンは、Apache TinkerPop トラバーサルステップの仕様に厳密に従いますが、Azure Cosmos DBに固有の実装には違いがあります。この記事では、Gremlin の簡単なチュートリアルを提供し、Gremlin API でサポートされている Gremlin の機能を紹介します。

互換性のあるクライアントライブラリ

次の表は、Azure Cosmos DBに対して使用できる一般的な Gremlin ドライバーを示しています。

ダウンロード	source	はじめに	サポートまたは推奨されているコネクタのバージョン
.NET	GitHub の Gremlin.NET	.NET	3.4.13
Java	Gremlin JavaDoc	Java	3.4.13
Python	GitHub 上の Gremlin-Python	Python	3.4.13
Gremlin コンソール	TinkerPop ドキュメント	Gremlin コンソールを使用してグラフを作成する	3.4.13
Node.js	GitHub上のGremlin-JavaScript	Node.js を使用してグラフを作成する	3.4.13
PHP	GitHub上のGremlin-PHP	PHP を使用してグラフを作成する	3.1.0
Go Lang	Go Lang		このライブラリは、外部の共同作成者によって作成されています。 Azure Cosmos DB チームは、ライブラリのサポートや保守を提供していません。

Note

バージョンが 3.5.*、3.6.* の Gremlin クライアントドライバーには既知の互換性の問題があるため、上記の、サポートされている最新バージョンである 3.4.* ドライバーを使用することをお勧めします。この表は、これらの新しいバージョンのドライバーについて、互換性の問題が対処されたときに更新されます。

サポートされているグラフオブジェクト

TinkerPop は、さまざまなグラフテクノロジに対応する標準です。そのため、グラフプロバイダーによって提供される機能を説明する標準的な用語があります。 Azure Cosmos DBは、複数のサーバーまたはクラスター間でパーティション分割できる、永続的で高いコンカレンシー、書き込み可能なグラフデータベースを提供します。

次の表に、Azure Cosmos DBによって実装される TinkerPop の機能を示します。

カテゴリ	Azure Cosmos DB実装	Notes
グラフ機能	永続化と同時アクセスが提供されます。トランザクションをサポートするように設計されています。	コンピューターのメソッドは、Spark コネクタを介して実装できます。
変数機能	ブール値、整数、Byte、Double、Float、Long、文字列をサポートしています。	プリミティブ型をサポートしています。データモデルを介して複雑な型と互換性があります。
頂点機能	RemoveVertices、MetaProperties、AddVertices、MultiProperties、StringIds、UserSuppliedIds、AddProperty、RemoveProperty をサポートしています。	頂点の作成、変更、削除をサポートしています。
頂点プロパティ機能	StringIds、UserSuppliedIds、AddProperty、RemoveProperty、BooleanValues、ByteValues、DoubleValues、FloatValues、IntegerValues、LongValues、StringValues	頂点プロパティの作成、変更、削除をサポートしています。
辺機能	AddEdges、RemoveEdges、StringIds、UserSuppliedIds、AddProperty、RemoveProperty	辺の作成、変更、削除をサポートしています。
辺プロパティ機能	Properties、BooleanValues、ByteValues、DoubleValues、FloatValues、IntegerValues、LongValues、StringValues	辺プロパティの作成、変更、削除をサポートしています。

Gremlin のワイヤ形式

Azure Cosmos DBは、Gremlin 操作から結果を返すときに JSON 形式を使用します。現在、Azure Cosmos DBは JSON 形式をサポートしています。たとえば、次のスニペットは、Azure Cosmos DBからクライアントに返される頂点の JSON 表現を示しています。

  {
    "id": "a7111ba7-0ea1-43c9-b6b2-efc5e3aea4c0",
    "label": "person",
    "type": "vertex",
    "outE": {
      "knows": [
        {
          "id": "3ee53a60-c561-4c5e-9a9f-9c7924bc9aef",
          "inV": "04779300-1c8e-489d-9493-50fd1325a658"
        },
        {
          "id": "21984248-ee9e-43a8-a7f6-30642bc14609",
          "inV": "a8e3e741-2ef7-4c01-b7c8-199f8e43e3bc"
        }
      ]
    },
    "properties": {
      "firstName": [
        {
          "value": "Thomas"
        }
      ],
      "lastName": [
        {
          "value": "Andersen"
        }
      ],
      "age": [
        {
          "value": 45
        }
      ]
    }
  }

JSON 形式で使用される頂点のプロパティを次に説明します。

プロパティ	説明
`id`	頂点の ID。一意である必要があります (該当する場合は、`_partition` の値との組み合わせにおいて一意である必要があります)。値が指定されていない場合は、GUID が自動的に提供されます
`label`	頂点のラベル。このプロパティは、エンティティの種類を示すために使用します。
`type`	頂点とグラフ以外のドキュメントを区別するために使用します。
`properties`	頂点に関連付けられているユーザー定義プロパティのバッグ。各プロパティには複数の値を指定できます。
`_partition`	頂点のパーティションキー。グラフのパーティション分割に使用されます。
`outE`	このプロパティには、頂点からの外向きの辺のリストが含まれます。頂点と共に隣接情報を格納することで、トラバーサルの高速実行が可能になります。辺はラベルに基づいてグループ化されます。

各プロパティでは、配列内に複数の値を格納できます。

プロパティ	説明
`value`	プロパティの値。

辺には、グラフの他の部分へのナビゲーションに役立つ次の情報が含まれています。

プロパティ	説明
`id`	辺の ID。一意である必要があります (該当する場合は、`_partition` の値との組み合わせにおいて一意である必要があります)
`label`	辺のラベル。このプロパティは省略可能です。関係の種類を示すために使用します。
`inV`	このプロパティには、辺の頂点一覧が含まれています。辺と共に隣接情報を格納することで、トラバーサルの高速実行が可能になります。頂点はラベルに基づいてグループ化されます。
`properties`	辺に関連付けられているユーザー定義プロパティのバッグ。

Gremlin のステップ

次に、Azure Cosmos DBでサポートされている Gremlin の手順を見てみましょう。 Gremlin の完全なリファレンスについては、TinkerPop リファレンスをご覧ください。

ステップ	説明	TinkerPop 3.2 ドキュメント
`addE`	2 つの頂点の間に辺を追加します。	addE ステップ
`addV`	グラフに頂点を追加します。	addV ステップ
`and`	すべてのトラバーサルが値を返すようにします。	and ステップ
`as`	ステップの出力に変数を割り当てるステップモジュレーター。	as ステップ
`by`	`group` および `order` と共に使用するステップモジュレーター。	by ステップ
`coalesce`	結果を返す最初のトラバーサルを返します。	coalesce ステップ
`constant`	定数値を返します。 `coalesce` と共に使用します。	constant ステップ
`count`	トラバーサルからカウントを返します。	count ステップ
`dedup`	重複を削除して値を返します。	dedup ステップ
`drop`	値 (頂点/辺) を破棄します。	drop ステップ
`executionProfile`	実行された Gremlin ステップによって生成されたすべての操作の記述を作成します	`executionProfile` ステップ
`fold`	結果の集計を計算するバリアとして機能します。	fold ステップ
`group`	指定されたラベルに基づいて値をグループ化します。	group ステップ
`has`	プロパティ、頂点、辺をフィルター処理するときに使用します。 `hasLabel`、`hasId`、`hasNot`、`has` の各バリアントをサポートします。	has ステップ
`inject`	値をストリームに挿入します。	inject ステップ
`is`	ブール式を使用してフィルターを実行するときに使用します。	is ステップ
`limit`	トラバーサルで項目の数を制限するときに使用します。	limit ステップ
`local`	サブクエリと同様に、トラバーサルのセクションをローカルでラップします。	local ステップ
`not`	フィルターの否定を生成するときに使用します。	not ステップ
`optional`	指定されたトラバーサルの結果が生成された場合は、その結果を返します。それ以外の場合は、呼び出し元の要素を返します。	optional ステップ
`or`	少なくとも 1 つのトラバーサルで値が返されるようにします。	or ステップ
`order`	指定された並べ替え順序で結果を返します。	order ステップ
`path`	トラバーサルの完全なパスを返します。	path ステップ
`project`	プロパティをマップとして投影します。	project ステップ
`properties`	指定されたラベルのプロパティを返します。	properties ステップ
`range`	値の指定された範囲にフィルターを適用します。	range ステップ
`repeat`	ステップを指定された回数繰り返します。ループに使用します。	repeat ステップ
`sample`	トラバーサルの結果をサンプリングするときに使用します。	sample ステップ
`select`	トラバーサルの結果を予想するときに使用します。	select ステップ
`store`	トラバーサルの非ブロッキング集計に使用します。	store ステップ
`TextP.startingWith(string)`	文字列フィルター処理関数。この関数は、指定された文字列で始まるプロパティを照合するための `has()` ステップの述語として使用されます。	TextP 述語
`TextP.endingWith(string)`	文字列フィルター処理関数。この関数は、指定された文字列で終わるプロパティを照合するための `has()` ステップの述語として使用されます。	TextP 述語
`TextP.containing(string)`	文字列フィルター処理関数。この関数は、指定された文字列の内容を含むプロパティを照合するための `has()` ステップの述語として使用されます。	TextP 述語
`TextP.notStartingWith(string)`	文字列フィルター処理関数。この関数は、指定された文字列で始まらないプロパティを照合するための `has()` ステップの述語として使用されます。	TextP 述語
`TextP.notEndingWith(string)`	文字列フィルター処理関数。この関数は、指定された文字列で終わらないプロパティを照合するための `has()` ステップの述語として使用されます。	TextP 述語
`TextP.notContaining(string)`	文字列フィルター処理関数。この関数は、指定された文字列を含んでいないプロパティを照合するための `has()` ステップの述語として使用されます。	TextP 述語
`tree`	頂点からのパスを集計してツリーを形成します。	tree ステップ
`unfold`	反復子をステップとしてアンロールします。	unfold ステップ
`union`	複数のトラバーサルの結果をマージします。	union ステップ
`V`	頂点および辺の間でのトラバーサルに必要なステップ (`V`、`E`、`out`、`in`、`both`、`outE`、`inE`、`bothE`、`outV`、`inV`、`bothV`、`otherV`) が含まれています。	vertex ステップ
`where`	トラバーサルの結果をフィルター処理するときに使用します。 `eq`、`neq`、`lt`、`lte`、`gt`、`gte`、`between` の各演算子をサポートします。	where ステップ

Azure Cosmos DBによって提供される書き込み最適化エンジンでは、頂点とエッジ内のすべてのプロパティの自動インデックス作成が既定でサポートされています。そのため、任意のプロパティでのフィルターを使用するクエリ、範囲クエリ、並べ替え、または集計は、インデックスに基づいて処理され、効率的に提供されます。 Azure Cosmos DBでのインデックス作成のしくみの詳細については、schema に依存しないインデックス作成に関する記事を参照してください。

動作の違い

Azure Cosmos DB Graph エンジンは、breadth-first トラバーサルを実行しますが、TinkerPop Gremlin は深度優先です。この動作により、Azure Cosmos DBなどの水平方向にスケーラブルなシステムのパフォーマンスが向上します。

サポートされていない機能

Gremlin バイトコードは、プログラミング言語に依存しない、グラフトラバーサルの仕様です。 Azure Cosmos DB Graph では、まだサポートされていません。 GremlinClient.SubmitAsync() を使用して、トラバーサルをテキスト文字列として渡してください。
property(set, 'xyz', 1) set カーディナリティは現在サポートされていません。代わりに property(list, 'xyz', 1) を使用してください詳細については、TinkerPop での頂点プロパティに関する記事を参照してください。
match() ステップは、現在利用できません。このステップでは、宣言型のクエリ機能が提供されます。
頂点または辺のプロパティとしてのオブジェクトはサポートされていません。プロパティには、プリミティブ型または配列のみを指定できます。
配列プロパティによる並べ替えorder().by(<array property>)はサポートされていません。プリミティブ型での並べ替えのみがサポートされています。
非プリミティブ JSON 型はサポートされていません。 string 型、number 型、または true/false 型を使用してください。 null 値はサポートされていません。
GraphSONv3 シリアライザーは現在サポートされていません。接続構成で GraphSONv2 シリアライザー、リーダー、およびライタークラスを使用してください。 Gremlin のAzure Cosmos DBによって返される結果は、GraphSON 形式と同じ形式を持っていません。
ラムダ式と関数は現在サポートされていません。これには、.map{<expression>}、.by{<expression>}、および .filter{<expression>} 関数が含まれます。詳細について、および Gremlin の手順を使用してこれらを書き換える方法については、ラムダ式に関する注意事項に関する記事を参照してください。
システムの分散型の性質により、トランザクションはサポートされていません。 Gremlin アカウントで "自分の書き込みを読み取る" ように適切な整合性モデルを構成し、オプティミスティック同時実行制御を使用して、競合する書き込みを解決してください。

既知の制限事項

トラバーサル中の .V() ステップによる Gremlin クエリのインデックス使用率: 現時点では、トラバーサルの最初の .V() 呼び出しのみによって、アタッチされているフィルターまたは述語を解決するために、インデックスが利用されます。後続の呼び出しでは、インデックスが参照されないため、クエリの待機時間とコストが増加する可能性があります。

既定のインデックス作成を前提とすると、.V() ステップによって開始された通常の読み取り Gremlin クエリでは、.has() や .where() など、アタッチされたフィルター処理のステップの中でパラメーターが使用され、クエリのコストとパフォーマンスが最適化されます。次に例を示します。

g.V().has('category', 'A')

ただし、2 つ以上の .V() ステップが Gremlin クエリ内に含まれている場合、そのクエリのデータの解決は最適でない可能性があります。例として、次のクエリを取り上げます。

g.V().has('category', 'A').as('a').V().has('category', 'B').as('b').select('a', 'b')

このクエリでは、category というプロパティに基づいて、2 つの頂点のグループが返されます。この場合、最初の呼び出しの g.V().has('category', 'A') のみによって、インデックスが使用され、プロパティの値に基づいて頂点が解決されます。

このクエリでの回避策は、.map() および union() などのサブトラバーサルステップを使用することです。これは、以下のように例示されます。

// Query workaround using .map()
g.V().has('category', 'A').as('a').map(__.V().has('category', 'B')).as('b').select('a','b')

// Query workaround using .union()
g.V().has('category', 'A').fold().union(unfold(), __.V().has('category', 'B'))

Gremlin executionProfile() 手順を使用して、クエリのパフォーマンスを確認できます。

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-04-21