複数のストリーミングワークロードにスケジューラプールを使用する

[アーティクル]
05/11/2024

複数のストリーミングクエリでジョブを同時に実行し、共有クラスターでジョブを同時実行するには、別々のスケジューラプールで実行するクエリを構成できます。

スケジューラプールのしくみは?

既定では、ノートブックで開始されたクエリはすべて、同じ公平なスケジュールプールで実行されます。ノートブック内のすべてのストリーミングクエリからトリガーによって生成されたジョブは、先入れ先出し (FIFO) 順に順番に実行されます。これにより、クラスターリソースを効率的に共有しないので、クエリで不要な遅延が発生する可能性があります。

スケジューラプールを使用すると、コンピューティングリソースを共有する構造化ストリーミングクエリを宣言できます。

次の例では、query1 が専用プールに割り当てられ、query2 と query3 でスケジューラプールが共有されます。

# Run streaming query1 in scheduler pool1
spark.sparkContext.setLocalProperty("spark.scheduler.pool", "pool1")
df.writeStream.queryName("query1").format("delta").start(path1)

# Run streaming query2 in scheduler pool2
spark.sparkContext.setLocalProperty("spark.scheduler.pool", "pool2")
df.writeStream.queryName("query2").format("delta").start(path2)

# Run streaming query3 in scheduler pool2
spark.sparkContext.setLocalProperty("spark.scheduler.pool", "pool2")
df.writeStream.queryName("query3").format("delta").start(path3)

注意

ローカルプロパティの構成は、ストリーミングクエリを開始するのと同じノートブックセル内になければなりません。

詳細については、Apache Fair Scheduler のドキュメントを参照してください。

次の方法で共有

複数のストリーミングワークロードにスケジューラプールを使用する

スケジューラプールのしくみは?

フィードバック

フィードバック

その他のリソース

次の方法で共有

複数のストリーミング ワークロードにスケジューラ プールを使用する

スケジューラ プールのしくみは?

フィードバック

フィードバック

その他のリソース

複数のストリーミングワークロードにスケジューラプールを使用する

スケジューラプールのしくみは?