Azure Stream Analytics と Fabric Eventstream の一般的なクエリパターン

注

Fabric Eventstream は、Azure Stream Analytics と同じランタイム上に構築されます。そのため、この記事で説明する概念は、Azure Stream Analytics と Fabric Eventstream の両方に適用できます。

Azure Stream Analytics のクエリは、SQL に似たクエリ言語で表されます。言語構成体については、 Stream Analytics クエリ言語リファレンスガイドに記載されています。

クエリ設計では、イベントデータを 1 つの入力ストリームから出力データストアに移動する単純なパススルーロジックを表現できます。また、「 Stream Analytics を使用して IoT ソリューションを構築する」ガイドのように、豊富なパターンマッチングとテンポラル分析を実行してさまざまな時間枠で集計を計算することもできます。複数の入力のデータを結合してストリーミングイベントを結合したり、静的参照データに対して検索を実行してイベント値を強化したりできます。複数の出力にデータを書き込むこともできます。

この記事では、実際のシナリオに基づくいくつかの一般的なクエリパターンの解決策について説明します。

サポートされているデータ形式

Azure Stream Analytics では、CSV、JSON、および Avro データ形式でのイベントの処理がサポートされています。 JSON 形式と Avro 形式には、入れ子になったオブジェクト (レコード) や配列などの複合型を含めることができます。これらの複雑なデータ型の操作の詳細については、「 JSON および AVRO データの解析」を参照してください。

複数の出力にデータを送信する

複数の SELECT ステートメントを使用して、異なる出力シンクにデータを出力できます。たとえば、1 つの SELECT ステートメントでしきい値ベースのアラートを出力し、別の SELECT ステートメントでイベントを BLOB ストレージに出力できます。

次の入力を検討してください。

| Make | Time |
| --- | --- |
| Make1 |2023-01-01T00:00:01.0000000Z |
| Make1 |2023-01-01T00:00:02.0000000Z |
| Make2 |2023-01-01T00:00:01.0000000Z |
| Make2 |2023-01-01T00:00:02.0000000Z |
| Make2 |2023-01-01T00:00:03.0000000Z |

また、クエリから次の 2 つの出力が必要です。

ArchiveOutput:

| Make | Time |
| --- | --- |
| Make1 |2023-01-01T00:00:01.0000000Z |
| Make1 |2023-01-01T00:00:02.0000000Z |
| Make2 |2023-01-01T00:00:01.0000000Z |
| Make2 |2023-01-01T00:00:02.0000000Z |
| Make2 |2023-01-01T00:00:03.0000000Z |

AlertOutput:

| Make | Time | Count |
| --- | --- | --- |
| Make2 |2023-01-01T00:00:10.0000000Z |3 |

アーカイブ出力とアラート出力を出力として使用する 2 つの SELECT ステートメントを使用したクエリ:

SELECT
	*
INTO
	ArchiveOutput
FROM
	Input TIMESTAMP BY Time

SELECT
	Make,
	System.TimeStamp() AS Time,
	COUNT(*) AS [Count]
INTO
	AlertOutput
FROM
	Input TIMESTAMP BY Time
GROUP BY
	Make,
	TumblingWindow(second, 10)
HAVING
	[Count] >= 3

INTO 句は、データの書き込み先の出力を Stream Analytics サービスに通知します。最初の SELECT は、入力からデータを受け取り、 ArchiveOutput という名前の出力に送信するパススルークエリを定義します。 2 番目のクエリでは、 結果を AlertOutput と呼ばれるダウンストリームのアラートシステム出力に送信する前に、データを集計してフィルター処理します。

WITH 句を使用して、複数のサブクエリブロックを定義できます。このオプションには、入力ソースへの読者のアクセスを限定する利点があります。

クエリ:

WITH ReaderQuery AS (
	SELECT
		*
	FROM
		Input TIMESTAMP BY Time
)

SELECT * INTO ArchiveOutput FROM ReaderQuery

SELECT 
	Make,
	System.TimeStamp() AS Time,
	COUNT(*) AS [Count] 
INTO AlertOutput 
FROM ReaderQuery
GROUP BY
	Make,
	TumblingWindow(second, 10)
HAVING [Count] >= 3

詳細については、 WITH 句を参照してください。

単純なパススルークエリ

単純なパススルークエリを使用して、入力ストリームデータを出力にコピーできます。たとえば、リアルタイムの車両情報を含むデータストリームを後で分析するために SQL データベースに保存する必要がある場合、単純なパススルークエリによってジョブが実行されます。

次の入力を検討してください。

| Make | Time | Weight |
| --- | --- | --- |
| Make1 |2023-01-01T00:00:01.0000000Z |"1000" |
| Make1 |2023-01-01T00:00:02.0000000Z |"2000" |

出力を入力と同じにする必要があります。

| Make | Time | Weight |
| --- | --- | --- |
| Make1 |2023-01-01T00:00:01.0000000Z |"1000" |
| Make1 |2023-01-01T00:00:02.0000000Z |"2000" |

クエリを次に示します。

SELECT
	*
INTO Output
FROM Input

この SELECT * クエリは、受信イベント のすべての フィールドを投影し、出力に送信します。代わりに、 SELECT ステートメントに必要なフィールドのみを射写できます。次の例では、 SELECT ステートメントは入力データの Make フィールドと Time フィールドのみを投影します。

次の入力を検討してください。

| Make | Time | Weight |
| --- | --- | --- |
| Make1 |2023-01-01T00:00:01.0000000Z |1000 |
| Make1 |2023-01-01T00:00:02.0000000Z |2000 |
| Make2 |2023-01-01T00:00:04.0000000Z |1500 |

出力に [作成] フィールドと [時刻] フィールドのみを含める必要があります。

| Make | Time |
| --- | --- |
| Make1 |2023-01-01T00:00:01.0000000Z |
| Make1 |2023-01-01T00:00:02.0000000Z |
| Make2 |2023-01-01T00:00:04.0000000Z |

必須フィールドのみを投影する クエリ を次に示します。

SELECT
	Make, Time
INTO Output
FROM Input

LIKE と NOT LIKE を使用した文字列の一致

LIKE および NOT LIKE を使用して、フィールドが特定のパターンと一致するかどうかを確認できます。たとえば、フィルターを使用して、文字 A で始まり、 9番号で終わるナンバープレートのみを返すことができます。

次の入力を検討してください。

| Make | License_plate | Time |
| --- | --- | --- |
| Make1 |ABC-123 |2023-01-01T00:00:01.0000000Z |
| Make2 |AAA-999 |2023-01-01T00:00:02.0000000Z |
| Make3 |ABC-369 |2023-01-01T00:00:03.0000000Z |

出力には、文字で始まり、A番号で終わるライセンスプレートが9です。

| Make | License_plate | Time |
| --- | --- | --- |
| Make2 |AAA-999 |2023-01-01T00:00:02.0000000Z |
| Make3 |ABC-369 |2023-01-01T00:00:03.0000000Z |

LIKE 演算子を使用する クエリ を次に示します。

SELECT
	*
FROM
	Input TIMESTAMP BY Time
WHERE
	License_plate LIKE 'A%9'

LIKE ステートメントを使用して、License_plateフィールド値を確認します。文字 Aで始まり、0 個以上の文字の任意の文字列が 9 で終わる必要があります。

過去のイベントに対する計算

LAG 関数を使用すると、時間枠内の過去のイベントを確認し、現在のイベントと比較できます。たとえば、料金所ブースを通過した最後の自動車のメーカーと異なる場合は、現在の車のメーカーを出力できます。

サンプル入力:

| Make | Time |
| --- | --- |
| Make1 |2023-01-01T00:00:01.0000000Z |
| Make2 |2023-01-01T00:00:02.0000000Z |

サンプル出力:

| Make | Time |
| --- | --- |
| Make2 |2023-01-01T00:00:02.0000000Z |

サンプル クエリ:

SELECT
	Make,
	Time
FROM
	Input TIMESTAMP BY Time
WHERE
	LAG(Make, 1) OVER (LIMIT DURATION(minute, 1)) <> Make

LAG を使用して入力ストリームを1つ前のイベントまで遡り、Make 値を取得して現在のイベントの Make 値と比較した上でイベントを出力します。

詳細については、 LAG を参照してください。

ウィンドウ内の最後のイベントを返す

イベントはシステムによってリアルタイムで消費されるため、イベントがその時間枠に到着する最後のイベントであるかどうかを判断できる関数はありません。これを実現するには、入力ストリームを別のストリームと結合する必要があります。イベントの時刻は、そのウィンドウのすべてのイベントの最大時間です。

サンプル入力:

| License_plate | Make | Time |
| --- | --- | --- |
| DXE 5291 |Make1 |2023-07-27T00:00:05.0000000Z |
| YZK 5704 |Make3 |2023-07-27T00:02:17.0000000Z |
| RMV 8282 |Make1 |2023-07-27T00:05:01.0000000Z |
| YHN 6970 |Make2 |2023-07-27T00:06:00.0000000Z |
| VFE 1616 |Make2 |2023-07-27T00:09:31.0000000Z |
| QYF 9358 |Make1 |2023-07-27T00:12:02.0000000Z |
| MDR 6128 |Make4 |2023-07-27T00:13:45.0000000Z |

2 つの 10 分間の時間枠内の最後の車に関する情報を含む サンプル出力 :

| License_plate | Make | Time |
| --- | --- | --- |
| VFE 1616 |Make2 |2023-07-27T00:09:31.0000000Z |
| MDR 6128 |Make4 |2023-07-27T00:13:45.0000000Z |

サンプル クエリ:

WITH LastInWindow AS
(
	SELECT 
		MAX(Time) AS LastEventTime
	FROM 
		Input TIMESTAMP BY Time
	GROUP BY 
		TumblingWindow(minute, 10)
)

SELECT 
	Input.License_plate,
	Input.Make,
	Input.Time
FROM
	Input TIMESTAMP BY Time 
	INNER JOIN LastInWindow
	ON DATEDIFF(minute, Input, LastInWindow) BETWEEN 0 AND 10
	AND Input.Time = LastInWindow.LastEventTime

クエリの最初の手順では、10 分間のウィンドウ (つまり、そのウィンドウの最後のイベントのタイムスタンプ) の最大タイムスタンプを検索します。 2 番目の手順では、最初のクエリの結果を元のストリームと結合して、各ウィンドウの最後のタイムスタンプと一致するイベントを見つけます。

DATEDIFF は、2 つの DateTime フィールド間の時間差を比較して返す日付固有の関数です。詳細については、日付関数を参照してください。

ストリームの結合の詳細については、「 JOIN」を参照してください。

時間の経過に伴うデータ集計

時間枠内の情報を計算するには、データを集計します。この例では、ステートメントは、特定の自動車メーカーごとに過去10秒間のカウントを計算します。

サンプル入力:

| Make | Time | Weight |
| --- | --- | --- |
| Make1 |2023-01-01T00:00:01.0000000Z |1000 |
| Make1 |2023-01-01T00:00:02.0000000Z |2000 |
| Make2 |2023-01-01T00:00:04.0000000Z |1500 |

サンプル出力:

| Make | Count |
| --- | --- |
| Make1 | 2 |
| Make2 | 1 |

クエリ:

SELECT
	Make,
	COUNT(*) AS Count
FROM
	Input TIMESTAMP BY Time
GROUP BY
	Make,
	TumblingWindow(second, 10)

この集計では、自動車が Make ごとにグループ化され、10 秒ごとにカウントされます。出力には、料金所ブースを通過した自動車の メーカー と数があります。

TumblingWindow は、イベントをグループ化するために使用されるウィンドウ関数です。集計は、グループ化されたすべてのイベントに適用できます。詳細については、ウィンドウ関数を参照してください。

集計の詳細については、集計関数を参照してください。

定期的に値を出力する

イベントが見つからない場合や不規則な場合は、よりスパースなデータ入力から定期的な間隔の出力を生成できます。たとえば、最近見たデータポイントを報告するイベントを 5 秒ごとに生成します。

サンプル入力:

| Time | Value |
| --- | --- |
| "2014-01-01T06:01:00" |1 |
| "2014-01-01T06:01:05" |2 |
| "2014-01-01T06:01:10" |3 |
| "2014-01-01T06:01:15" |4 |
| "2014-01-01T06:01:30" |5 |
| "2014-01-01T06:01:35" |6 |

サンプル出力 (最初の 10 行):

| Window_end | Last_event.Time | Last_event.Value |
| --- | --- | --- |
| 2014-01-01T14:01:00.000Z |2014-01-01T14:01:00.000Z |1 |
| 2014-01-01T14:01:05.000Z |2014-01-01T14:01:05.000Z |2 |
| 2014-01-01T14:01:10.000Z |2014-01-01T14:01:10.000Z |3 |
| 2014-01-01T14:01:15.000Z |2014-01-01T14:01:15.000Z |4 |
| 2014-01-01T14:01:20.000Z |2014-01-01T14:01:15.000Z |4 |
| 2014-01-01T14:01:25.000Z |2014-01-01T14:01:15.000Z |4 |
| 2014-01-01T14:01:30.000Z |2014-01-01T14:01:30.000Z |5 |
| 2014-01-01T14:01:35.000Z |2014-01-01T14:01:35.000Z |6 |
| 2014-01-01T14:01:40.000Z |2014-01-01T14:01:35.000Z |6 |
| 2014-01-01T14:01:45.000Z |2014-01-01T14:01:35.000Z |6 |

サンプル クエリ:

SELECT
	System.Timestamp() AS Window_end,
	TopOne() OVER (ORDER BY Time DESC) AS Last_event
FROM
	Input TIMESTAMP BY Time
GROUP BY
	HOPPINGWINDOW(second, 300, 5)

このクエリでは、5 秒ごとにイベントが生成され、以前に受信した最後のイベントが出力されます。 HOPPINGWINDOW 期間は、クエリが最新のイベントを検索するためにどの程度戻るかを決定します。

詳細については、「ホッピングウィンドウ」を参照してください。

ストリーム内のイベントを関連付ける

同じストリーム内のイベントの関連付けは、 LAG 関数を使用して過去のイベントを調べることで行うことができます。たとえば、同じ Make から 2 台の連続する車が過去 90 秒間に料金所ブースを通過するたびに、出力を生成できます。

サンプル入力:

| Make | License_plate | Time |
| --- | --- | --- |
| Make1 |ABC-123 |2023-01-01T00:00:01.0000000Z |
| Make1 |AAA-999 |2023-01-01T00:00:02.0000000Z |
| Make2 |DEF-987 |2023-01-01T00:00:03.0000000Z |
| Make1 |GHI-345 |2023-01-01T00:00:04.0000000Z |

サンプル出力:

| Make | Time | Current_car_license_plate | First_car_license_plate | First_car_time |
| --- | --- | --- | --- | --- |
| Make1 |2023-01-01T00:00:02.0000000Z |AAA-999 |ABC-123 |2023-01-01T00:00:01.0000000Z |

サンプル クエリ:

SELECT
	Make,
	Time,
	License_plate AS Current_car_license_plate,
	LAG(License_plate, 1) OVER (LIMIT DURATION(second, 90)) AS First_car_license_plate,
	LAG(Time, 1) OVER (LIMIT DURATION(second, 90)) AS First_car_time
FROM
	Input TIMESTAMP BY Time
WHERE
	LAG(Make, 1) OVER (LIMIT DURATION(second, 90)) = Make

LAG 関数は、入力ストリームを 1 つのイベントに戻して確認し、Make 値を取得し、現在のイベントの Make 値と比較できます。条件が満たされると、SELECT ステートメントで LAG を使用して前のイベントのデータを投影できます。

詳細については、 LAG を参照してください。

イベント間の期間を検出する

イベントの期間は、End イベントが受信された後の最後の Start イベントを調べることで計算できます。このクエリは、ユーザーがページまたは機能に費やす時間を特定するのに役立ちます。

サンプル入力:

| User | Feature | Event | Time |
| --- | --- | --- | --- |
| user@location.com |RightMenu |Start |2023-01-01T00:00:01.0000000Z |
| user@location.com |RightMenu |End |2023-01-01T00:00:08.0000000Z |

サンプル出力:

| User | Feature | Duration |
| --- | --- | --- |
| user@location.com |RightMenu |7 |

サンプル クエリ:

SELECT
	[user],
	feature,
	DATEDIFF(
		second,
		LAST(Time) OVER (PARTITION BY [user], feature LIMIT DURATION(hour, 1) WHEN Event = 'start'),
		Time) as duration
FROM input TIMESTAMP BY Time
WHERE
	Event = 'end'

LAST 関数を使用して、特定の条件内の最後のイベントを取得できます。この例では、条件は Start 型のイベントであり、 PARTITION BY ユーザーと機能によって検索をパーティション分割します。これにより、Start イベントを検索するときに、すべてのユーザーと機能が個別に処理されます。 LIMIT DURATION は 、End イベントと Start イベントの間の検索の時間を 1 時間に制限します。

一意の値をカウントする

COUNT と DISTINCT を使用すると、時間枠内のストリームに表示される一意のフィールド値の数をカウントできます。クエリを作成して、2 秒のウィンドウで料金所ブースを通過した一意の 自動車メーカー の数を計算できます。

サンプル入力:

| Make | Time |
| --- | --- |
| Make1 |2023-01-01T00:00:01.0000000Z |
| Make1 |2023-01-01T00:00:02.0000000Z |
| Make2 |2023-01-01T00:00:01.0000000Z |
| Make2 |2023-01-01T00:00:02.0000000Z |
| Make2 |2023-01-01T00:00:03.0000000Z |

サンプル 出力:

| Count_make | Time |
| --- | --- |
| 2 |2023-01-01T00:00:02.000Z |
| 1 |2023-01-01T00:00:04.000Z |

サンプル クエリ:

SELECT
     COUNT(DISTINCT Make) AS Count_make,
     System.TIMESTAMP() AS Time
FROM Input TIMESTAMP BY TIME
GROUP BY 
     TumblingWindow(second, 2)

COUNT(DISTINCT Make) は、時間枠内の Make 列の個別の値の数を返します。詳細については、 COUNT 集計関数を参照してください。

ウィンドウ内の最初のイベントを取得する

IsFirstを使用して、時間枠内の最初のイベントを取得できます。たとえば、10 分間隔で最初の車情報を出力します。

サンプル入力:

| License_plate | Make | Time |
| --- | --- | --- |
| DXE 5291 |Make1 |2023-07-27T00:00:05.0000000Z |
| YZK 5704 |Make3 |2023-07-27T00:02:17.0000000Z |
| RMV 8282 |Make1 |2023-07-27T00:05:01.0000000Z |
| YHN 6970 |Make2 |2023-07-27T00:06:00.0000000Z |
| VFE 1616 |Make2 |2023-07-27T00:09:31.0000000Z |
| QYF 9358 |Make1 |2023-07-27T00:12:02.0000000Z |
| MDR 6128 |Make4 |2023-07-27T00:13:45.0000000Z |

サンプル出力:

| License_plate | Make | Time |
| --- | --- | --- |
| DXE 5291 |Make1 |2023-07-27T00:00:05.0000000Z |
| QYF 9358 |Make1 |2023-07-27T00:12:02.0000000Z |

サンプル クエリ:

SELECT 
	License_plate,
	Make,
	Time
FROM 
	Input TIMESTAMP BY Time
WHERE 
	IsFirst(minute, 10) = 1

IsFirst は、データをパーティション分割し、10 分間隔で見つかった各特定の自動車 Make に対する最初のイベントを計算することもできます。

サンプル出力:

| License_plate | Make | Time |
| --- | --- | --- |
| DXE 5291 |Make1 |2023-07-27T00:00:05.0000000Z |
| YZK 5704 |Make3 |2023-07-27T00:02:17.0000000Z |
| YHN 6970 |Make2 |2023-07-27T00:06:00.0000000Z |
| QYF 9358 |Make1 |2023-07-27T00:12:02.0000000Z |
| MDR 6128 |Make4 |2023-07-27T00:13:45.0000000Z |

サンプル クエリ:

SELECT 
	License_plate,
	Make,
	Time
FROM 
	Input TIMESTAMP BY Time
WHERE 
	IsFirst(minute, 10) OVER (PARTITION BY Make) = 1

詳細については、 IsFirst を参照してください。

ウィンドウ内の重複するイベントを削除する

特定の時間枠内のイベントの平均を計算するなどの操作を実行する場合は、重複するイベントをフィルター処理する必要があります。次の例では、2 番目のイベントは最初のイベントの複製です。

サンプル入力:

| DeviceId | Time | Attribute | Value |
| --- | --- | --- | --- |
| 1 |2018-07-27T00:00:01.0000000Z |Temperature |50 |
| 1 |2018-07-27T00:00:01.0000000Z |Temperature |50 |
| 2 |2018-07-27T00:00:01.0000000Z |Temperature |40 |
| 1 |2018-07-27T00:00:05.0000000Z |Temperature |60 |
| 2 |2018-07-27T00:00:05.0000000Z |Temperature |50 |
| 1 |2018-07-27T00:00:10.0000000Z |Temperature |100 |

サンプル出力:

| AverageValue | DeviceId |
| --- | --- |
| 70 | 1 |
|45 | 2 |

サンプル クエリ:

WITH Temp AS (
	SELECT Value, DeviceId
	FROM Input TIMESTAMP BY Time
	GROUP BY Value, DeviceId, System.Timestamp()
)
 

SELECT
	AVG(Value) AS AverageValue, DeviceId
INTO Output
FROM Temp
GROUP BY DeviceId,TumblingWindow(minute, 5)

最初のステートメントを実行すると、重複するレコードが 1 つに結合されます。group by 句のフィールドはすべて同じです。したがって、重複を削除します。

さまざまなケース/値のロジックを指定する (CASE ステートメント)

CASE ステートメントは、特定の条件に基づいて、異なるフィールドに対して異なる計算を提供できます。たとえば、レーン A を Make1 の車に割り当て、レーン B を他の make に割り当てます。

サンプル入力:

| Make | Time |
| --- | --- |
| Make1 |2023-01-01T00:00:01.0000000Z |
| Make2 |2023-01-01T00:00:02.0000000Z |
| Make2 |2023-01-01T00:00:03.0000000Z |

サンプル出力:

| Make |Dispatch_to_lane | Time |
| --- | --- | --- |
| Make1 |"A" |2023-01-01T00:00:01.0000000Z |
| Make2 |"B" |2023-01-01T00:00:02.0000000Z |

サンプル クエリ:

SELECT
	Make
	CASE
		WHEN Make = "Make1" THEN "A"
		ELSE "B"
	END AS Dispatch_to_lane,
	System.TimeStamp() AS Time
FROM
	Input TIMESTAMP BY Time

CASE 式は、式を一連の単純な式と比較して結果を決定します。この例では、 Make1 の車両がレーン A にディスパッチされ、他の make の車両にはレーン Bが割り当てられます。

詳細については、ケース式を参照してください。

データ変換

CAST メソッドを使用して、データをリアルタイムで キャスト できます。たとえば、自動車の重量を nvarchar(max) 型から bigint 型に変換し、数値計算で使用できます。

サンプル入力:

| Make | Time | Weight |
| --- | --- | --- |
| Make1 |2023-01-01T00:00:01.0000000Z |"1000" |
| Make1 |2023-01-01T00:00:02.0000000Z |"2000" |

サンプル出力:

| Make | Weight |
| --- | --- |
| Make1 |3000 |

サンプル クエリ:

SELECT
	Make,
	SUM(CAST(Weight AS BIGINT)) AS Weight
FROM
	Input TIMESTAMP BY Time
GROUP BY
	Make,
	TumblingWindow(second, 10)

CAST ステートメントを使用してデータ型を指定します。データ型 (Azure Stream Analytics) でサポートされているデータ型の一覧を参照してください。

データ変換関数の詳細については、

条件の期間を検出する

複数のイベントにまたがる条件の場合、 LAG 関数を使用してその条件の期間を識別できます。たとえば、バグによってすべての自動車の重量が正しくない (20,000 ポンドを超える) ことが発生し、そのバグの期間を計算する必要があるとします。

サンプル入力:

| Make | Time | Weight |
| --- | --- | --- |
| Make1 |2023-01-01T00:00:01.0000000Z |2000 |
| Make2 |2023-01-01T00:00:02.0000000Z |25000 |
| Make1 |2023-01-01T00:00:03.0000000Z |26000 |
| Make2 |2023-01-01T00:00:04.0000000Z |25000 |
| Make1 |2023-01-01T00:00:05.0000000Z |26000 |
| Make2 |2023-01-01T00:00:06.0000000Z |25000 |
| Make1 |2023-01-01T00:00:07.0000000Z |26000 |
| Make2 |2023-01-01T00:00:08.0000000Z |2000 |

サンプル出力:

| Start_fault | End_fault |
| --- | --- |
| 2023-01-01T00:00:02.000Z |2023-01-01T00:00:07.000Z |

サンプル クエリ:

WITH SelectPreviousEvent AS
(
SELECT
	*,
	LAG([time]) OVER (LIMIT DURATION(hour, 24)) as previous_time,
	LAG([weight]) OVER (LIMIT DURATION(hour, 24)) as previous_weight
FROM input TIMESTAMP BY [time]
)

SELECT 
	LAG(time) OVER (LIMIT DURATION(hour, 24) WHEN previous_weight < 20000 ) [Start_fault],
	previous_time [End_fault]
FROM SelectPreviousEvent
WHERE
	[weight] < 20000
	AND previous_weight > 20000

最初の SELECT ステートメントは、現在の重量測定を前の測定値と関連付け、現在の測定値と共に投影します。 2 番目の SELECT は、 previous_weight が 20000 未満の最後のイベントを振り返ります。現在の重みは 20000 未満で、現在のイベントの previous_weight は 20000 より大きくなっています。

End_faultは、前のイベントに問題があった現在の非イベントであり、Start_faultはその前の最後の非イベントです。

独立した時間でイベントを処理する (サブストリーム)

イベントは、イベントプロデューサー間のクロックスキュー、パーティション間のクロックスキュー、またはネットワーク待機時間が原因で、遅延または順序が異なって到着する可能性があります。たとえば、TollID 2 のデバイスクロックは TollID 1 から 5 秒遅れ、TollID 3 のデバイスクロックは TollID 1 から 10 秒遅れています。計算は、独自のクロックデータのみをタイムスタンプとして考慮して、通行料ごとに個別に行うことができます。

サンプル入力:

| LicensePlate | Make | Time | TollID |
| --- | --- | --- | --- |
| DXE 5291 |Make1 |2023-07-27T00:00:01.0000000Z | 1 |
| YHN 6970 |Make2 |2023-07-27T00:00:05.0000000Z | 1 |
| QYF 9358 |Make1 |2023-07-27T00:00:01.0000000Z | 2 |
| GXF 9462 |Make3 |2023-07-27T00:00:04.0000000Z | 2 |
| VFE 1616 |Make2 |2023-07-27T00:00:10.0000000Z | 1 |
| RMV 8282 |Make1 |2023-07-27T00:00:03.0000000Z | 3 |
| MDR 6128 |Make3 |2023-07-27T00:00:11.0000000Z | 2 |
| YZK 5704 |Make4 |2023-07-27T00:00:07.0000000Z | 3 |

サンプル出力:

| TollID | Count |
| --- | --- |
| 1 | 2 |
| 2 | 2 |
| 1 | 1 |
| 3 | 1 |
| 2 | 1 |
| 3 | 1 |

サンプル クエリ:

SELECT
      TollId,
      COUNT(*) AS Count
FROM input
      TIMESTAMP BY Time OVER TollId
GROUP BY TUMBLINGWINDOW(second, 5), TollId

TIMESTAMP OVER BY 句は、サブストリームを使用して各デバイスのタイムラインを個別に確認します。各 TollID の出力イベントは計算時に生成されます。つまり、イベントは、すべてのデバイスが同じクロック上にあるかのように並べ替えられるのではなく 、各 TollID に対して順番に並べ替えられます。

詳細については、 TIMESTAMP BY OVER を参照してください。

セッションウィンドウ

セッションウィンドウは、イベントが発生したときに拡大し続け、特定の時間が経過した後にイベントが受信されない場合、またはウィンドウが最大期間に達した場合に計算のために閉じるウィンドウです。このウィンドウは、ユーザー操作データを計算する場合に特に便利です。ウィンドウは、ユーザーがシステムとの対話を開始したときに開始され、それ以上イベントが観察されないときに閉じます。つまり、ユーザーは対話を停止しています。たとえば、ユーザーがクリック数がログに記録される Web ページを操作している場合、セッションウィンドウを使用して、ユーザーがサイトと対話した時間を確認できます。

サンプル入力:

| User_id | Time | URL |
| --- | --- | --- |
| 0 | 2017-01-26T00:00:00.0000000Z | "www.example.com/a.html" |
| 0 | 2017-01-26T00:00:20.0000000Z | "www.example.com/b.html" |
| 1 | 2017-01-26T00:00:55.0000000Z | "www.example.com/c.html" |
| 0 | 2017-01-26T00:01:10.0000000Z | "www.example.com/d.html" |
| 1 | 2017-01-26T00:01:15.0000000Z | "www.example.com/e.html" |

サンプル出力:

| User_id | StartTime | EndTime | Duration_in_seconds |
| --- | --- | --- | --- |
| 0 | 2017-01-26T00:00:00.0000000Z | 2017-01-26T00:01:10.0000000Z | 70 |
| 1 | 2017-01-26T00:00:55.0000000Z | 2017-01-26T00:01:15.0000000Z | 20 |

サンプル クエリ:

SELECT
	user_id,
	MIN(time) as StartTime,
	MAX(time) as EndTime,
	DATEDIFF(second, MIN(time), MAX(time)) AS duration_in_seconds
FROM input TIMESTAMP BY time
GROUP BY
	user_id,
	SessionWindow(minute, 1, 60) OVER (PARTITION BY user_id)

SELECT は、ユーザーの操作に関連するデータを、対話の期間と共に投影します。ユーザー別にデータをグループ化し、1 分以内に対話が行われなかった場合に閉じる SessionWindow (最大ウィンドウサイズは 60 分) です。

SessionWindow の詳細については、「セッションウィンドウ」を参照してください。

JavaScript および C のユーザー定義関数#

注

このセクションは、Fabric Eventstream には適用されません。

Azure Stream Analytics クエリ言語は、JavaScript または C# 言語で記述されたカスタム関数を使用して拡張できます。ユーザー定義関数 (UDF) は、 SQL 言語を使用して簡単に表現できないカスタム/複雑な計算です。これらの UDF は 1 回定義でき、クエリ内で複数回使用できます。たとえば、UDF を使用して、16 進数 の nvarchar(max) 値を bigint 値に変換できます。

サンプル入力:

| Device_id | HexValue |
| --- | --- |
| 1 | "B4" |
| 2 | "11B" |
| 3 | "121" |

サンプル出力:

| Device_id | Decimal |
| --- | --- |
| 1 | 180 |
| 2 | 283 |
| 3 | 289 |

function hex2Int(hexValue){
	return parseInt(hexValue, 16);
}

public static class MyUdfClass {
	public static long Hex2Int(string hexValue){
		return int.Parse(hexValue, System.Globalization.NumberStyles.HexNumber);
	}
}

SELECT
	Device_id,
	udf.Hex2Int(HexValue) AS Decimal
From
	Input

User-Defined 関数は、使用されるすべてのイベントで HexValue から bigint 値を計算します。

詳細については、 JavaScript と C# を参照してください。

MATCH_RECOGNIZEを使用した高度なパターンマッチング

MATCH_RECOGNIZE は、一連のイベントを適切に定義された正規表現パターンに照合するために使用できる高度なパターンマッチングメカニズムです。たとえば、2 つの連続する警告メッセージがある場合、ATM の操作中に管理者に通知する必要がある場合、ATM がリアルタイムで障害を監視しています。

入力:

| ATM_id | Operation_id | Return_Code | Time |
| --- | --- | --- | --- |
| 1 | "Entering Pin" | "Success" | 2017-01-26T00:10:00.0000000Z |
| 2 | "Opening Money Slot" | "Success" | 2017-01-26T00:10:07.0000000Z |
| 2 | "Closing Money Slot" | "Success" | 2017-01-26T00:10:11.0000000Z |
| 1 | "Entering Withdraw Quantity" | "Success" | 2017-01-26T00:10:08.0000000Z |
| 1 | "Opening Money Slot" | "Warning" | 2017-01-26T00:10:14.0000000Z |
| 1 | "Printing Bank Balance" | "Warning" | 2017-01-26T00:10:19.0000000Z |

出力:

| ATM_id | First_Warning_Operation_id | Warning_Time |
| --- | --- | --- |
| 1 | "Opening Money Slot" | 2017-01-26T00:10:14.0000000Z |

SELECT *
FROM input TIMESTAMP BY time OVER ATM_id
MATCH_RECOGNIZE (
	LIMIT DURATION(minute, 1)
	PARTITION BY ATM_id
	MEASURES
		First(Warning.ATM_id) AS ATM_id,
		First(Warning.Operation_Id) AS First_Warning_Operation_id,
		First(Warning.Time) AS Warning_Time
	AFTER MATCH SKIP TO NEXT ROW
	PATTERN (Success+ Warning{2,})
	DEFINE
		Success AS Success.Return_Code = 'Success',
		Warning AS Warning.Return_Code <> 'Success'
) AS patternMatch

このクエリは、少なくとも 2 つの連続する障害イベントに一致し、条件が満たされたときにアラームを生成します。 PATTERN では、少なくとも 1 回の操作が成功した後に、照合に使用される正規表現 (この場合は、少なくとも 2 つの連続する警告) を定義します。成功と警告は、Return_Code値を使用して、条件が満たされると定義されます。 MEASURES** は、 ATM_id、最初の警告操作、および最初の警告時刻と共に投影されます。

詳細については、 MATCH_RECOGNIZEを参照してください。

ジオフェンシングと地理空間クエリ

Azure Stream Analytics には、フリート管理、ライドシェア、コネクテッドカー、資産追跡などのシナリオを実装するために使用できる組み込みの地理空間関数が用意されています。地理空間データは、イベントストリームまたは参照データの一部として、GeoJSON 形式または WKT 形式で取り込むことができます。たとえば、パスポートを印刷するための機械の製造に特化している会社は、そのマシンを政府や領事館にリースします。これらのマシンの場所は、パスポートの偽造に誤って使用される可能性を避けるために厳重に管理されています。各マシンには GPS トラッカーが搭載されており、その情報は Azure Stream Analytics ジョブに中継されます。製造は、これらのマシンの場所を追跡し、そのうちの1つが承認された領域を離れた場合に警告を受けたいと考えています。これにより、リモートで無効にし、当局に警告し、機器を取得することができます。

入力:

| Equipment_id | Equipment_current_location | Time |
| --- | --- | --- |
| 1 | "POINT(-122.13288797982818 47.64082002051315)" | 2017-01-26T00:10:00.0000000Z |
| 1 | "POINT(-122.13307252987875 47.64081350934929)" | 2017-01-26T00:11:00.0000000Z |
| 1 | "POINT(-122.13308862313283 47.6406508603241)" | 2017-01-26T00:12:00.0000000Z |
| 1 | "POINT(-122.13341048821462 47.64043760861279)" | 2017-01-26T00:13:00.0000000Z |

参照データ入力:

| Equipment_id | Equipment_lease_location |
| --- | --- |
| 1 | "POLYGON((-122.13326028450979 47.6409833866794,-122.13261655434621 47.6409833866794,-122.13261655434621 47.64061471602751,-122.13326028450979 47.64061471602751,-122.13326028450979 47.6409833866794))" |

出力:

| Equipment_id | Equipment_alert_location | Time |
| --- | --- | --- |
| 1 | "POINT(-122.13341048821462 47.64043760861279)" | 2017-01-26T00:13:00.0000000Z |

SELECT
	input.Equipment_id AS Equipment_id,
	input.Equipment_current_location AS Equipment_current_location,
	input.Time AS Time
FROM input TIMESTAMP BY time
JOIN
	referenceInput 
	ON input.Equipment_id = referenceInput.Equipment_id
	WHERE 
		ST_WITHIN(input.Equipment_current_location, referenceInput.Equipment_lease_location) = 1

このクエリを使用すると、製造元はマシンの場所を自動的に監視し、許可されたジオフェンスからマシンが離れたときにアラートを受け取ります。組み込みの地理空間関数を使用すると、ユーザーはサードパーティ製のライブラリを使用せずに、クエリ内で GPS データを使用できます。

詳細については、 Azure Stream Analytics を使用したジオフェンシングと地理空間集計のシナリオに関する記事を参照してください。

ヘルプを取得する

詳細については、Azure Stream Analytics に関する Microsoft Q&A 質問ページを参照してください。

次のステップ

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-03-11

Azure Stream Analytics と Fabric Eventstream の一般的なクエリ パターン

サポートされているデータ形式

複数の出力にデータを送信する

単純なパススルー クエリ

LIKE と NOT LIKE を使用した文字列の一致

過去のイベントに対する計算

ウィンドウ内の最後のイベントを返す

時間の経過に伴うデータ集計

定期的に値を出力する

ストリーム内のイベントを関連付ける

イベント間の期間を検出する

一意の値をカウントする

ウィンドウ内の最初のイベントを取得する

ウィンドウ内の重複するイベントを削除する

さまざまなケース/値のロジックを指定する (CASE ステートメント)

データ変換

条件の期間を検出する

独立した時間でイベントを処理する (サブストリーム)

セッション ウィンドウ

JavaScript および C のユーザー定義関数#

MATCH_RECOGNIZEを使用した高度なパターン マッチング

ジオフェンシングと地理空間クエリ

ヘルプを取得する

次のステップ

フィードバック

その他のリソース

Azure Stream Analytics と Fabric Eventstream の一般的なクエリパターン

単純なパススルークエリ

セッションウィンドウ

MATCH_RECOGNIZEを使用した高度なパターンマッチング