Azure Stream Analytics 및 Fabric Eventstream의 일반적인 쿼리 패턴

메모

패브릭 Eventstream 은 Azure Stream Analytics와 동일한 런타임에 빌드됩니다. 따라서 이 문서에 설명된 개념은 Azure Stream Analytics와 Fabric Eventstream 모두에 적용할 수 있습니다.

Azure Stream Analytics의 쿼리는 SQL과 유사한 쿼리 언어로 표현됩니다. 언어 구문은 Stream Analytics 쿼리 언어 참조 가이드에 설명되어 있습니다.

쿼리 디자인은 간단한 통과 논리를 표현하여 이벤트 데이터를 한 입력 스트림에서 출력 데이터 저장소로 이동하거나, 다양한 패턴 일치 및 임시 분석을 수행하여 Stream Analytics 가이드를 사용하여 IoT 솔루션 빌드 에서와 같이 다양한 시간 동안 집계를 계산할 수 있습니다. 여러 입력의 데이터를 조인하여 스트리밍 이벤트를 결합할 수 있으며, 정적 참조 데이터에 대한 조회를 수행하여 이벤트 값을 보강할 수 있습니다. 여러 출력에 데이터를 쓸 수도 있습니다.

이 문서에서는 실제 시나리오를 기반으로 하는 몇 가지 일반적인 쿼리 패턴에 대한 솔루션을 간략하게 설명합니다.

지원되는 데이터 형식

Azure Stream Analytics는 CSV, JSON 및 Avro 데이터 형식의 이벤트 처리를 지원합니다. JSON 및 Avro 형식은 중첩된 개체(레코드) 또는 배열과 같은 복합 형식을 포함할 수 있습니다. 이러한 복잡한 데이터 형식을 사용하는 방법에 대한 자세한 내용은 JSON 및 AVRO 데이터 구문 분석을 참조하세요.

여러 출력으로 데이터 보내기

여러 SELECT 문을 사용하여 데이터를 다른 출력 싱크로 출력할 수 있습니다. 예를 들어 한 SELECT 문은 임계값 기반 경고를 출력하고 다른 문은 Blob Storage에 이벤트를 출력할 수 있습니다.

다음 입력을 고려합니다.

| Make | Time |
| --- | --- |
| Make1 |2023-01-01T00:00:01.0000000Z |
| Make1 |2023-01-01T00:00:02.0000000Z |
| Make2 |2023-01-01T00:00:01.0000000Z |
| Make2 |2023-01-01T00:00:02.0000000Z |
| Make2 |2023-01-01T00:00:03.0000000Z |

또한 쿼리에서 다음 두 개의 출력을 사용할 수 있습니다.

ArchiveOutput:

| Make | Time |
| --- | --- |
| Make1 |2023-01-01T00:00:01.0000000Z |
| Make1 |2023-01-01T00:00:02.0000000Z |
| Make2 |2023-01-01T00:00:01.0000000Z |
| Make2 |2023-01-01T00:00:02.0000000Z |
| Make2 |2023-01-01T00:00:03.0000000Z |

AlertOutput:

| Make | Time | Count |
| --- | --- | --- |
| Make2 |2023-01-01T00:00:10.0000000Z |3 |

보관 출력과 경고 출력을 사용하는 두 개의 SELECT 문을 통한 쿼리

SELECT
	*
INTO
	ArchiveOutput
FROM
	Input TIMESTAMP BY Time

SELECT
	Make,
	System.TimeStamp() AS Time,
	COUNT(*) AS [Count]
INTO
	AlertOutput
FROM
	Input TIMESTAMP BY Time
GROUP BY
	Make,
	TumblingWindow(second, 10)
HAVING
	[Count] >= 3

INTO 절은 Stream Analytics 서비스에 데이터를 쓸 출력을 알려줍니다. 첫 번째 SELECT 는 입력에서 데이터를 수신하고 ArchiveOutput이라는 출력으로 보내는 통과 쿼리를 정의합니다. 두 번째 쿼리는 AlertOutput이라는 다운스트림 경고 시스템 출력으로 결과를 보내기 전에 데이터를 집계하고 필터링합니다.

WITH 절을 사용하여 여러 하위 쿼리 블록을 정의할 수 있습니다. 이 옵션은 입력 원본에 대한 판독기를 더 적게 열 수 있는 이점이 있습니다.

쿼리:

WITH ReaderQuery AS (
	SELECT
		*
	FROM
		Input TIMESTAMP BY Time
)

SELECT * INTO ArchiveOutput FROM ReaderQuery

SELECT 
	Make,
	System.TimeStamp() AS Time,
	COUNT(*) AS [Count] 
INTO AlertOutput 
FROM ReaderQuery
GROUP BY
	Make,
	TumblingWindow(second, 10)
HAVING [Count] >= 3

자세한 내용은 WITH 절을 참조하세요.

간단한 패스스루 쿼리

간단한 통과 쿼리를 사용하여 입력 스트림 데이터를 출력에 복사할 수 있습니다. 예를 들어 실시간 차량 정보가 포함된 데이터 스트림을 나중에 분석하기 위해 SQL 데이터베이스에 저장해야 하는 경우 간단한 통과 쿼리가 작업을 수행합니다.

다음 입력을 고려합니다.

| Make | Time | Weight |
| --- | --- | --- |
| Make1 |2023-01-01T00:00:01.0000000Z |"1000" |
| Make1 |2023-01-01T00:00:02.0000000Z |"2000" |

출력이 입력과 동일하도록 합니다.

| Make | Time | Weight |
| --- | --- | --- |
| Make1 |2023-01-01T00:00:01.0000000Z |"1000" |
| Make1 |2023-01-01T00:00:02.0000000Z |"2000" |

쿼리는 다음과 같습니다.

SELECT
	*
INTO Output
FROM Input

이 SELECT * 쿼리는 들어오는 이벤트의 모든 필드를 프로젝트하고 출력으로 보냅니다. 대신 SELECT 문에 필요한 필드만 프로젝트할 수 있습니다. 다음 예제에서 SELECT 문은 입력 데이터의 Make 및 Time 필드만 투영합니다.

다음 입력을 고려합니다.

| Make | Time | Weight |
| --- | --- | --- |
| Make1 |2023-01-01T00:00:01.0000000Z |1000 |
| Make1 |2023-01-01T00:00:02.0000000Z |2000 |
| Make2 |2023-01-01T00:00:04.0000000Z |1500 |

출력에 만들기 및 시간 필드만 사용하려고 합니다.

| Make | Time |
| --- | --- |
| Make1 |2023-01-01T00:00:01.0000000Z |
| Make1 |2023-01-01T00:00:02.0000000Z |
| Make2 |2023-01-01T00:00:04.0000000Z |

다음은 필요한 필드만 투영하는 쿼리 입니다.

SELECT
	Make, Time
INTO Output
FROM Input

LIKE 및 NOT LIKE와 일치하는 문자열

LIKE 및 NOT LIKE 는 필드가 특정 패턴과 일치하는지 확인하는 데 사용할 수 있습니다. 예를 들어 필터를 사용하여 문자 A 로 시작하고 숫자로 끝나는 번호판만 반환할 수 있습니다 9.

다음 입력을 고려합니다.

| Make | License_plate | Time |
| --- | --- | --- |
| Make1 |ABC-123 |2023-01-01T00:00:01.0000000Z |
| Make2 |AAA-999 |2023-01-01T00:00:02.0000000Z |
| Make3 |ABC-369 |2023-01-01T00:00:03.0000000Z |

출력에 문자 A 로 시작하고 숫자9로 끝나는 번호판이 있어야 합니다.

| Make | License_plate | Time |
| --- | --- | --- |
| Make2 |AAA-999 |2023-01-01T00:00:02.0000000Z |
| Make3 |ABC-369 |2023-01-01T00:00:03.0000000Z |

LIKE 연산자를 사용하는 쿼리 는 다음과 같습니다.

SELECT
	*
FROM
	Input TIMESTAMP BY Time
WHERE
	License_plate LIKE 'A%9'

LIKE 문을 사용하여 License_plate 필드 값을 확인합니다. 문자 A로 시작한 다음 0개 이상의 문자 문자열이 있어야 하며 숫자 9로 끝납니다.

과거 이벤트에 대한 계산

LAG 함수를 사용하여 시간 범위 내의 과거 이벤트를 보고 현재 이벤트와 비교할 수 있습니다. 예를 들어, 유료 부스를 통과한 마지막 차량과 다른 경우 현재 차량의 메이커를 출력할 수 있습니다.

샘플 입력:

| Make | Time |
| --- | --- |
| Make1 |2023-01-01T00:00:01.0000000Z |
| Make2 |2023-01-01T00:00:02.0000000Z |

샘플 출력:

| Make | Time |
| --- | --- |
| Make2 |2023-01-01T00:00:02.0000000Z |

샘플 쿼리:

SELECT
	Make,
	Time
FROM
	Input TIMESTAMP BY Time
WHERE
	LAG(Make, 1) OVER (LIMIT DURATION(minute, 1)) <> Make

LAG를 사용하여 입력 스트림을 한 이벤트 뒤로 피킹하여 Make 값을 검색하고 현재 이벤트의 Make 값과 비교하여 이벤트를 출력합니다.

자세한 내용은 LAG를 참조 하세요.

창에서 마지막 이벤트 반환

이벤트가 실시간으로 시스템에서 사용되므로 이벤트가 해당 기간 동안 마지막으로 도착하는 이벤트인지 확인할 수 있는 함수는 없습니다. 이를 위해 입력 스트림은 이벤트 시간이 해당 창의 모든 이벤트에 대한 최대 시간인 다른 스트림과 조인되어야 합니다.

샘플 입력:

| License_plate | Make | Time |
| --- | --- | --- |
| DXE 5291 |Make1 |2023-07-27T00:00:05.0000000Z |
| YZK 5704 |Make3 |2023-07-27T00:02:17.0000000Z |
| RMV 8282 |Make1 |2023-07-27T00:05:01.0000000Z |
| YHN 6970 |Make2 |2023-07-27T00:06:00.0000000Z |
| VFE 1616 |Make2 |2023-07-27T00:09:31.0000000Z |
| QYF 9358 |Make1 |2023-07-27T00:12:02.0000000Z |
| MDR 6128 |Make4 |2023-07-27T00:13:45.0000000Z |

10분짜리 두 기간 동안의 마지막 자동차에 대한 정보가 포함된 샘플 출력:

| License_plate | Make | Time |
| --- | --- | --- |
| VFE 1616 |Make2 |2023-07-27T00:09:31.0000000Z |
| MDR 6128 |Make4 |2023-07-27T00:13:45.0000000Z |

샘플 쿼리:

WITH LastInWindow AS
(
	SELECT 
		MAX(Time) AS LastEventTime
	FROM 
		Input TIMESTAMP BY Time
	GROUP BY 
		TumblingWindow(minute, 10)
)

SELECT 
	Input.License_plate,
	Input.Make,
	Input.Time
FROM
	Input TIMESTAMP BY Time 
	INNER JOIN LastInWindow
	ON DATEDIFF(minute, Input, LastInWindow) BETWEEN 0 AND 10
	AND Input.Time = LastInWindow.LastEventTime

쿼리의 첫 번째 단계에서는 10분 창에서 최대 타임스탬프를 찾습니다. 즉, 해당 창에 대한 마지막 이벤트의 타임스탬프입니다. 두 번째 단계는 첫 번째 쿼리의 결과를 원래 스트림과 조인하여 각 창의 마지막 타임스탬프와 일치하는 이벤트를 찾습니다.

DATEDIFF 는 두 DateTime 필드 간의 시간 차이를 비교하고 반환하는 날짜별 함수입니다. 자세한 내용은 날짜 함수를 참조하세요.

스트림 조인에 대한 자세한 내용은 JOIN을 참조하세요.

시간에 따른 데이터 집계

시간 기간 동안 정보를 계산하려면 데이터를 집계할 수 있습니다. 이 예제에서는 모든 특정 자동차 메이크에 대해 지난 10초의 시간 동안 개수를 구하는 구문을 보여줍니다.

샘플 입력:

| Make | Time | Weight |
| --- | --- | --- |
| Make1 |2023-01-01T00:00:01.0000000Z |1000 |
| Make1 |2023-01-01T00:00:02.0000000Z |2000 |
| Make2 |2023-01-01T00:00:04.0000000Z |1500 |

샘플 출력:

| Make | Count |
| --- | --- |
| Make1 | 2 |
| Make2 | 1 |

쿼리:

SELECT
	Make,
	COUNT(*) AS Count
FROM
	Input TIMESTAMP BY Time
GROUP BY
	Make,
	TumblingWindow(second, 10)

이 집계는 Make 별로 자동차를 그룹화하고 10초마다 계산합니다. 출력에는 요금소를 통과한 자동차의 제조사 및 수량이 있습니다.

TumblingWindow는 이벤트를 함께 그룹화하는 데 사용되는 창 함수입니다. 집계는 모든 그룹화된 이벤트에 적용할 수 있습니다. 자세한 내용은 창 함수를 참조하세요.

집계에 대한 자세한 내용은 집계 함수를 참조하세요.

주기적으로 출력 값들

이벤트가 누락되거나 불규칙한 경우, 더 드문 데이터 입력에서 정기적인 간격으로 출력을 생성할 수 있습니다. 예를 들어 가장 최근에 본 데이터 지점을 보고하는 이벤트를 5초마다 생성합니다.

샘플 입력:

| Time | Value |
| --- | --- |
| "2014-01-01T06:01:00" |1 |
| "2014-01-01T06:01:05" |2 |
| "2014-01-01T06:01:10" |3 |
| "2014-01-01T06:01:15" |4 |
| "2014-01-01T06:01:30" |5 |
| "2014-01-01T06:01:35" |6 |

샘플 출력(처음 10개 행):

| Window_end | Last_event.Time | Last_event.Value |
| --- | --- | --- |
| 2014-01-01T14:01:00.000Z |2014-01-01T14:01:00.000Z |1 |
| 2014-01-01T14:01:05.000Z |2014-01-01T14:01:05.000Z |2 |
| 2014-01-01T14:01:10.000Z |2014-01-01T14:01:10.000Z |3 |
| 2014-01-01T14:01:15.000Z |2014-01-01T14:01:15.000Z |4 |
| 2014-01-01T14:01:20.000Z |2014-01-01T14:01:15.000Z |4 |
| 2014-01-01T14:01:25.000Z |2014-01-01T14:01:15.000Z |4 |
| 2014-01-01T14:01:30.000Z |2014-01-01T14:01:30.000Z |5 |
| 2014-01-01T14:01:35.000Z |2014-01-01T14:01:35.000Z |6 |
| 2014-01-01T14:01:40.000Z |2014-01-01T14:01:35.000Z |6 |
| 2014-01-01T14:01:45.000Z |2014-01-01T14:01:35.000Z |6 |

샘플 쿼리:

SELECT
	System.Timestamp() AS Window_end,
	TopOne() OVER (ORDER BY Time DESC) AS Last_event
FROM
	Input TIMESTAMP BY Time
GROUP BY
	HOPPINGWINDOW(second, 300, 5)

이 쿼리는 5초마다 이벤트를 생성하고 이전에 받은 마지막 이벤트를 출력합니다. HOPPINGWINDOW 기간은 쿼리가 최신 이벤트를 찾기 위해 얼마나 뒤로 보이는지를 결정합니다.

자세한 내용은 호핑 창을 참조하세요.

스트림의 이벤트 상관 관계 지정

LAG 함수를 사용하여 과거 이벤트를 확인하여 동일한 스트림의 이벤트 상관 관계를 지정할 수 있습니다. 예를 들어 동일한 Make 에서 두 대의 연속 차량이 지난 90초 동안 유료 부스를 통과할 때마다 출력을 생성할 수 있습니다.

샘플 입력:

| Make | License_plate | Time |
| --- | --- | --- |
| Make1 |ABC-123 |2023-01-01T00:00:01.0000000Z |
| Make1 |AAA-999 |2023-01-01T00:00:02.0000000Z |
| Make2 |DEF-987 |2023-01-01T00:00:03.0000000Z |
| Make1 |GHI-345 |2023-01-01T00:00:04.0000000Z |

샘플 출력:

| Make | Time | Current_car_license_plate | First_car_license_plate | First_car_time |
| --- | --- | --- | --- | --- |
| Make1 |2023-01-01T00:00:02.0000000Z |AAA-999 |ABC-123 |2023-01-01T00:00:01.0000000Z |

샘플 쿼리:

SELECT
	Make,
	Time,
	License_plate AS Current_car_license_plate,
	LAG(License_plate, 1) OVER (LIMIT DURATION(second, 90)) AS First_car_license_plate,
	LAG(Time, 1) OVER (LIMIT DURATION(second, 90)) AS First_car_time
FROM
	Input TIMESTAMP BY Time
WHERE
	LAG(Make, 1) OVER (LIMIT DURATION(second, 90)) = Make

LAG 함수는 입력 스트림을 한 이벤트 뒤로 살펴보고 Make 값을 검색하여 현재 이벤트의 Make 값과 비교할 수 있습니다. 조건이 충족되면 SELECT 문에서 LAG를 사용하여 이전 이벤트의 데이터를 프로젝터화할 수 있습니다.

자세한 내용은 LAG를 참조 하세요.

이벤트 간 기간 검색

End 이벤트가 수신되면 마지막 Start 이벤트를 확인하여 이벤트 기간을 계산할 수 있습니다. 이 쿼리는 사용자가 페이지 또는 기능에 소요되는 시간을 결정하는 데 유용할 수 있습니다.

샘플 입력:

| User | Feature | Event | Time |
| --- | --- | --- | --- |
| user@location.com |RightMenu |Start |2023-01-01T00:00:01.0000000Z |
| user@location.com |RightMenu |End |2023-01-01T00:00:08.0000000Z |

샘플 출력:

| User | Feature | Duration |
| --- | --- | --- |
| user@location.com |RightMenu |7 |

샘플 쿼리:

SELECT
	[user],
	feature,
	DATEDIFF(
		second,
		LAST(Time) OVER (PARTITION BY [user], feature LIMIT DURATION(hour, 1) WHEN Event = 'start'),
		Time) as duration
FROM input TIMESTAMP BY Time
WHERE
	Event = 'end'

LAST 함수를 사용하여 특정 조건 내에서 마지막 이벤트를 검색할 수 있습니다. 이 예제에서 조건은 PARTITION BY 사용자 및 기능별로 검색을 분할하는 Start 유형의 이벤트입니다. 이러한 방식으로 모든 사용자와 기능은 시작 이벤트를 검색할 때 독립적으로 처리됩니다. LIMIT DURATION 은 종료 및 시작 이벤트 간에 검색 시간을 1시간으로 제한합니다.

고유 값 개수

COUNT 및 DISTINCT 를 사용하여 시간 창 내에서 스트림에 표시되는 고유 필드 값의 수를 계산할 수 있습니다. 2초의 기간 동안 얼마나 많은 고유한 자동차 제조사가 요금소를 통과했는지 계산하는 쿼리를 생성할 수 있습니다.

샘플 입력:

| Make | Time |
| --- | --- |
| Make1 |2023-01-01T00:00:01.0000000Z |
| Make1 |2023-01-01T00:00:02.0000000Z |
| Make2 |2023-01-01T00:00:01.0000000Z |
| Make2 |2023-01-01T00:00:02.0000000Z |
| Make2 |2023-01-01T00:00:03.0000000Z |

샘플 출력:

| Count_make | Time |
| --- | --- |
| 2 |2023-01-01T00:00:02.000Z |
| 1 |2023-01-01T00:00:04.000Z |

샘플 쿼리:

SELECT
     COUNT(DISTINCT Make) AS Count_make,
     System.TIMESTAMP() AS Time
FROM Input TIMESTAMP BY TIME
GROUP BY 
     TumblingWindow(second, 2)

COUNT(DISTINCT Make)는 Make 열에 있는 고유 값의 수를 시간 창 내에서 반환합니다. 자세한 내용은 COUNT 집계 함수를 참조하세요.

창에서 첫 번째 이벤트 검색

시간 창에서 첫 번째 이벤트를 검색하는 데 사용할 IsFirst 수 있습니다. 예를 들어 10분 간격으로 첫 번째 자동차 정보를 출력합니다.

샘플 입력:

| License_plate | Make | Time |
| --- | --- | --- |
| DXE 5291 |Make1 |2023-07-27T00:00:05.0000000Z |
| YZK 5704 |Make3 |2023-07-27T00:02:17.0000000Z |
| RMV 8282 |Make1 |2023-07-27T00:05:01.0000000Z |
| YHN 6970 |Make2 |2023-07-27T00:06:00.0000000Z |
| VFE 1616 |Make2 |2023-07-27T00:09:31.0000000Z |
| QYF 9358 |Make1 |2023-07-27T00:12:02.0000000Z |
| MDR 6128 |Make4 |2023-07-27T00:13:45.0000000Z |

샘플 출력:

| License_plate | Make | Time |
| --- | --- | --- |
| DXE 5291 |Make1 |2023-07-27T00:00:05.0000000Z |
| QYF 9358 |Make1 |2023-07-27T00:12:02.0000000Z |

샘플 쿼리:

SELECT 
	License_plate,
	Make,
	Time
FROM 
	Input TIMESTAMP BY Time
WHERE 
	IsFirst(minute, 10) = 1

또한 IsFirst는 데이터를 분할하고 10분 간격으로 찾은 각 특정 차량 Make 에 대한 첫 번째 이벤트를 계산할 수 있습니다.

샘플 출력:

| License_plate | Make | Time |
| --- | --- | --- |
| DXE 5291 |Make1 |2023-07-27T00:00:05.0000000Z |
| YZK 5704 |Make3 |2023-07-27T00:02:17.0000000Z |
| YHN 6970 |Make2 |2023-07-27T00:06:00.0000000Z |
| QYF 9358 |Make1 |2023-07-27T00:12:02.0000000Z |
| MDR 6128 |Make4 |2023-07-27T00:13:45.0000000Z |

샘플 쿼리:

SELECT 
	License_plate,
	Make,
	Time
FROM 
	Input TIMESTAMP BY Time
WHERE 
	IsFirst(minute, 10) OVER (PARTITION BY Make) = 1

자세한 내용은 IsFirst를 참조하세요.

창에서 중복 이벤트 제거

지정된 기간 동안 이벤트에 대한 평균을 계산하는 등의 작업을 수행하는 경우 중복 이벤트를 필터링해야 합니다. 다음 예제에서 두 번째 이벤트는 첫 번째 이벤트와 중복됩니다.

샘플 입력:

| DeviceId | Time | Attribute | Value |
| --- | --- | --- | --- |
| 1 |2018-07-27T00:00:01.0000000Z |Temperature |50 |
| 1 |2018-07-27T00:00:01.0000000Z |Temperature |50 |
| 2 |2018-07-27T00:00:01.0000000Z |Temperature |40 |
| 1 |2018-07-27T00:00:05.0000000Z |Temperature |60 |
| 2 |2018-07-27T00:00:05.0000000Z |Temperature |50 |
| 1 |2018-07-27T00:00:10.0000000Z |Temperature |100 |

샘플 출력:

| AverageValue | DeviceId |
| --- | --- |
| 70 | 1 |
|45 | 2 |

샘플 쿼리:

WITH Temp AS (
	SELECT Value, DeviceId
	FROM Input TIMESTAMP BY Time
	GROUP BY Value, DeviceId, System.Timestamp()
)
 

SELECT
	AVG(Value) AS AverageValue, DeviceId
INTO Output
FROM Temp
GROUP BY DeviceId,TumblingWindow(minute, 5)

첫 번째 문이 실행되면 그룹 by 절의 필드가 모두 동일하기 때문에 중복 레코드가 하나로 결합됩니다. 따라서 중복 항목을 제거합니다.

다른 사례/값에 대한 논리 지정(CASE 문)

CASE 문은 특정 기준에 따라 서로 다른 필드에 대해 서로 다른 계산을 제공할 수 있습니다. 예를 들어 레인 A을(를) Make1 자동차에 할당하고 레인 B을(를) 다른 제조업체에 할당하세요.

샘플 입력:

| Make | Time |
| --- | --- |
| Make1 |2023-01-01T00:00:01.0000000Z |
| Make2 |2023-01-01T00:00:02.0000000Z |
| Make2 |2023-01-01T00:00:03.0000000Z |

샘플 출력:

| Make |Dispatch_to_lane | Time |
| --- | --- | --- |
| Make1 |"A" |2023-01-01T00:00:01.0000000Z |
| Make2 |"B" |2023-01-01T00:00:02.0000000Z |

샘플 쿼리:

SELECT
	Make
	CASE
		WHEN Make = "Make1" THEN "A"
		ELSE "B"
	END AS Dispatch_to_lane,
	System.TimeStamp() AS Time
FROM
	Input TIMESTAMP BY Time

CASE 식은 식을 단순 식 집합과 비교하여 결과를 결정합니다. 이 예제에서는 차량이 Make1 차선 A 으로 발송되는 반면, 다른 차량의 차량에는 차선 B이 할당됩니다.

자세한 내용은 사례 식을 참조 하세요.

데이터 변환

CAST 메서드를 사용하여 실시간으로 데이터를 캐스팅할 수 있습니다. 예를 들어 자동차 중량을 nvarchar(max) 형식에서 bigint 형식으로 변환하고 숫자 계산에 사용할 수 있습니다.

샘플 입력:

| Make | Time | Weight |
| --- | --- | --- |
| Make1 |2023-01-01T00:00:01.0000000Z |"1000" |
| Make1 |2023-01-01T00:00:02.0000000Z |"2000" |

샘플 출력:

| Make | Weight |
| --- | --- |
| Make1 |3000 |

샘플 쿼리:

SELECT
	Make,
	SUM(CAST(Weight AS BIGINT)) AS Weight
FROM
	Input TIMESTAMP BY Time
GROUP BY
	Make,
	TumblingWindow(second, 10)

CAST 문을 사용하여 해당 데이터 형식을 지정합니다. 데이터 형식에서 지원되는 데이터 형식 목록을 참조하세요 (Azure Stream Analytics).

데이터 변환 함수에 대한 자세한 내용을 보려면

조건의 기간 감지

여러 이벤트를 포함하는 조건의 경우 LAG 함수를 사용하여 해당 조건의 기간을 식별할 수 있습니다. 예를 들어 버그로 인해 모든 자동차의 무게가 잘못되었다고 가정하고(20,000파운드 초과) 해당 버그의 지속 시간을 계산해야 합니다.

샘플 입력:

| Make | Time | Weight |
| --- | --- | --- |
| Make1 |2023-01-01T00:00:01.0000000Z |2000 |
| Make2 |2023-01-01T00:00:02.0000000Z |25000 |
| Make1 |2023-01-01T00:00:03.0000000Z |26000 |
| Make2 |2023-01-01T00:00:04.0000000Z |25000 |
| Make1 |2023-01-01T00:00:05.0000000Z |26000 |
| Make2 |2023-01-01T00:00:06.0000000Z |25000 |
| Make1 |2023-01-01T00:00:07.0000000Z |26000 |
| Make2 |2023-01-01T00:00:08.0000000Z |2000 |

샘플 출력:

| Start_fault | End_fault |
| --- | --- |
| 2023-01-01T00:00:02.000Z |2023-01-01T00:00:07.000Z |

샘플 쿼리:

WITH SelectPreviousEvent AS
(
SELECT
	*,
	LAG([time]) OVER (LIMIT DURATION(hour, 24)) as previous_time,
	LAG([weight]) OVER (LIMIT DURATION(hour, 24)) as previous_weight
FROM input TIMESTAMP BY [time]
)

SELECT 
	LAG(time) OVER (LIMIT DURATION(hour, 24) WHEN previous_weight < 20000 ) [Start_fault],
	previous_time [End_fault]
FROM SelectPreviousEvent
WHERE
	[weight] < 20000
	AND previous_weight > 20000

첫 번째 SELECT 문은 현재 가중치 측정과 이전 측정값의 상관 관계를 지정하여 현재 측정값과 함께 투사합니다. 두 번째 SELECT 는 previous_weight 20000보다 작은 마지막 이벤트를 다시 살펴봅니다. 여기서 현재 가중치는 20000보다 작고 현재 이벤트의 previous_weight 20000보다 큽니다.

End_fault 이전 이벤트가 잘못되었던 현재 비고정 이벤트이며, Start_fault 이전의 마지막 비고정 이벤트입니다.

독립적인 시간을 사용하여 이벤트 처리(하위 스트림)

이벤트 생산자 간의 클록 오차, 파티션 간의 클록 오차 또는 네트워크 대기 시간으로 인해 이벤트가 늦게 또는 순서가 잘못 도착할 수 있습니다. 예를 들어 TollID 2의 디바이스 시계는 TollID 1 뒤에 5초이고 TollID 3의 디바이스 시계는 TollID 1 뒤에 10초 뒤입니다. 계산은 자체 클록 데이터만 타임스탬프로 고려하여 각 통행료에 대해 독립적으로 발생할 수 있습니다.

샘플 입력:

| LicensePlate | Make | Time | TollID |
| --- | --- | --- | --- |
| DXE 5291 |Make1 |2023-07-27T00:00:01.0000000Z | 1 |
| YHN 6970 |Make2 |2023-07-27T00:00:05.0000000Z | 1 |
| QYF 9358 |Make1 |2023-07-27T00:00:01.0000000Z | 2 |
| GXF 9462 |Make3 |2023-07-27T00:00:04.0000000Z | 2 |
| VFE 1616 |Make2 |2023-07-27T00:00:10.0000000Z | 1 |
| RMV 8282 |Make1 |2023-07-27T00:00:03.0000000Z | 3 |
| MDR 6128 |Make3 |2023-07-27T00:00:11.0000000Z | 2 |
| YZK 5704 |Make4 |2023-07-27T00:00:07.0000000Z | 3 |

샘플 출력:

| TollID | Count |
| --- | --- |
| 1 | 2 |
| 2 | 2 |
| 1 | 1 |
| 3 | 1 |
| 2 | 1 |
| 3 | 1 |

샘플 쿼리:

SELECT
      TollId,
      COUNT(*) AS Count
FROM input
      TIMESTAMP BY Time OVER TollId
GROUP BY TUMBLINGWINDOW(second, 5), TollId

TIMESTAMP OVER BY 절은 하위 스트림을 사용하여 각 디바이스 타임라인을 독립적으로 살펴봅니다. 각 TollID 에 대한 출력 이벤트는 계산될 때 생성됩니다. 즉, 모든 디바이스가 동일한 시계에 있는 것처럼 순서를 다시 지정하는 대신 각 TollID 와 관련하여 이벤트가 순서대로 진행됩니다.

자세한 내용은 TIMESTAMP BY OVER를 참조하세요.

세션 창

세션 창은 이벤트가 발생할 때 계속 확장되고 특정 시간 후에 이벤트가 수신되지 않거나 창이 최대 기간에 도달하는 경우 계산을 위해 닫힙니다. 이 창은 사용자 상호 작용 데이터를 계산할 때 특히 유용합니다. 사용자가 시스템과 상호 작용을 시작하면 창이 시작되고 더 이상 이벤트가 관찰되지 않으면 닫힙니다. 즉, 사용자가 상호 작용을 중지했습니다. 예를 들어 사용자가 클릭 횟수가 기록되는 웹 페이지와 상호 작용하는 경우 세션 창을 사용하여 사용자가 사이트와 상호 작용하는 기간을 확인할 수 있습니다.

샘플 입력:

| User_id | Time | URL |
| --- | --- | --- |
| 0 | 2017-01-26T00:00:00.0000000Z | "www.example.com/a.html" |
| 0 | 2017-01-26T00:00:20.0000000Z | "www.example.com/b.html" |
| 1 | 2017-01-26T00:00:55.0000000Z | "www.example.com/c.html" |
| 0 | 2017-01-26T00:01:10.0000000Z | "www.example.com/d.html" |
| 1 | 2017-01-26T00:01:15.0000000Z | "www.example.com/e.html" |

샘플 출력:

| User_id | StartTime | EndTime | Duration_in_seconds |
| --- | --- | --- | --- |
| 0 | 2017-01-26T00:00:00.0000000Z | 2017-01-26T00:01:10.0000000Z | 70 |
| 1 | 2017-01-26T00:00:55.0000000Z | 2017-01-26T00:01:15.0000000Z | 20 |

샘플 쿼리:

SELECT
	user_id,
	MIN(time) as StartTime,
	MAX(time) as EndTime,
	DATEDIFF(second, MIN(time), MAX(time)) AS duration_in_seconds
FROM input TIMESTAMP BY time
GROUP BY
	user_id,
	SessionWindow(minute, 1, 60) OVER (PARTITION BY user_id)

SELECT는 상호 작용 기간과 함께 사용자 상호 작용과 관련된 데이터를 투영합니다. 최대 창 크기가 60분인 1분 이내에 상호 작용이 발생하지 않으면 닫는 사용자 및 SessionWindow 별로 데이터를 그룹화합니다.

SessionWindow에 대한 자세한 내용은 세션 창을 참조하세요 .

JavaScript 및 C의 사용자 정의 함수#

메모

이 섹션은 Fabric Eventstream에 적용되지 않습니다.

Azure Stream Analytics 쿼리 언어는 JavaScript 또는 C# 언어로 작성된 사용자 지정 함수를 사용하여 확장할 수 있습니다. UDF(사용자 정의 함수)는 SQL 언어를 사용하여 쉽게 표현할 수 없는 사용자 지정/복잡한 계산입니다. 이러한 UDF는 한 번 정의하고 쿼리 내에서 여러 번 사용할 수 있습니다. 예를 들어 UDF를 사용하여 16진수 nvarchar(max) 값을 bigint 값으로 변환할 수 있습니다.

샘플 입력:

| Device_id | HexValue |
| --- | --- |
| 1 | "B4" |
| 2 | "11B" |
| 3 | "121" |

샘플 출력:

| Device_id | Decimal |
| --- | --- |
| 1 | 180 |
| 2 | 283 |
| 3 | 289 |

function hex2Int(hexValue){
	return parseInt(hexValue, 16);
}

public static class MyUdfClass {
	public static long Hex2Int(string hexValue){
		return int.Parse(hexValue, System.Globalization.NumberStyles.HexNumber);
	}
}

SELECT
	Device_id,
	udf.Hex2Int(HexValue) AS Decimal
From
	Input

User-Defined 함수는 사용된 모든 이벤트에 대해 HexValue의 bigint 값을 계산합니다.

자세한 내용은 JavaScript 및 C#을 참조하세요.

MATCH_RECOGNIZE를 사용한 고급 패턴 매칭

MATCH_RECOGNIZE 이벤트 시퀀스를 잘 정의된 정규식 패턴과 일치시키는 데 사용할 수 있는 고급 패턴 일치 메커니즘입니다. 예를 들어 ATM이 실패에 대해 실시간으로 모니터링되고 있으며, 두 개의 연속 경고 메시지가 있는 경우 ATM을 작업하는 동안 관리자에게 알려야 합니다.

입력:

| ATM_id | Operation_id | Return_Code | Time |
| --- | --- | --- | --- |
| 1 | "Entering Pin" | "Success" | 2017-01-26T00:10:00.0000000Z |
| 2 | "Opening Money Slot" | "Success" | 2017-01-26T00:10:07.0000000Z |
| 2 | "Closing Money Slot" | "Success" | 2017-01-26T00:10:11.0000000Z |
| 1 | "Entering Withdraw Quantity" | "Success" | 2017-01-26T00:10:08.0000000Z |
| 1 | "Opening Money Slot" | "Warning" | 2017-01-26T00:10:14.0000000Z |
| 1 | "Printing Bank Balance" | "Warning" | 2017-01-26T00:10:19.0000000Z |

출력:

| ATM_id | First_Warning_Operation_id | Warning_Time |
| --- | --- | --- |
| 1 | "Opening Money Slot" | 2017-01-26T00:10:14.0000000Z |

SELECT *
FROM input TIMESTAMP BY time OVER ATM_id
MATCH_RECOGNIZE (
	LIMIT DURATION(minute, 1)
	PARTITION BY ATM_id
	MEASURES
		First(Warning.ATM_id) AS ATM_id,
		First(Warning.Operation_Id) AS First_Warning_Operation_id,
		First(Warning.Time) AS Warning_Time
	AFTER MATCH SKIP TO NEXT ROW
	PATTERN (Success+ Warning{2,})
	DEFINE
		Success AS Success.Return_Code = 'Success',
		Warning AS Warning.Return_Code <> 'Success'
) AS patternMatch

이 쿼리는 두 개 이상의 연속 실패 이벤트를 일치시키고 조건이 충족되면 경보를 생성합니다. PATTERN 은 일치에 사용할 정규식을 정의합니다. 이 경우 하나 이상의 성공적인 작업 후에 두 개 이상의 연속 경고가 발생합니다. 성공 및 경고는 조건이 충족되면 Return_Code 값을 사용하여 정의됩니다. MEASURES**는 ATM_id, 첫 번째 경고 작업 및 첫 번째 경고 시간과 함께 예측됩니다.

자세한 내용은 MATCH_RECOGNIZE 참조하세요.

위치 기반 경계 설정 및 지리 공간 쿼리

Azure Stream Analytics는 차량 관리, 승차 공유, 커넥티드 카 및 자산 추적과 같은 시나리오를 구현하는 데 사용할 수 있는 기본 제공 지리 공간적 기능을 제공합니다. 지리 공간적 데이터는 Eventstream 또는 참조 데이터의 일부로 GeoJSON 또는 WKT 형식으로 수집할 수 있습니다. 예를 들어 여권 인쇄를 위한 제조 기계 전문 회사가 정부 및 영사관에 컴퓨터를 임대합니다. 이러한 기계의 위치는 여권 위조에 대한 잘못된 위치와 가능한 사용을 피하기 위해 엄격하게 제어됩니다. 각 컴퓨터에는 GPS 추적기가 장착되어 있으며, 해당 정보는 Azure Stream Analytics 작업으로 다시 릴레이됩니다. 제조업체는 기계의 위치를 추적하고, 기계 중 하나가 허가된 구역을 벗어날 경우 경고를 받고자 합니다. 이렇게 함으로써 원격으로 기계를 비활성화하고, 당국에 알리며, 장비를 회수할 수 있습니다.

입력:

| Equipment_id | Equipment_current_location | Time |
| --- | --- | --- |
| 1 | "POINT(-122.13288797982818 47.64082002051315)" | 2017-01-26T00:10:00.0000000Z |
| 1 | "POINT(-122.13307252987875 47.64081350934929)" | 2017-01-26T00:11:00.0000000Z |
| 1 | "POINT(-122.13308862313283 47.6406508603241)" | 2017-01-26T00:12:00.0000000Z |
| 1 | "POINT(-122.13341048821462 47.64043760861279)" | 2017-01-26T00:13:00.0000000Z |

참조 데이터 입력:

| Equipment_id | Equipment_lease_location |
| --- | --- |
| 1 | "POLYGON((-122.13326028450979 47.6409833866794,-122.13261655434621 47.6409833866794,-122.13261655434621 47.64061471602751,-122.13326028450979 47.64061471602751,-122.13326028450979 47.6409833866794))" |

출력:

| Equipment_id | Equipment_alert_location | Time |
| --- | --- | --- |
| 1 | "POINT(-122.13341048821462 47.64043760861279)" | 2017-01-26T00:13:00.0000000Z |

SELECT
	input.Equipment_id AS Equipment_id,
	input.Equipment_current_location AS Equipment_current_location,
	input.Time AS Time
FROM input TIMESTAMP BY time
JOIN
	referenceInput 
	ON input.Equipment_id = referenceInput.Equipment_id
	WHERE 
		ST_WITHIN(input.Equipment_current_location, referenceInput.Equipment_lease_location) = 1

이 쿼리를 사용하면 제조업체가 컴퓨터 위치를 자동으로 모니터링하여 컴퓨터가 허용된 지오펜스를 벗어나면 경고를 받을 수 있습니다. 기본 제공 지리 공간적 기능을 사용하면 사용자가 타사 라이브러리 없이 쿼리 내에서 GPS 데이터를 사용할 수 있습니다.

자세한 내용은 Azure Stream Analytics 문서를 사용하여 지오펜싱 및 지리 공간적 집계 시나리오 를 참조하세요.

도움받기

추가 지원이 필요한 경우 Azure Stream Analytics용 Microsoft Q&A 질문 페이지를 참조하세요.

다음 단계

피드백

이 페이지가 도움이 되었나요?

Last updated on 2026-03-11

Azure Stream Analytics 및 Fabric Eventstream의 일반적인 쿼리 패턴

지원되는 데이터 형식

여러 출력으로 데이터 보내기

간단한 패스스루 쿼리

LIKE 및 NOT LIKE와 일치하는 문자열

과거 이벤트에 대한 계산

창에서 마지막 이벤트 반환

시간에 따른 데이터 집계

주기적으로 출력 값들

스트림의 이벤트 상관 관계 지정

이벤트 간 기간 검색

고유 값 개수

창에서 첫 번째 이벤트 검색

창에서 중복 이벤트 제거

다른 사례/값에 대한 논리 지정(CASE 문)

데이터 변환

조건의 기간 감지

독립적인 시간을 사용하여 이벤트 처리(하위 스트림)

세션 창

JavaScript 및 C의 사용자 정의 함수#

MATCH_RECOGNIZE를 사용한 고급 패턴 매칭

위치 기반 경계 설정 및 지리 공간 쿼리

도움받기

다음 단계

피드백

추가 리소스