Real-Time Analytics 자습서 5부: 고급 KQL 쿼리 사용

중요

Microsoft Fabric은 미리 보기로 제공됩니다.

참고

이 자습서는 시리즈의 일부입니다. 이전 섹션은 자습서 4부: KQL 및 SQL을 사용하여 데이터 탐색을 참조하세요.

KQL 쿼리 세트 만들기

다음 단계에서는 Kusto 쿼리 언어 고급 데이터 분석 기능을 사용하여 데이터베이스에 수집한 두 테이블을 쿼리합니다.

  1. NycTaxiDB라는 KQL 데이터베이스로 이동합니다.

  2. 새 관련 항목>KQL 쿼리 집합 선택

    새 관련 KQL 쿼리 세트를 만드는 옵션을 보여 주는 새 관련 항목 드롭다운의 스크린샷

  3. nyctaxiqs를 KQL 쿼리 세트 이름으로 입력합니다.

  4. 만들기를 선택합니다. KQL 쿼리 세트가 여러 개의 자동 채워진 샘플 쿼리와 함께 열립니다.

쿼리 데이터

이 섹션에서는 KQL 쿼리 세트의 쿼리 및 시각화 기능 중 일부를 안내합니다. 쿼리를 복사하여 사용자 고유의 쿼리 편집기에서 붙여넣어 결과를 실행하고 시각화합니다.

  1. 다음 쿼리는 노란색 택시에 대한 뉴욕시의 상위 10개 픽업 위치를 반환합니다.

    nyctaxitrips
    | summarize Count=count() by PULocationID
    | top 10 by Count
    

    Microsoft Fabric에서 Real-Time Analytics의 쿼리 결과 스크린샷

  2. 이 쿼리는 위치 테이블을 사용하여 상위 10개 픽업 위치의 해당 영역을 조회하여 이전 쿼리에 단계를 추가합니다. 조회 연산자는 차원 테이블에서 조회된 값으로 팩트 테이블의 열을 확장합니다.

    nyctaxitrips
    | lookup (Locations) on $left.PULocationID == $right.LocationID
    | summarize Count=count() by Zone
    | top 10 by Count
    | render columnchart
    

    Microsoft Fabric의 Real-Time Analytics에서 상위 10개 위치 결과의 스크린샷

  3. 또한 KQL은 변칙을 검색하는 기계 학습 기능을 제공합니다. 맨해튼 자치구의 고객이 제공한 팁에서 변칙을 검사 보겠습니다. 이 쿼리는 series_decompose_anomalies 함수를 사용합니다.

    nyctaxitrips
    | lookup (Locations) on $left.PULocationID==$right.LocationID
    | where Borough == "Manhattan"
    | make-series s1 = avg(tip_amount) on tpep_pickup_datetime from datetime(2022-06-01) to datetime(2022-06-04) step 1h
    | extend anomalies = series_decompose_anomalies(s1)
    | render anomalychart with (anomalycolumns=anomalies)
    

    Microsoft Fabric의 Real-Time Analytics에서 변칙 차트 결과의 스크린샷

    빨간색 점 위로 마우스를 가져가서 변칙 값을 확인합니다.

  4. 또한 series_decompose_forecast 함수의 예측 능력을 사용하여 맨해튼 자치구에서 충분한 택시가 작동하는지 확인하고 시간당 필요한 택시 수를 예측할 수 있습니다.

    nyctaxitrips
    | lookup (Locations) on $left.PULocationID==$right.LocationID
    | where Borough == "Manhattan"
    | make-series s1 = count() on tpep_pickup_datetime from datetime(2022-06-01) to datetime(2022-06-08)+3d step 1h by PULocationID
    | extend forecast = series_decompose_forecast(s1, 24*3)
    | render timechart
    

    Microsoft Fabric의 Real-Time Analytics에서 예측 결과의 스크린샷

추가 정보

이 자습서에서 수행된 작업에 대한 자세한 내용은 다음을 참조하세요.

다음 단계