了解 Kusto 查詢的基本結構
所有產業中的組織都會處理持續不斷的資料流程,而且必須將該資料轉換成有意義、可採取動作的深入解析。 在氣象案例中,您已獲得美國暴風雨資料的資料集。 在本單元中,您將了解 Kusto 查詢語言 (KQL) 的基本結構,以便用其來分析及解譯此資料集。
什麼是 Kusto 查詢?
Kusto 查詢是處理資料和傳回結果的唯讀要求。 該要求採用易於理解、撰寫及自動化的純文字加以陳述。 Kusto 查詢有一個或多個查詢陳述式,並且會以表格式或圖形格式傳回資料。
表格式查詢陳述式可包含零個或多個運算子。 每個運算子都是以表格式輸入開頭,並傳回表格式輸出。 運算子是由管道所排序 ( |
)。 資料流程--或從一個運算子輸送至下一個。 資料會在每個步驟進行篩選或操作,然後再送至後續步驟。
把它想像成一個漏斗圖,您可以從整個資料表開始。 每次資料通過另一個運算子時,就會進行篩選、重新排列或進行摘要。 由於從某個運算子到另一個運算子的管道資訊會依序排列,因此查詢運算子順序很重要。 在漏斗圖的結尾,您會得到一個精簡的輸出。
這些運算子皆專屬於 KQL (雖然通常與 SQL 或其他語言類似)。
讓我們看看以下範例查詢:
StormEvents
| where StartTime between (datetime(2007-11-01) .. datetime(2007-12-01))
| where State == "FLORIDA"
| count
查詢會以名爲 StormEvents 的資料表參考開頭,並包含運算子 where
和 count
。 每個運算子都會以管道分隔。 來源資料表的資料列會依 StartTime 資料行的值進行篩選,然後依 [狀態] 資料行的值來篩選。 在最後一行中,查詢會傳回具有單一資料行的資料表,以及包含其餘資料列計數的單一資料列。
在下一個單元中,您將連線到資料集,並了解一些最常使用的運算子。 然後,您將使用運算子來回答包含美國氣象資料的範例資料集相關問題。