Группирование данных с помощью агрегатных функций
Организации во всех секторах имеют дело с постоянным потоком данных и должны превратить эти данные в значимые, практические аналитические сведения. В этом сценарии по метеорологическим наблюдениям вы получили набор данных с данными о неблагоприятных погодных явлениях и их последствиях в США. В предыдущем модуле вы узнали, как создавать базовые запросы для изучения данных.
В этом уроке вы узнаете о сравнении групп данных и визуальном представлении результатов с помощью языка запросов Kusto (KQL).
Сравнение групп данных
Данные в сценарии событий грозы представлены на уровне событий, что означает, что каждая строка представляет определенное событие грозы и связанную с ним информацию. Отдельных гроз было немало, и глядя на отдельные события, может быть трудно получить значимые аналитические сведения. Если вы группируете эти отдельные события по общим полям (например, расположением), то можно выполнять значимые сравнения между группами.
Функция агрегирования позволяет выполнять эти сравнения путем группировки значений нескольких строк для формирования единого суммарного значения. Тип суммарного значения зависит от используемой функции и может быть числом, средним, максимальным, минимальным или медианным значением, и этот список неполон. Например, на следующем рисунке приводится сводка по количеству типов штормов в зависимости от расположения.
Визуальное представление результатов
После группировки данных необходимо получить аналитические сведения из результатов. Выходные данные по умолчанию для запросов являются табличными. Однако во многих сценариях графическое представление может лучше передать их. Мы рассмотрим некоторые способы преобразования результатов запроса Kusto в графические визуализации с помощью оператора render
.
Некоторые доступные типы визуализации: linechart
, columnchart
, barchart
, piechart
, scatterchart
, pivotchart
и другие. На следующем рисунке показан пример результатов запроса Kusto, отображаемых в виде линейного графика, гистограммы и линейчатой диаграммы.
В следующих уроках мы рассмотрим некоторые из наиболее распространенных функций агрегирования, визуализируем результаты с помощью оператора render
, а затем создадим сложные запросы. Эти навыки KQL помогут получить аналитические сведения из образца набора данных, содержащего метеорологические данные США.