Поделиться через


Преобразование окна в сопоставлении потоков данных

ОБЛАСТЬ ПРИМЕНЕНИЯ: Фабрика данных Azure Azure Synapse Analytics

Совет

Попробуйте использовать фабрику данных в Microsoft Fabric, решение для аналитики с одним интерфейсом для предприятий. Microsoft Fabric охватывает все, от перемещения данных до обработки и анализа данных в режиме реального времени, бизнес-аналитики и отчетности. Узнайте, как бесплатно запустить новую пробную версию !

Потоки данных доступны как в конвейерах Фабрики данных Azure, так и в конвейерах Azure Synapse Analytics. Эта статья относится к сопоставлению потоков данных. Если вы не знакомы с преобразованиями, ознакомьтесь с вводной статьей "Преобразование данных с помощью сопоставления потоков данных".

Преобразование «Окно» — это процесс, в котором вы определяете агрегирование столбцов в потоках данных с использованием окон. В построителе выражений можно определить различные типы агрегатов, основанные на данных или временных окнах (предложение SQL OVER), таких как LEAD, LAG, NTILE, CUMEDIST и RANK. В ваших выходных данных создается новое поле, включающее эти агрегации. Вы также можете включить дополнительные поля "Группировать по".

Снимок экрана показывает, что в меню выбран пункт

Более

Задайте секционирование данных столбцов для своего преобразования окна. Эквивалент в SQL — это параметр Partition By в предложении Over в SQL. Если вы хотите создать вычисление или создать выражение для секционирования, это можно сделать, наведите указатель мыши на имя столбца и выберите вычисляемый столбец.

Снимок экрана: параметры работы с окнами с выбранной вкладкой

Сортировать

Еще одна функция предложения Over —это установка параметра Order By. Это предложение задает порядок сортировки данных. Вы также можете создать выражение для вычисляемого значения в этом столбце для сортировки.

Снимок экрана: параметры работы с окнами с выбранной вкладкой

Диапазон по

Затем задайте для рамки окна параметр "Неограниченная" или "Ограниченная". Чтобы сделать рамку окна неограниченной, установите ползунок в положение "Неограниченная" с двух концов. Если вы выберете вариант между положениями "Неограниченная" и "Текущая строка", вам нужно задать начальное и конечное значение смещения. Оба значения являются положительными целыми числами. Вы можете использовать относительные числа или значения из своих данных.

Ползунок окна задает два значения: значения перед текущей строкой и значения после текущей строки. Смещение между началом и концом соответствует двум селекторам на слайдере.

Снимок экрана: параметры окна с выбранной вкладкой

Столбцы окна

Наконец, с помощью построителя выражений определите объединения, которые вы хотите использовать с окнами данных, например RANK, COUNT, MIN, MAX, DENSE RANK, LEAD, LAG и т. д.

Полный список агрегатных и аналитических функций, доступных для использования в Data Flow Expression Language с помощью построителя выражений, приведен в разделе Преобразование данных в потоках данных.

Если вы ищете простую агрегацию по группам, используйте трансформацию "Агрегат"