Поделиться через


Преобразование окна в потоке данных для сопоставления

ОБЛАСТЬ ПРИМЕНЕНИЯ: Фабрика данных Azure Azure Synapse Analytics

Совет

Попробуйте использовать фабрику данных в Microsoft Fabric, решение для аналитики с одним интерфейсом для предприятий. Microsoft Fabric охватывает все, от перемещения данных до обработки и анализа данных в режиме реального времени, бизнес-аналитики и отчетности. Узнайте, как бесплатно запустить новую пробную версию !

Потоки данных доступны в конвейерах как Фабрики данных Azure, так и Azure Synapse. Эта статья относится к потокам данных для сопоставления. Если вы не знакомы с преобразованиями, см. вводную статью Преобразование данных с помощью потока данных для сопоставления.

Преобразование окна позволяет определять агрегирования столбцов на основе окон в ваших потоках данных. В построителе выражений вы можете определить различные типы объединений на основе данных или временных окон (предложение SQL OVER, например LEAD, LAG, NTILE, CUMEDIST, RANK и т. д.). В ваших выходных данных будет сгенерировано новое поле, которое будет включать такие агрегаты. Вы также можете включить дополнительные поля "Группировать по".

Снимок экрана: меню с выбранным пунктом

Более

Задайте секционирование данных столбцов для своего преобразования окна. Эквивалент в SQL — это параметр Partition By в предложении Over в SQL. Если вы хотите создать расчет или выражение для секционирования, вы можете сделать это, наведя курсор на имя столбца и выбрав "Вычисляемый столбец".

Снимок экрана: параметры работы с окнами с выбранной вкладкой

Сортировать

Еще одна функция предложения Over —это установка параметра Order By. Он задает порядок сортировки данных. Вы также можете создать выражение для значения расчета в этом поле столбца для сортировки.

Снимок экрана: параметры работы с окнами с выбранной вкладкой

Range By

Затем задайте для рамки окна параметр "Неограниченная" или "Ограниченная". Чтобы сделать рамку окна неограниченной, установите ползунок в положение "Неограниченная" с двух концов. Если вы выберете вариант между положениями "Неограниченная" и "Текущая строка", вам нужно задать начальное и конечное значение смещения. Оба значения должны быть положительными целыми числами. Вы можете использовать относительные числа или значения из своих данных.

Ползунок окна задает два значения: значения перед текущей строкой и значения после текущей строки. Начальное и конечное значения смещения соответствуют двум селекторам на ползунке.

Снимок экрана: параметры окна с выбранной вкладкой

Столбцы окна

Наконец, с помощью построителя выражений определите объединения, которые вы хотите использовать с окнами данных, например RANK, COUNT, MIN, MAX, DENSE RANK, LEAD, LAG и т. д.

Снимок экрана: результат действия работы с окнами.

Полный список агрегатных и аналитических функций, которые доступны для использования в языке выражений потоков данных ADF в построителе выражений, приведен в разделе Выражения преобразования данных в потоке данных для сопоставления.

Если вам требуется простое агрегирование по группам, используйте преобразование "Статистическая обработка".