對應資料流中的視窗轉換

適用於:Azure Data Factory Azure Synapse Analytics

提示

試用 Microsoft Fabric 中的 Data Factory,這是適用於企業的全方位分析解決方案。 Microsoft Fabric 涵蓋從資料移動到資料科學、即時分析、商業智慧和報告的所有項目。 了解如何免費開始新的試用

Azure Data Factory 和 Azure Synapse Pipelines 中均可使用資料流。 本文適用於對應資料流。 如果您不熟悉轉換作業,請參閱簡介文章使用對應資料流轉換資料

視窗轉換可供您定義資料流資料行的視窗型彙總。 在運算式產生器中,您可以定義以資料或時間視窗 (SQL OVER 子句) 為基礎的各種彙總,例如 LEAD、LAG、NTILE、CUMEDIST、RANK 等等。 包含這些彙總的輸出中,將產生新的欄位。 您也可以包含選擇性的群組依據欄位。

Screenshot shows Windowing selected from the menu.

目前超過

對於您的視窗轉換設定資料行資料的資料分割。 SQL 對等項目是 SQL 之中 Over 子句的 Partition By。 如果您想要建立計算,或建立要對於資料分割使用的運算式,可以將滑鼠停留在資料行名稱上,並選取「計算資料行」。

Screenshot shows Windowing Settings with the Over tab selected.

Sort

Over 子句的另一個部分是設定 Order By。 這會設定資料排序順序。 您也可以在此資料行欄位中建立排序用的計算值運算式。

Screenshot shows Windowing Settings with the Sort tab selected.

範圍依據

接下來,將視窗框架設定為「未繫結」或「已繫結」。 若要設定未繫結的視窗框架,可在兩端將滑桿設定為「未繫結」。 如果您選擇「未繫結」與「目前資料列」之間的設定,則您必須設定位移的開始及結束值。 這兩個值會是正整數。 您可以使用資料中的相對數字或值。

視窗滑桿有兩個值須設定:目前資料列之前的值,以及目前資料列之後的值。 開始和結束位移符合滑桿上的兩個選取器。

Screenshot shows Windowing Settings with the Range by tab selected.

視窗資料行

最後,使用運算式產生器定義您想要在資料視窗上使用的彙總,例如 RANK、COUNT、MIN、MAX、DENSE RANK、LEAD、LAG 等等。

Screenshot shows the result of the windowing action.

可供您在資料流程運算式語言透過運算式產生器使用的彙總及分析函式的完整清單在此處:對應資料流程中的資料轉換運算式

如果您要尋求簡單的分組依據彙總,請使用彙總轉換