分享方式:


對應資料流中的視窗轉換

適用於:Azure Data Factory Azure Synapse Analytics

提示

試用 Microsoft Fabric 中的 Data Factory,這是適用於企業的全方位分析解決方案。 Microsoft Fabric 涵蓋從資料移動到資料科學、即時分析、商業智慧和報告的所有項目。 了解如何免費開始新的試用 (部分機器翻譯)!

Azure Data Factory 和 Azure Synapse Pipelines 中均可使用資料流。 本文適用於對應資料流。 如果您不熟悉轉換作業,請參閱簡介文章使用對應資料流轉換資料

視窗轉換可供您定義資料流資料行的視窗型彙總。 在運算式產生器中,您可以定義以資料或時間視窗 (SQL OVER 子句) 為基礎的各種彙總,例如 LEAD、LAG、NTILE、CUMEDIST 和 RANK。 包含這些彙總的輸出中,會產生新的欄位。 您也可以包含選擇性的群組依據欄位。

此螢幕擷取畫面顯示已從功能表選取視窗。

目前超過

對於您的視窗轉換設定資料行資料的資料分割。 SQL 對等項目是 SQL 之中 Over 子句的 Partition By。 如果您想要建立計算,或建立要對於資料分割使用的運算式,可以將滑鼠停留在資料行名稱上,並選取「計算資料行」

此螢幕擷取畫面顯示已選取 [超過] 索引標籤的視窗設定。

Sort

Over 子句的另一個部分是設定 Order By。 這個子句會設定資料排序順序。 您也可以在此資料行欄位中建立排序用的計算值運算式。

螢幕擷取畫面顯示已選取 [排序] 索引標籤的視窗設定。

範圍依據

接下來,將視窗框架設定為「未繫結」或「已繫結」。 若要設定未繫結的視窗框架,可在兩端將滑桿設定為「未繫結」。 如果您選擇「未繫結」與「目前資料列」之間的設定,則您必須設定位移的開始及結束值。 這兩個值都是正整數。 您可以使用資料中的相對數字或值。

視窗滑桿有兩個值須設定:目前資料列之前的值,以及目前資料列之後的值。 開始與結束之間的位移符合滑桿上的兩個選取器。

螢幕擷取畫面顯示已選取 [範圍依據] 索引標籤的視窗設定。

視窗資料行

最後,使用運算式產生器定義您想要在資料視窗上使用的彙總,例如 RANK、COUNT、MIN、MAX、DENSE RANK、LEAD、LAG 等等。

可供您在資料流程運算式語言透過運算式產生器使用的彙總及分析函式的完整清單在此處:對應資料流程中的資料轉換運算式

如果您要尋求簡單的分組依據彙總,請使用彙總轉換