對應資料流中的聯集轉換
適用於:Azure Data Factory Azure Synapse Analytics
提示
試用 Microsoft Fabric 中的 Data Factory,這是適用於企業的全方位分析解決方案。 Microsoft Fabric 涵蓋從資料移動到資料科學、即時分析、商業智慧和報告的所有項目。 了解如何免費開始新的試用!
Azure Data Factory 和 Azure Synapse Pipelines 中均可使用資料流。 本文適用於對應資料流。 如果您不熟悉轉換作業,請參閱簡介文章:使用對應資料流轉換資料。
集合聯集會將多個資料流結合在一起,並使那些資料流的 SQL 集合聯集成為來自集合聯集轉換的新輸出。 每個輸入資料流中的所有結構描述都會在資料流程內合併,而不需有聯結索引鍵。
您可以透過選取每個已設定資料列旁的 "+" 圖示,來合併設定資料表中的 n 個資料流,包括來源資料,以及資料流程中現有轉換的資料流。
下列簡短影片將逐步解說對應資料流中的聯集轉換:
在此案例中,您可以合併來自多個來源的不同中繼資料 (在此範例中,有三個不同的來源檔案),並將其合併成單一資料流:
若要達成此目的,請透過包括您希望新增的所有來源,在 [聯集設定] 中新增額外的資料列。 不需要通用的查閱或聯結索引鍵:
如果您在聯集之後設定 [選取] 轉換,就能將重疊的欄位或未從無標頭來源命名的欄位重新命名。 按一下 [檢查],以查看此範例中來自三個不同來源且總計 132 個資料行的合併中繼資料:
名稱和位置
當您選擇 [依名稱聯集] 時,每個資料行值都將從每個來源放入對應資料行,並具有新的串連中繼資料結構描述。
如果您選擇 [依位置聯集],每個資料行值都將從每個對應來源放入原始位置,因而產生新的合併資料流,其中每個來源的資料都會新增至相同的資料流: