分享方式


快速開始:建立複製工作

在 Data Factory 中的複製任務可以導入資料,而不需要建立 Fabric 管線。 它彙集了各種複製模式,例如大量或批次、增量或連續複製,以統一體驗。 如果您只需要複製資料而不需轉換,請使用複製作業。

本快速入門指南會逐步引導您使用複製作業,將數據從 Fabric Warehouse 表格逐步複製到 Fabric Lakehouse 表格。

如需一般複製作業的詳細資訊,請參閱:

先決條件

開始之前,請先完成下列必要條件:

  • 具有使用中訂閱的 Microsoft Fabric 租戶。 您可以 建立免費帳戶

  • Microsoft Fabric 工作區。

  • 布料倉庫。

  • 倉儲中的數據表,其中包含增量數據行,例如時間戳或遞增的整數數據行,可作為變更偵測的浮浮水印。 您也可以使用此腳本來建立範例 Employee 資料表:

    CREATE TABLE dbo.Employee 
    
    ( 
        EmployeeID INT NOT NULL, 
        FirstName VARCHAR(40), 
        LastName VARCHAR(40), 
        Position VARCHAR(60), 
        ModifiedDate DATETIME2(3) 
    ); 
    

    插入範例資料:

    INSERT INTO dbo.Employee (EmployeeID, FirstName, LastName, Position, ModifiedDate) 
    VALUES  
    (1, 'Alice', 'Smith', 'Data Analyst', SYSDATETIME()), 
    (2, 'Bob', 'Johnson', 'Engineer', SYSDATETIME()), 
    (3, 'Carol', 'Lee', 'Manager', SYSDATETIME()), 
    (4, 'David', 'Wong', 'Data Scientist', SYSDATETIME()), 
    (5, 'Eve', 'Garcia', 'Product Owner', SYSDATETIME());
    

    已建立員工數據表的螢幕快照。

創建複製作業

  1. Microsoft [網狀架構] 工作區 中,選取 [+ 新增專案],然後在 [ 取得數據 ] 下選擇 [ 複製作業]。

    [Fabric] 工作區的螢幕截圖,其中已選取新項目按鈕,並在 [取得資料] 底下醒目提示複製作業。

  2. 為您的複製作業命名,然後選取 [ 建立]。

    具名複製作業的螢幕快照,其中已凸顯「建立」按鈕。

設定累加複製

  1. 在 [複製作業精靈] 的 [選擇資料來源] 頁面中,選取您的 Fabric Warehouse。

    複製作業建立精靈的 [選擇數據源] 頁面螢幕快照,其中已選取倉儲。

  2. 在 [ 選擇數據] 頁面中,選取包含累加數據行的來源 Warehouse 數據表。 選取 下一步

    選擇資料頁面的螢幕快照,其中已選取員工 SQL 資料表。

  3. 在 [選擇數據目的地] 頁面中,選取 [新增網狀架構] 專案下的 [Lakehouse]。

    [選擇數據目的地] 頁面的螢幕快照,其中已選取 Lakehouse。

  4. 提供新 Lakehouse 的名稱,然後選取 [ 建立並連線]。

    新 Lakehouse 命名視窗的螢幕快照,其中已選取 [建立並連線]。

  5. 在 [ 對應至目的地 ] 頁面上,選擇 [ 數據表],選擇性地重新命名目的地數據表,然後選取 [ 下一步]。

    地圖目的地頁面的螢幕快照,其中已選取員工表格。

  6. 在 [ 設定] 步驟中,選擇 [ 增量複製 ] 作為 [複製作業] 模式。 選取作為遞增欄的欄位。 針對範例表格,那就是 ModifiedDate

    設定頁面的螢幕快照,已選擇增量複製,並且將增量欄位設定為ModifiedDate。

執行和監視複製作業

  1. 在 [ 檢閱 + 儲存 ] 頁面上,確認您的設定。 將預設選項保留為 [立即啟動數據傳輸 ],並選擇性地將複製作業每隔 1 分鐘執行一次,以加快變更追蹤的速度。

  2. 儲存複製作業,然後選取 [ 儲存 + 執行 ] 按鈕來啟動第一次執行。

    [檢閱和儲存] 頁面的螢幕快照,其中 [執行選項] 設定為每隔一分鐘執行一次。

  3. 成功儲存複製工作項目之後,它會啟動第一次執行,以從來源資料表匯入初始資料。

  4. 使用 [ 複製作業] 面板[監視中樞 ] 來監視進度。 進一步了解監控複製作業

    監視中樞的螢幕快照,其中顯示已讀取五個數據列並寫入五個數據列的成功作業。

使用新數據模擬變更

  1. 如果您使用範例數據表,請使用下列 SQL 查詢,將新的數據列插入 Source Fabric Warehouse 數據表中。

    INSERT INTO dbo.Employee (EmployeeID, FirstName, LastName, Position, ModifiedDate) VALUES (6, 'John', 'Miller', 'QA Engineer', SYSDATETIME()); 
    INSERT INTO dbo.Employee (EmployeeID, FirstName, LastName, Position, ModifiedDate) VALUES (7, 'Emily', 'Clark', 'Business Analyst', SYSDATETIME()); 
    INSERT INTO dbo.Employee (EmployeeID, FirstName, LastName, Position, ModifiedDate) VALUES (8, 'Michael', 'Brown', 'UX Designer', SYSDATETIME()); 
    
  2. 複製作業會使用增量欄位,在下一次排定的執行中偵測這些數據列。

    監控頁面的螢幕截圖顯示成功作業,讀取了三行並寫入了三行。

  3. 在下一次執行之後,查詢目標 Fabric Lakehouse 數據表以確認數據表已移動。

    Fabric Lakehouse 數據表的螢幕快照,其中顯示寫入數據表的所有數據列。