次の方法で共有


クイック スタート: コピー ジョブを作成する

Data Factory のジョブをコピーすると、Fabric データ パイプラインを作成しなくてもデータが取り込まれます。 一括コピーやバッチコピー、増分コピー、連続コピーなど、さまざまなコピー パターンを統合されたエクスペリエンスにまとめます。 変換なしでデータをコピーする必要がある場合は、コピー ジョブを使用します。

このクイック スタート ガイドでは、コピー ジョブを使用して、Fabric Warehouse テーブルから Fabric Lakehouse テーブルにデータを増分コピーする方法について説明します。

コピー ジョブ全般の詳細については、以下を参照してください。

[前提条件]

開始する前に、次の前提条件を満たす必要があります。

  • アクティブなサブスクリプションを持つ Microsoft Fabric テナント。 無料アカウントを作成することができます。

  • Microsoft Fabric ワークスペース..

  • ファブリック ウェアハウス。

  • 変更検出の基準値として機能するタイムスタンプや増加する整数列などの増分列を含む、ウェアハウス内のテーブル。 このスクリプトを使用して、サンプルの Employee テーブルを作成することもできます。

    CREATE TABLE dbo.Employee 
    
    ( 
        EmployeeID INT NOT NULL, 
        FirstName VARCHAR(40), 
        LastName VARCHAR(40), 
        Position VARCHAR(60), 
        ModifiedDate DATETIME2(3) 
    ); 
    

    サンプル データを挿入します。

    INSERT INTO dbo.Employee (EmployeeID, FirstName, LastName, Position, ModifiedDate) 
    VALUES  
    (1, 'Alice', 'Smith', 'Data Analyst', SYSDATETIME()), 
    (2, 'Bob', 'Johnson', 'Engineer', SYSDATETIME()), 
    (3, 'Carol', 'Lee', 'Manager', SYSDATETIME()), 
    (4, 'David', 'Wong', 'Data Scientist', SYSDATETIME()), 
    (5, 'Eve', 'Garcia', 'Product Owner', SYSDATETIME());
    

    作成された従業員テーブルのスクリーンショット。

Copy ジョブを作成する

  1. Microsoft Fabric ワークスペースで [+ 新しい項目] を選択し、[データの取得] で [ジョブのコピー] を選択します。

    [新しい項目] ボタンが選択され、[データの取得] の下で [コピー ジョブ] が強調表示されている Fabric ワークスペースのスクリーンショット。

  2. コピー ジョブに名前を付け、[ 作成] を選択します。

    [作成] ボタンが強調表示されている名前付きコピー ジョブのスクリーンショット。

増分コピーを構成する

  1. コピー ジョブ ウィザードの [ データ ソースの選択 ] ページで、Fabric Warehouse を選択します。

    コピー ジョブ作成ウィザードの [データ ソースの選択] ページのスクリーンショット。ウェアハウスが選択されています。

  2. [ データの選択 ] ページで、増分列を含むソース ウェアハウス テーブルを選択します。 [次へ] を選択します。

    従業員の SQL テーブルが選択されている [データの選択] ページのスクリーンショット。

  3. [データ変換先の選択] ページで、[新しいファブリック] 項目の下にある [Lakehouse] を選択します。

    [データ変換先の選択] ページのスクリーンショット。Lakehouse が選択されています。

  4. 新しい Lakehouse の名前を指定し、[ 作成して接続] を選択します。

    [作成と接続] が選択されている新しい lakehouse の名前付けウィンドウのスクリーンショット。

  5. [ マップ先] ページで 、[ テーブル] を選択し、必要に応じて変換先テーブルの名前を変更して、[ 次へ] を選択します。

    従業員テーブルが選択されている移動先へのマップ ページのスクリーンショット。

  6. [設定] ステップで、コピー ジョブのモードとして [増分コピー] を選択します。 増分列として機能する列を選択します。 サンプル テーブルの場合は ModifiedDate です

    増分コピーが選択され、増分列が ModifiedDate に設定されている設定ページのスクリーンショット。

コピー ジョブを実行して監視する

  1. [ 確認と保存 ] ページで、設定を確認します。 既定のオプションを [ データ転送をすぐに開始 する] のままにし、必要に応じて、変更の追跡を高速化するためにコピー ジョブの実行を 1 分ごとに設定します。

  2. コピー ジョブを保存し、[ 保存 + 実行 ] ボタンを選択して最初の実行を開始します。

    1 分ごとにスケジュールに従って実行するように実行オプションが設定されている[確認と保存] ページのスクリーンショット。

  3. コピー ジョブ成果物が正常に保存されると、最初の実行が開始され、ソース テーブルから初期データが取り込まれます。

  4. [ ジョブのコピー] パネル または 監視ハブ を使用して進行状況を監視します。 コピー ジョブの監視について詳しく知る

    5 つの行が読み取られ、5 行が書き込まれた成功したジョブを示す監視ハブのスクリーンショット。

新しいデータを使用して変更をシミュレートする

  1. サンプル テーブルを使用した場合は、次の SQL クエリを使用して、Source Fabric Warehouse テーブルに新しい行を挿入します。

    INSERT INTO dbo.Employee (EmployeeID, FirstName, LastName, Position, ModifiedDate) VALUES (6, 'John', 'Miller', 'QA Engineer', SYSDATETIME()); 
    INSERT INTO dbo.Employee (EmployeeID, FirstName, LastName, Position, ModifiedDate) VALUES (7, 'Emily', 'Clark', 'Business Analyst', SYSDATETIME()); 
    INSERT INTO dbo.Employee (EmployeeID, FirstName, LastName, Position, ModifiedDate) VALUES (8, 'Michael', 'Brown', 'UX Designer', SYSDATETIME()); 
    
  2. コピー ジョブは、増分列を使用して、次回のスケジュールされた実行中にこれらの行を検出します。

    3 つの行が読み取られ、3 行が書き込まれた成功したジョブを示す監視ページのスクリーンショット。

  3. 次の実行後、ターゲットの Fabric Lakehouse テーブルにクエリを実行して、テーブルが移動されたことを確認します。

    Fabric Lakehouse テーブルのスクリーンショット。テーブルに書き込まれたすべての行が表示されています。