Data Factory のジョブをコピーすると、Fabric データ パイプラインを作成しなくてもデータが取り込まれます。 一括コピーやバッチコピー、増分コピー、連続コピーなど、さまざまなコピー パターンを統合されたエクスペリエンスにまとめます。 変換なしでデータをコピーする必要がある場合は、コピー ジョブを使用します。
このクイック スタート ガイドでは、コピー ジョブを使用して、Fabric Warehouse テーブルから Fabric Lakehouse テーブルにデータを増分コピーする方法について説明します。
コピー ジョブ全般の詳細については、以下を参照してください。
[前提条件]
開始する前に、次の前提条件を満たす必要があります。
アクティブなサブスクリプションを持つ Microsoft Fabric テナント。 無料アカウントを作成することができます。
変更検出の基準値として機能するタイムスタンプや増加する整数列などの増分列を含む、ウェアハウス内のテーブル。 このスクリプトを使用して、サンプルの Employee テーブルを作成することもできます。
CREATE TABLE dbo.Employee ( EmployeeID INT NOT NULL, FirstName VARCHAR(40), LastName VARCHAR(40), Position VARCHAR(60), ModifiedDate DATETIME2(3) );
サンプル データを挿入します。
INSERT INTO dbo.Employee (EmployeeID, FirstName, LastName, Position, ModifiedDate) VALUES (1, 'Alice', 'Smith', 'Data Analyst', SYSDATETIME()), (2, 'Bob', 'Johnson', 'Engineer', SYSDATETIME()), (3, 'Carol', 'Lee', 'Manager', SYSDATETIME()), (4, 'David', 'Wong', 'Data Scientist', SYSDATETIME()), (5, 'Eve', 'Garcia', 'Product Owner', SYSDATETIME());
Copy ジョブを作成する
Microsoft Fabric ワークスペースで [+ 新しい項目] を選択し、[データの取得] で [ジョブのコピー] を選択します。
コピー ジョブに名前を付け、[ 作成] を選択します。
増分コピーを構成する
コピー ジョブ ウィザードの [ データ ソースの選択 ] ページで、Fabric Warehouse を選択します。
[ データの選択 ] ページで、増分列を含むソース ウェアハウス テーブルを選択します。 [次へ] を選択します。
[データ変換先の選択] ページで、[新しいファブリック] 項目の下にある [Lakehouse] を選択します。
新しい Lakehouse の名前を指定し、[ 作成して接続] を選択します。
[ マップ先] ページで 、[ テーブル] を選択し、必要に応じて変換先テーブルの名前を変更して、[ 次へ] を選択します。
[設定] ステップで、コピー ジョブのモードとして [増分コピー] を選択します。 増分列として機能する列を選択します。 サンプル テーブルの場合は ModifiedDate です。
コピー ジョブを実行して監視する
[ 確認と保存 ] ページで、設定を確認します。 既定のオプションを [ データ転送をすぐに開始 する] のままにし、必要に応じて、変更の追跡を高速化するためにコピー ジョブの実行を 1 分ごとに設定します。
コピー ジョブを保存し、[ 保存 + 実行 ] ボタンを選択して最初の実行を開始します。
コピー ジョブ成果物が正常に保存されると、最初の実行が開始され、ソース テーブルから初期データが取り込まれます。
[ ジョブのコピー] パネル または 監視ハブ を使用して進行状況を監視します。 コピー ジョブの監視について詳しく知る
新しいデータを使用して変更をシミュレートする
サンプル テーブルを使用した場合は、次の SQL クエリを使用して、Source Fabric Warehouse テーブルに新しい行を挿入します。
INSERT INTO dbo.Employee (EmployeeID, FirstName, LastName, Position, ModifiedDate) VALUES (6, 'John', 'Miller', 'QA Engineer', SYSDATETIME()); INSERT INTO dbo.Employee (EmployeeID, FirstName, LastName, Position, ModifiedDate) VALUES (7, 'Emily', 'Clark', 'Business Analyst', SYSDATETIME()); INSERT INTO dbo.Employee (EmployeeID, FirstName, LastName, Position, ModifiedDate) VALUES (8, 'Michael', 'Brown', 'UX Designer', SYSDATETIME());
コピー ジョブは、増分列を使用して、次回のスケジュールされた実行中にこれらの行を検出します。
次の実行後、ターゲットの Fabric Lakehouse テーブルにクエリを実行して、テーブルが移動されたことを確認します。