クイックスタート: 初めてのパイプラインを作成してデータをコピーする

このクイックスタートでは、サンプル データセットを Lakehouse に移動するデータ パイプラインを構築します。 このエクスペリエンスでは、パイプラインの Copy アクティビティを使用する方法と、データを Lakehouse に読み込む方法に関する簡単なデモを示します。

前提条件

開始するには、次の前提条件を満たしている必要があります。

データ パイプラインを作成する

  1. Power BI に移動します。

  2. 画面の左下にある Power BI アイコンを選択し、[データ ファクトリ] を選択して Data Factory のホームページを開きます。

    Screenshot with the data factory experience emphasized.

  3. Microsoft Fabric ワークスペースに移動します。 前の「前提条件」セクションで新しいワークスペースを作成した場合は、それを使用します。

    Screenshot of the workspaces window where you navigate to your workspace.

  4. [Data pipeline] (データ パイプライン) を選択し、パイプライン名を入力して新しいパイプラインを作成します。

    Screenshot showing the new data pipeline button in the newly created workspace.Screenshot showing the name of creating a new pipeline.

パイプラインを使用してデータをコピーする

このセッションでは、パイプラインによって提供されるサンプル データセットを Lakehouse にコピーするための以下の手順に従って、最初のパイプラインの構築を開始します。

手順 1: コピー アシスタントを使用して作業を開始する

  1. キャンバス上で [データのコピー] を選択すると、コピー アシスタント ツールが開き、作業を開始できます。

    Screenshot showing the Copy data button.

手順 2 - ソースを構成する

  1. [Public Holidays] (祝日) サンプル データを選択し、[次へ] を選択します。

    Screenshot showing the Choose data source page of the Copy data assistant with the Public Holidays sample data selected.

  2. アシスタントの [データ ソースに接続] ページに、[Public Holidays] (祝日) サンプル データのプレビューが表示されます。続いて、[次へ] をクリックします。

    Screenshot showing the sample data for the Public Holidays sample data.

手順 3: コピー先を構成する

  1. [レイクハウス] を選択し、[次へ] を選択します。

    Screenshot showing the selection of the Lakehouse destination in the Copy data assistant.

  2. [Create new Lakehouse] (新しい Lakehouse の作成) を選択して、[Lakehouse 名] に入力し、[次へ] を選択します。

    Screenshot showing the Create new Lakehouse button selected on the Choose data destination page of the Copy data assistant.

  3. ソース データを構成し、コピー先の Lakehouse テーブルにマップします。 [テーブル] を選択し、[ルート フォルダー] の下の [テーブル名] を指定します。次に、[Table action] (テーブル アクション)[上書き] オプションを選択し、[次へ] を選択します。

    Screenshot showing the Connect to data destination page of the Copy data assistant with Tables selected and a table name for the sample data provided.

手順 4: Copy アクティビティを確認して作成する

  1. 前の手順で行った Copy アクティビティの設定を確認し、[OK] を選んで完了します。 または、必要に応じてツールで前の手順に戻って、設定を編集することもできます。

    Screenshot of the Review + create page of the Copy data assistant highlighting source and destination.

  2. Copy アクティビティが新しいデータ パイプライン キャンバスに追加されます。 作成した [データのコピー] アクティビティが選択されると、アクティビティの詳細設定を含むすべての設定がパイプライン キャンバスの下のタブで利用可能になります。

    Screenshot showing the completed Copy activity with the Copy activity settings tabs highlighted.

データ パイプラインを実行およびスケジュールする

  1. [ホーム] タブに切り替えて、[実行] を選択します。 確認ダイアログが表示されます。 次に、[保存および実行] を選択してアクティビティを開始します。

    Screenshot showing the Run button on the Home tab, and the Save and run prompt displayed.

  2. 実行中のプロセスを監視し、パイプライン キャンバスの下にある [出力] タブで結果を確認できます。 実行の詳細を表示するには、[実行の詳細] ボタン (眼鏡のアイコンが強調表示されています) を選択します。

    Screenshot showing the Output tab of the pipeline run in-progress with the Details button highlighted in the run status.

  3. 実行の詳細には、読み取りと書き込みが行われたデータの量と、実行に関するその他のさまざまな詳細が表示されます。

    Screenshot showing the run details window.

  4. 必要に応じて、特定の頻度でパイプラインを実行するようにスケジュールすることもできます。 15 分ごとに実行するようにパイプラインをスケジュールする例を以下に示します。

    Screenshot showing the schedule dialog for the pipeline with a 15-minute recurring schedule.

このサンプルのパイプラインでは、サンプル データを Lakehouse にコピーする方法を示しています。 以下の方法を学習しました。

  • データ パイプラインを作成する。
  • コピー アシスタントを使用してデータをコピーする。
  • データ パイプラインを実行およびスケジュールする。

次は、パイプライン実行の監視について詳しく説明します。