次の方法で共有


パイプラインでデータフローを使用する

このチュートリアルでは、OData を Northwind ソースからターゲットのレイクハウスに移動し、パイプラインが完了したときにメール通知を送信するデータ パイプラインを構築します。

前提条件

開始するには、次の前提条件を満たしている必要があります。

レイクハウスを作成する

まず、レイクハウスを作成する必要があります。 レイクハウスは、分析用に最適化されたデータ レイクです。 このチュートリアルでは、ターゲットのデータフローとして使用されるレイクハウスを作成します。

  1. Fabric 対応ワークスペースに移動します。

    強調された Fabric 対応ワークスペースのスクリーンショット。

  2. 作成メニューで [レイクハウス] を選択します。

    [Create Lakehouse]\(レイクハウスの作成\) が強調されている [作成] メニューのスクリーンショット。

  3. レイクハウスの名前を入力します。

  4. [作成] を選択します

これで、レイクハウスが作成され、データフローを設定できるようになりました。

データフローを作成する

データフローは、パイプラインで使用できる再利用可能なデータ変換です。 このチュートリアルでは、OData ソースからデータを取得し、そのデータをターゲットのレイクハウスに書き込むデータフローを作成します。

  1. Fabric 対応ワークスペースに移動します。

    Fabric 対応ワークスペースのスクリーンショット。

  2. 作成メニューで [Dataflow Gen2] を選択します。

    新しいメニューの [Dataflow Gen2] 選択のスクリーンショット。

  3. OData ソースからデータを取り込みます。

    1. [データの取得] を選択し、[その他] を選択します。

      [その他] が強調された [データの取得] メニューのスクリーンショット。

    2. [データ ソースの選択]OData を検索し、OData コネクタを選択します。

      OData が強調された [データの取得] メニューのスクリーンショット。

    3. OData ソースの URL を入力します。 このチュートリアルでは、OData サンプル サービスを使用します。

    4. [次へ] を選択します。

    5. 取り込むエンティティを選択します。 このチュートリアルでは、Orders エンティティを使用します。

      OData プレビューのスクリーンショット。

    6. [作成] を選択します

これで、OData ソースからデータを取り込んだので、ターゲットのレイクハウスを設定できます。

ターゲットのレイクハウスにデータを取り込むには、次の手順を実行します。

  1. [データの格納先の追加] を選択します。

  2. [レイクハウス] を選択します。

    レイクハウスが強調表示された [データの格納先の追加] メニューのスクリーンショット。

  3. レイクハウスへの接続に使用する接続を構成します。 既定の設定で問題ありません。

  4. [次へ] を選択します。

  5. レイクハウスを作成したワークスペースに移動します。

  6. 前の手順で作成したレイクハウスを選択します。

    選択したレイクハウスのスクリーンショット。

  7. テーブル名を確認します。

  8. [次へ] を選択します。

  9. 更新方法を確認し、[設定の保存] を選択します。

    [置換] が選択された更新方法のスクリーンショット。

  10. データフローを発行します。

    重要

    ワークスペースに最初の Dataflow Gen2 が作成されると、レイクハウス項目とウェアハウス項目が、関連する SQL 分析エンドポイントおよびセマンティック モデルと共にプロビジョニングされます。 これらの項目はワークスペース内のすべてのデータフローによって共有され、Dataflow Gen2 が動作するために必要であるため、削除しないでください。また、ユーザーが直接使用することを意図したものではありません。 これらの項目は、Dataflow Gen2 の実装の詳細です。 項目はワークスペースには表示されませんが、ノートブック、SQL エンドポイント、レイクハウス、ウェアハウスなどの他のエクスペリエンスでアクセスできる場合があります。 名前のプレフィックスで項目を認識できます。 これらの項目のプレフィックスは "DataflowsStaging" です。

これで、ターゲットのレイクハウスにデータを取り込んだので、データ パイプラインを設定できます。

データ パイプラインを作成する

データ パイプラインは、データ処理を自動化するために使用できるワークフローです。 このチュートリアルでは、前の手順で作成した Dataflow Gen2 を実行するデータ パイプラインを作成します。

  1. ワークスペースの概要ページに戻り、作成メニューで [データ パイプライン] を選択します。

    [データ パイプライン] が選択されているスクリーンショット。

  2. データ パイプラインの名前を指定します。

  3. [データフロー] アクティビティを選択します。

    [データフロー] アクティビティが強調されているスクリーンショット。

  4. [設定][データフロー] ドロップダウン リストで、前の手順で作成したデータフローを選択します。

    [データフロー] ドロップダウン リストのスクリーンショット。

  5. Office 365 Outlook アクティビティを追加します。

    Office 365 Outlook のアクティビティを選択する方法が強調されているスクリーンショット。

  6. 電子メールによる通知を送信するように Office 365 Outlook アクティビティを構成します。

    1. Office 365 アカウントを使用して認証を行います。

    2. 通知の送信先のメール アドレスを選択します。

    3. メールの件名を入力します。

    4. メールの本文を入力します。

      Office 365 Outlook のアクティビティ設定を示すスクリーンショット。

データ パイプラインの実行とスケジュール設定

このセクションでは、データ パイプラインの実行とスケジュール設定を行います。 このスケジュールを使用すると、スケジュールに従ってデータ パイプラインを実行できます。

  1. ワークスペースに移動します。

  2. 前の手順で作成したデータ パイプラインのドロップダウン メニューを開き、[スケジュール] を選択します。

    [スケジュール] が強調されたパイプライン メニューのスクリーンショット。

  3. [スケジュールされた実行] で、[オン] を選択します。

    [スケジュールされた実行] が [オン] に設定されているスクリーンショット。

  4. データ パイプラインの実行に使用するスケジュールを指定します。

    1. [繰り返し] には、[毎日] または [毎分] などを指定します。
    2. [毎日] を選択した場合は、[時刻] を選択することもできます。
    3. 開始する特定の日付を指定します。
    4. 終了する特定の日付を指定します。
    5. タイムゾーンを選択します。
  5. [適用] を選択して変更を適用します。

これで、スケジュールに従って実行され、レイクハウス内のデータを更新し、メール通知を送信するデータ パイプラインが作成されました。 データ パイプラインの状態をチェックするには、監視ハブに移動します。 [データ パイプライン] に移動し、ドロップダウン メニューの [実行履歴] タブを選択して、データ パイプラインの状態をチェックすることもできます。

このサンプルでは、Microsoft Fabric の Data Factory を使用してパイプラインでデータフローを使用する方法を示します。 以下の方法を学習しました。

  • データフローを作成する。
  • データフローを呼び出すパイプラインを作成する。
  • データ パイプラインを実行およびスケジュールする。

次は、パイプライン実行の監視について詳しく説明します。