このチュートリアルでは、OData を Northwind ソースからターゲットのレイクハウスに移動し、パイプラインが完了したときにメール通知を送信するデータ パイプラインを構築します。
前提条件
開始するには、次の前提条件を満たしている必要があります。
- 既定の個人用ワークスペースではない Microsoft Fabric 対応ワークスペースがあることを確認します。
レイクハウスを作成する
まず、レイクハウスを作成する必要があります。 レイクハウスは、分析用に最適化されたデータ レイクです。 このチュートリアルでは、ターゲットのデータフローとして使用されるレイクハウスを作成します。
これで、レイクハウスが作成され、データフローを設定できるようになりました。
データフローを作成する
データフローは、パイプラインで使用できる再利用可能なデータ変換です。 このチュートリアルでは、OData ソースからデータを取得し、そのデータをターゲットのレイクハウスに書き込むデータフローを作成します。
Fabric 対応ワークスペースに移動します。
作成メニューで [Dataflow Gen2] を選択します。
OData ソースからデータを取り込みます。
[データの取得] を選択し、[その他] を選択します。
[データ ソースの選択] で OData を検索し、OData コネクタを選択します。
OData ソースの URL を入力します。 このチュートリアルでは、OData サンプル サービスを使用します。
[次へ] を選択します。
取り込むエンティティを選択します。 このチュートリアルでは、Orders エンティティを使用します。
[作成] を選択します
これで、OData ソースからデータを取り込んだので、ターゲットのレイクハウスを設定できます。
ターゲットのレイクハウスにデータを取り込むには、次の手順を実行します。
[データの格納先の追加] を選択します。
[レイクハウス] を選択します。
レイクハウスへの接続に使用する接続を構成します。 既定の設定で問題ありません。
[次へ] を選択します。
レイクハウスを作成したワークスペースに移動します。
前の手順で作成したレイクハウスを選択します。
テーブル名を確認します。
[次へ] を選択します。
更新方法を確認し、[設定の保存] を選択します。
データフローを発行します。
重要
ワークスペースに最初の Dataflow Gen2 が作成されると、レイクハウス項目とウェアハウス項目が、関連する SQL 分析エンドポイントおよびセマンティック モデルと共にプロビジョニングされます。 これらの項目はワークスペース内のすべてのデータフローによって共有され、Dataflow Gen2 が動作するために必要であるため、削除しないでください。また、ユーザーが直接使用することを意図したものではありません。 これらの項目は、Dataflow Gen2 の実装の詳細です。 項目はワークスペースには表示されませんが、ノートブック、SQL エンドポイント、レイクハウス、ウェアハウスなどの他のエクスペリエンスでアクセスできる場合があります。 名前のプレフィックスで項目を認識できます。 これらの項目のプレフィックスは "DataflowsStaging" です。
これで、ターゲットのレイクハウスにデータを取り込んだので、データ パイプラインを設定できます。
データ パイプラインを作成する
データ パイプラインは、データ処理を自動化するために使用できるワークフローです。 このチュートリアルでは、前の手順で作成した Dataflow Gen2 を実行するデータ パイプラインを作成します。
ワークスペースの概要ページに戻り、作成メニューで [データ パイプライン] を選択します。
データ パイプラインの名前を指定します。
[データフロー] アクティビティを選択します。
[設定] の [データフロー] ドロップダウン リストで、前の手順で作成したデータフローを選択します。
Office 365 Outlook アクティビティを追加します。
電子メールによる通知を送信するように Office 365 Outlook アクティビティを構成します。
データ パイプラインの実行とスケジュール設定
このセクションでは、データ パイプラインの実行とスケジュール設定を行います。 このスケジュールを使用すると、スケジュールに従ってデータ パイプラインを実行できます。
ワークスペースに移動します。
前の手順で作成したデータ パイプラインのドロップダウン メニューを開き、[スケジュール] を選択します。
[スケジュールされた実行] で、[オン] を選択します。
データ パイプラインの実行に使用するスケジュールを指定します。
- [繰り返し] には、[毎日] または [毎分] などを指定します。
- [毎日] を選択した場合は、[時刻] を選択することもできます。
- 開始する特定の日付を指定します。
- 終了する特定の日付を指定します。
- タイムゾーンを選択します。
[適用] を選択して変更を適用します。
これで、スケジュールに従って実行され、レイクハウス内のデータを更新し、メール通知を送信するデータ パイプラインが作成されました。 データ パイプラインの状態をチェックするには、監視ハブに移動します。 [データ パイプライン] に移動し、ドロップダウン メニューの [実行履歴] タブを選択して、データ パイプラインの状態をチェックすることもできます。
関連するコンテンツ
このサンプルでは、Microsoft Fabric の Data Factory を使用してパイプラインでデータフローを使用する方法を示します。 以下の方法を学習しました。
- データフローを作成する。
- データフローを呼び出すパイプラインを作成する。
- データ パイプラインを実行およびスケジュールする。
次は、パイプライン実行の監視について詳しく説明します。