クイックスタート: 初めてのデータフローを作成してデータの取得と変換を行う

2025-07-07

データフローは、セルフサービスによるクラウドベースのデータ準備テクノロジです。この記事では、初めてのデータフローを作成し、データフローのデータを取得してから、データを変換してデータフローを発行します。

前提条件

開始するには、次の前提条件が必要です。

アクティブなサブスクリプションを持つ Microsoft Fabric テナントアカウント。無料アカウントの作成。
Microsoft Fabric 対応ワークスペースがあることを確認します: ワークスペースの作成。

データフローを作成する

このセクションでは、初めてのデータフローを作成します。

Microsoft Fabric ワークスペースに移動します。
[+新しい項目] を選択し、[データフロー Gen2] を選択します。

データを取得する

データを取得してみましょう。この例では、OData サービスからデータを取得します。データフロー内のデータを取得するには、次の手順に従います。

データフローエディターで、[データの取得] を選択し、[その他] を選択します。
[データソースの選択] で、[さらに表示] を選択します。
[新しいソース] で、データソースとして [その他]>[OData] を選択します。
URL https://services.odata.org/v4/northwind/northwind.svc/ を入力してから、[次へ] を選択します。
Orders テーブルと Customers テーブルを選択し、[作成] を選択します。

データの取得エクスペリエンスと機能の詳細については、データの取得の概要に関するページを参照してください。

変換を適用して発行する

最初のデータフローにデータを読み込んだ。おめでとうございます！次に、いくつかの変換を適用して、このデータを必要な図形に取り込みます。

Power Query エディターでデータを変換します。 Power Query エディターの詳細な概要は Power Query ユーザーインターフェイスにありますが、このセクションでは基本的な手順について説明します。

データプロファイルツールがオンになっていることを確認します。 [ホーム>オプション>グローバルオプション] に移動し、[列プロファイル] のすべてのオプションを選択します。

また、Power Query エディターリボンの [表示] タブの [レイアウト] 構成を使用するか、[Power Query] ウィンドウの右下にあるダイアグラムビューアイコンを選択して、ダイアグラムビューを有効にしてください。
Orders テーブル内で、顧客ごとの注文の合計数を計算します。データプレビューで CustomerID 列を選択し、リボンの [変換] タブで [グループ化] を選択します。
[グループ化] 内で集計として行数のカウントを実行します。 グループ化機能の詳細については、「行のグループ化または集計」を参照してください。
Orders テーブルのデータをグループ化した後、CustomerID と Count が列として含まれる 2 列のテーブルを取得します。
次に、[顧客] テーブルのデータを顧客ごとの注文数と組み合わせます。ダイアグラムビューで [顧客] クエリを選択し、[⋮] メニューを使用して 、新しい変換としてマージクエリ にアクセスします。
両方のテーブルで一致する列として CustomerID を選択して、マージ操作を構成します。そして Ok を選択します。

[マージ] ウィンドウのスクリーンショット。[マージ用の左テーブル] が Customers テーブルに設定され、[マージ用の右テーブル] が Orders テーブルに設定されています。 CustomerID 列は、Customers テーブルと Orders テーブルの両方で選択されます。また、[結合の種類] は [左外部] に設定されます。その他の選択はすべて既定値に設定されます。
Customers テーブルのすべての列と、Orders テーブルの入れ子になったデータを含む 1 つの列を含む新しいクエリが作成されました。
Customers テーブルの特定の列に注目しましょう。これを行うには、データフローエディターの右下隅にあるスキーマビューボタンを選択して、スキーマビューを有効にします。
スキーマビューには、テーブル内のすべての列が表示されます。 CustomerID、CompanyName、および Orders (2) を選択します。次に、[ スキーマツール ] タブに移動し、[ 列の削除] を選択して、[ 他の列の削除] を選択します。これにより、必要な列のみが保持されます。
Orders (2) 列には、マージステップの追加の詳細が保持されます。このデータを表示して使用するには、右下隅の [スキーマビューの表示] の横にある [ データビュー の表示] ボタンを選択 します。次に、 Orders (2) 列ヘッダーで、[ 列の展開 ] アイコンを選択し、[ カウント ] 列を選択します。これにより、各顧客の注文数がテーブルに追加されます。

右下隅の [データビューの表示] ボタン、[Orders (2)] 列の [列の展開] アイコン、[列の展開] ウィンドウで選択されている [Count] 列を含むデータフローエディターのスクリーンショット。
次に、注文の数で顧客をランク付けしましょう。 [ カウント ] 列を選択し、[ 列の追加 ] タブに移動し、[ ランク列] を選択します。これにより、注文数に基づいて各顧客のランクを示す新しい列が追加されます。
[順位列] の既定の設定のままにします。次に、[OK] を選択してこの変換を適用します。
次に、画面の右側にある [クエリの設定] ペインを使用して、結果のクエリの名前を「Ranked Customers」に変更します。
データの進む場所を設定する準備ができました。 [クエリ設定] ウィンドウで、一番下までスクロールし、[データ変換先の選択] を選択します。
結果がある場合はレイクハウスに送信するか、そうでない場合はこの手順をスキップできます。ここでは、データに使用するレイクハウスとテーブルを選択し、新しいデータを追加 (追加) するか、そこに置き換えるか (置換) を選択できます。
これで、データフローを公開する準備が整いました。ダイアグラムビューでクエリを確認し、[発行] を選択します。

右下隅にある [ 発行] を選択して、データフローを保存します。ワークスペースに戻ると、データフロー名の横にあるスピナーアイコンが、発行中であることを示しています。スピナーが消えると、データフローを更新する準備が整います。

重要

ワークスペースに Dataflow Gen2 を初めて作成すると、Fabric によって、データフローの実行に役立ついくつかの背景項目 (Lakehouse と Warehouse) が設定されます。これらの項目はワークスペース内のすべてのデータフローによって共有されるため、削除しないでください。これらは直接使用するためのものではなく、通常はワークスペースには表示されませんが、ノートブックや SQL 分析などの他の場所に表示される場合があります。 DataflowsStagingで始まる名前を探して見つけ出します。
ワークスペースで、[更新のスケジュール設定] アイコンを選択します。
スケジュール設定された更新をオンにし、[別の時刻を追加] を選択し、次のスクリーンショットに示すように更新を構成します。

スケジュール設定された更新オプションのスクリーンショット。スケジュール設定された更新がオンで、更新頻度が [毎日] に設定され、タイムゾーンが協定世界時に設定され、時刻が午前 4 時に設定されています。オンボタン、[別の時刻を追加] の選択、データフローの所有者、適用ボタンがすべて強調表示されています。