次の方法で共有


クイックスタート: 初めてのデータフローを作成してデータの取得と変換を行う

データフローは、セルフサービスによるクラウドベースのデータ準備テクノロジです。 この記事では、初めてのデータフローを作成し、データフローのデータを取得してから、データを変換してデータフローを発行します。

前提条件

開始するには、次の前提条件が必要です。

データフローを作成する

このセクションでは、初めてのデータフローを作成します。

  1. Microsoft Fabric ワークスペースに移動します。

    ワークスペースに移動するワークスペース ウィンドウのスクリーンショット。

  2. [+新しい項目] を選択し、[データフロー Gen2] を選択します。

    [Dataflow Gen2] の選択が強調表示されているスクリーンショット。

データを取得する

データを取得してみましょう。 この例では、OData サービスからデータを取得します。 データフロー内のデータを取得するには、次の手順に従います。

  1. データフロー エディターで、[データの取得] を選択し、[その他] を選択します。

    [データの取得] オプションが選択され、ドロップダウン ボックスで [その他] が強調表示されているスクリーンショット。

  2. [データ ソースの選択] で、[さらに表示] を選択します。

    [データ ソースの取得] で [さらに表示] が強調表示されているスクリーンショット。

  3. [新しいソース] で、データ ソースとして [その他]>[OData] を選択します。

    [データ ソースの取得] で、[その他] カテゴリと [OData] コネクタが強調されているスクリーンショット。

  4. URL https://services.odata.org/v4/northwind/northwind.svc/ を入力してから、[次へ] を選択します。

    データの URL を入力する OData データ ソースのスクリーンショット。

  5. Orders テーブルと Customers テーブルを選択し、[作成] を選択します。

    Customers テーブルと Orders テーブルが強調表示されている Power Query ナビゲーターのスクリーンショット。

データの取得エクスペリエンスと機能の詳細については、 データの取得の概要に関するページを参照してください。

変換を適用して発行する

最初のデータフローにデータを読み込んだ。 おめでとうございます! 次に、いくつかの変換を適用して、このデータを必要な図形に取り込みます。

Power Query エディターでデータを変換します。 Power Query エディターの詳細な概要 は Power Query ユーザー インターフェイスにありますが、このセクションでは基本的な手順について説明します。

  1. データ プロファイル ツールがオンになっていることを確認します。 [ホーム>オプション>グローバル オプション] に移動し、[列プロファイル] のすべてのオプションを選択します。

    列のプロファイルの選択が強調表示されているグローバル オプションのスクリーンショット。

    また、Power Query エディター リボンの [表示] タブの [レイアウト] 構成を使用するか、[Power Query] ウィンドウの右下にあるダイアグラム ビュー アイコンを選択して、ダイアグラム ビューを有効にしてください。

    Power Query ダイアグラム ビューの全体的な外観のスクリーンショット。

  2. Orders テーブル内で、顧客ごとの注文の合計数を計算します。データ プレビューで CustomerID 列を選択し、リボンの [変換] タブで [グループ化] を選択します。

    Orders テーブルが選択され、[変換] タブで [グループ化] が強調表示されていることを示すスクリーンショット。

  3. [グループ化] 内で集計として行数のカウントを実行します。 グループ化機能の詳細については、「行のグループ化または集計」を参照してください。

    行数のカウント操作が選択されている [グループ化] のスクリーンショット。

  4. Orders テーブルのデータをグループ化した後、CustomerIDCount が列として含まれる 2 列のテーブルを取得します。

    2 列のテーブルのスクリーンショット。

  5. 次に、[顧客] テーブルのデータを顧客ごとの注文数と組み合わせます。ダイアグラム ビューで [顧客] クエリを選択し、[⋮] メニューを使用して 、新しい変換としてマージ クエリ にアクセスします。

    Customers テーブルの縦 3 点リーダーと、[新規としてクエリをマージ] が強調表示されているデータフロー エディターのスクリーンショット。

  6. 両方のテーブルで一致する列として CustomerID を選択して、マージ操作を構成します。 そして Ok を選択します。

    [マージ] ウィンドウのスクリーンショット。

    [マージ] ウィンドウのスクリーンショット。[マージ用の左テーブル] が Customers テーブルに設定され、[マージ用の右テーブル] が Orders テーブルに設定されています。 CustomerID 列は、Customers テーブルと Orders テーブルの両方で選択されます。 また、[結合の種類] は [左外部] に設定されます。 その他の選択はすべて既定値に設定されます。

  7. Customers テーブルのすべての列と、Orders テーブルの入れ子になったデータを含む 1 つの列を含む新しいクエリが作成されました。

    Customers テーブルと Orders テーブルの右側に新しいマージ クエリが追加されたデータフロー エディタのスクリーンショット。

  8. Customers テーブルの特定の列に注目しましょう。 これを行うには、データフロー エディターの右下隅にあるスキーマ ビュー ボタンを選択して、スキーマ ビューを有効にします。

    右下隅のスキーマ ビュー ボタンが強調表示されているデータフロー エディターのスクリーンショット。

  9. スキーマ ビューには、テーブル内のすべての列が表示されます。 CustomerIDCompanyName、および Orders (2) を選択します。 次に、[ スキーマ ツール ] タブに移動し、[ 列の削除] を選択して、[ 他の列の削除] を選択します。 これにより、必要な列のみが保持されます。

    使用できるすべての列名が表示され、[CustomerID]、[CompanyName]、[Orders (2)] 列が強調表示されているスキーマ ビューのスクリーンショット。

    [他の列の削除] が強調表示されているスキーマ ツール メニューのスクリーンショット。

  10. Orders (2) 列には、マージ ステップの追加の詳細が保持されます。 このデータを表示して使用するには、右下隅の [スキーマ ビューの表示] の横にある [ データ ビュー の表示] ボタンを選択 します。 次に、 Orders (2) 列ヘッダーで、[ 列の展開 ] アイコンを選択し、[ カウント ] 列を選択します。 これにより、各顧客の注文数がテーブルに追加されます。

    データ ビューの使用のスクリーンショット。

  11. 次に、注文の数で顧客をランク付けしましょう。 [ カウント ] 列を選択し、[ 列の追加 ] タブに移動し、[ ランク列] を選択します。 これにより、注文数に基づいて各顧客のランクを示す新しい列が追加されます。

    [Count] 列が選択されているデータフロー エディターのスクリーンショット。

  12. [順位列] の既定の設定のままにします。 次に、[OK] を選択してこの変換を適用します。

    すべての既定の設定が表示されている [順位] ウィンドウのスクリーンショット。

  13. 次に、画面の右側にある [クエリの設定] ペインを使用して、結果のクエリの名前を「Ranked Customers」に変更します。

    クエリの設定プロパティで「Ranked Customers」の名前が強調表示されているデータフロー エディタのスクリーンショット。

  14. データの進む場所を設定する準備ができました。 [クエリ設定] ウィンドウで、一番下までスクロールし、[データ変換先の選択] を選択します

    データ変換先の選択の位置が強調表示されているデータフロー エディターのスクリーンショット。

  15. 結果がある場合はレイクハウスに送信するか、そうでない場合はこの手順をスキップできます。 ここでは、データに使用するレイクハウスとテーブルを選択し、新しいデータを追加 (追加) するか、そこに置き換えるか (置換) を選択できます。

    レイクハウスが選択されている [データ変換先に接続] ウィンドウのスクリーンショット。

    [宛先の設定を選択する] ウィンドウのスクリーンショット。

  16. これで、データフローを公開する準備が整いました。 ダイアグラム ビューでクエリを確認し、[発行] を選択します。

    右下側の [発行] ボタンが強調表示されているデータフロー エディターのスクリーンショット。

    右下隅にある [ 発行] を選択して、データフローを保存します。 ワークスペースに戻ると、データフロー名の横にあるスピナーアイコンが、発行中であることを示しています。 スピナーが消えると、データフローを更新する準備が整います。

    重要

    ワークスペースに Dataflow Gen2 を初めて作成すると、Fabric によって、データフローの実行に役立ついくつかの背景項目 (Lakehouse と Warehouse) が設定されます。 これらの項目はワークスペース内のすべてのデータフローによって共有されるため、削除しないでください。 これらは直接使用するためのものではなく、通常はワークスペースには表示されませんが、ノートブックや SQL 分析などの他の場所に表示される場合があります。 DataflowsStagingで始まる名前を探して見つけ出します。

  17. ワークスペースで、[更新のスケジュール設定] アイコンを選択します。

    更新のスケジュール設定アイコンが強調表示されているワークスペースのスクリーンショット。

  18. スケジュール設定された更新をオンにし、[別の時刻を追加] を選択し、次のスクリーンショットに示すように更新を構成します。

    別の時刻の選択方法を示すスクリーンショット。

    スケジュール設定された更新オプションのスクリーンショット。スケジュール設定された更新がオンで、更新頻度が [毎日] に設定され、タイム ゾーンが協定世界時に設定され、時刻が午前 4 時に設定されています。 オン ボタン、[別の時刻を追加] の選択、データフローの所有者、適用ボタンがすべて強調表示されています。

リソースをクリーンアップする

このデータフローを引き続き使用しない場合は、次の手順を使用してデータフローを削除します。

  1. Microsoft Fabric ワークスペースに移動します。

    ワークスペースに移動するワークスペース ウィンドウのスクリーンショット。

  2. データフローの名前の横にある縦 3 点リーダーを選択し、[削除] を選択します。

    縦 3 点リーダーとドロップダウン メニュー内の削除オプションが強調表示されているスクリーンショット。

  3. [削除] を選択して、データフローの削除を確認します。

    [削除] ボタンが強調表示されている [削除] データフロー ウィンドウのスクリーンショット。

このサンプルのデータフローは、データフロー (Gen2) でデータを読み込んで変換する方法を示しています。 以下の方法を学習しました。

  • データフロー (Gen2) を作成します。
  • データを変換する。
  • 変換されたデータの変換先の設定を構成します。
  • データ パイプラインを実行およびスケジュールする。

次の記事に進み、初めてのデータ パイプラインを作成する方法を学習してください。