データフローを使用してディメンションモデルを作成するためのベストプラクティス

Tip

Power BI Dataflow Gen1 は従来の状態になり、新機能への投資を受け取ることはありません。 Fabric アクセス権を持つ Premium のお客様には、 Dataflow Gen2 が推奨されるパスであり、パフォーマンス、スケール、信頼性、機能、および組み込みの AI の改善が提供されます。 Pro/PPU のお客様は、これらのシナリオの Gen2 ガイダンスが進化するため、引き続き Gen1 を使用できます。アップグレードのガイダンスについては、「 Dataflow Gen1 から Dataflow Gen2 へのアップグレード」を参照してください。

ディメンションモデルの設計は、データフローで実行できる最も一般的なタスクの 1 つです。この記事では、データフローを使用してディメンションモデルを作成するためのベストプラクティスについて説明します。

ステージングデータフロー

データ統合システムの重要なポイントの 1 つは、ソース運用システムからの読み取りの数を減らすことです。従来のデータ統合アーキテクチャでは、この削減は 、ステージングデータベースと呼ばれる新しいデータベースを作成することによって行われます。ステージングデータベースの目的は、データソースからステージングデータベースにデータ as-is を定期的に読み込む方法です。

その後、データ統合の残りの部分では、ステージングデータベースをさらなる変換のソースとして使用し、ディメンションモデル構造に変換します。

データフローを使用して同じ方法に従うことをお勧めします。ソースシステムからデータ as-is を読み込むだけの一連のデータフローを作成します (必要なテーブルに対してのみ)。結果は、データフローのストレージ構造 (Azure Data Lake Storage または Dataverse) に格納されます。この変更により、ソースシステムからの読み取り操作が最小限に抑えられます。

次に、ステージングデータフローからデータをソースとする他のデータフローを作成できます。このアプローチの利点は次のとおりです。

ソースシステムからの読み取り操作の数を減らし、結果としてソースシステムの負荷を軽減します。
オンプレミスのデータソースが使用されている場合のデータゲートウェイの負荷を軽減する。
ソースシステムのデータが変更された場合に備え、調整のためにデータの中間コピーを用意します。
変換データフローをソースに依存しません。

データフローをステージングするときのフローを示す図。

変換データフロー

変換データフローをステージングデータフローから分離すると、変換はソースに依存しません。この分離は、ソースシステムを新しいシステムに移行する場合に役立ちます。その場合に行う必要があるのは、ステージングデータフローを変更することです。変換データフローはステージングデータフローからのみソース化されるため、問題なく動作する可能性があります。

この分離は、ソースシステムの接続が遅い場合にも役立ちます。変換データフローは、ソースシステムからの低速接続を経由してレコードを取得するために長い時間待機する必要はありません。ステージングデータフローでは既にその部分が行われ、データは変換レイヤーの準備ができています。

変換が強調され、データウェアハウスにデータが送信される点を除き、前の図と同様の図。

レイヤードアーキテクチャ

階層化アーキテクチャは、個別のレイヤーでアクションを実行するアーキテクチャです。ステージングデータフローと変換データフローは、多層データフローアーキテクチャの 2 つのレイヤーにすることができます。レイヤーでアクションを実行しようとすると、必要な最小限のメンテナンスが保証されます。何かを変更する場合は、配置されているレイヤーで変更するだけで済みます。他のレイヤーはすべて正常に動作し続ける必要があります。

次の図は、Power BI セマンティックモデルでテーブルが使用されるデータフローの多層アーキテクチャを示しています。

ステージングデータフローと変換データフローが別々のレイヤーにある多層アーキテクチャを示す図。

計算テーブルを可能な限り使用する

別のデータフローでデータフローの結果を使用する場合は、計算テーブルの概念を使用します。つまり、"既に処理されて格納されている" テーブルからデータを取得します。データフロー内でも同じことが起こる可能性があります。別のテーブルからテーブルを参照する場合は、計算テーブルを使用できます。このメソッドは、 一般的な変換と呼ばれる複数のテーブルで実行する必要がある一連の変換がある場合に役立ちます。

一般的な変換の処理に使用されるデータソースからソース化された計算テーブルを示す図。

前の図では、計算テーブルはソースから直接データを取得します。ただし、ステージングデータフローと変換データフローのアーキテクチャでは、計算テーブルがステージングデータフローからソース化される可能性があります。

一般的な変換の処理に使用されるデータフローから取得された計算テーブルを示す図。

スタースキーマを作成する

最適なディメンションモデルは、モデルからデータを照会する時間を最小限に抑えるために設計されたディメンションとファクトテーブルを持つスタースキーマモデルです。スタースキーマモデルを使用すると、データビジュアライザーの理解も容易になります。

運用システムと同じレイアウトのデータを BI システムに取り込むのは理想的ではありません。データテーブルをリフォームする必要があります。一部のテーブルは、説明情報を保持するディメンションテーブルの形式にする必要があります。集計可能なデータを保持するために、一部のテーブルはファクトテーブルの形式にする必要があります。ファクトテーブルとディメンションテーブルを形成するのに最適なレイアウトは、スタースキーマです。詳細については、「スタースキーマと Power BI の重要性について」を参照してください。

ディメンションに一意のキー値を使用する

ディメンションテーブルを作成するときは、それぞれにキーがあることを確認します。このキーを使用すると、ディメンション間に多対多 (つまり"弱い") リレーションシップがなくなります。何らかの変換を適用して、列または列の組み合わせがディメンション内の一意の行を返すようにすることで、キーを作成できます。その後、列の組み合わせをデータフロー内のテーブルのキーとしてマークできます。

[キーとしてマーク] オプションとテーブルの日付列のキーアイコンが強調されている [Power Query 変換] タブのスクリーンショット。

大規模なファクトテーブルに対して増分更新を実行する

ファクトテーブルは、常にディメンションモデル内で最大のテーブルです。これらのテーブルに転送される行の数を減らすことをお勧めします。非常に大きなファクトテーブルがある場合は、そのテーブルに対して増分更新を使用してください。増分更新は、Power BI セマンティックモデルとデータフローテーブルでも実行できます。

増分更新を使用すると、変更された部分であるデータの一部のみを更新できます。更新するデータの一部と永続化する部分を選択するには、複数のオプションがあります。詳細については、「 Power BI データフローでの増分更新の使用」を参照してください。

データフローの増分更新設定ダイアログのスクリーンショット。

ディメンションとファクトテーブルを作成するための参照

ソースシステムでは、多くの場合、データウェアハウスでファクトテーブルとディメンションテーブルの両方を生成するために使用するテーブルがあります。これらのテーブルは、計算テーブルと中間データフローにも適しています。プロセスの一般的な部分 (データのクリーニング、追加の行と列の削除など) は、1 回実行できます。これらのアクションの出力からの参照を使用して、ディメンションテーブルとファクトテーブルを生成できます。この方法では、一般的な変換に計算テーブルを使用します。

Orders というクエリへの参照オプションを使用して、Orders aggregated という名前の新しいクエリを作成している様子を示すスクリーンショット。

フィードバック

このページはお役に立ちましたか?

Last updated on 2025-11-27

データフローを使用してディメンション モデルを作成するためのベスト プラクティス

ステージングデータフロー

変換データフロー

レイヤード アーキテクチャ

計算テーブルを可能な限り使用する

スター スキーマを作成する