Power BI Premium データフローワークロードを構成する

2024-10-07

Power BI Premium サブスクリプションにデータフローワークロードを作成することができます。 Power BI では "ワークロード" の概念を使用して、Premium コンテンツを記述します。ワークロードには、データセット、ページ分割されたレポート、データフロー、AI が含まれます。 "データフロー" ワークロードを使用すると、データフローのセルフサービスのデータ準備を使用して、データの取り込み、変換、統合、および強化を行うことができます。 Power BI Premium データフローは、 [管理ポータル] で管理されています。

以下のセクションでは、組織でデータフローを有効にする方法、Premium 容量の設定を調整する方法、および一般的な使用法のガイダンスについて説明します。

Power BI Premium でのデータフローの有効化

Power BI Premium サブスクリプションでデータフローを使用するための最初の要件は、組織のデータフローを作成して使用できるようにすることです。次の画像に示すように、 [管理ポータル] で、 [テナント設定] を選択し、 [データフローの設定] の下にあるスライダーを [有効] に切り替えます。

Power BI Premium のデータフローの管理ポータル

データフローワークロードを有効にすると、既定の設定で構成されます。必要に応じて、これらの設定を調整することもできます。次に、これらの設定がどこにあるかを説明し、それぞれについて説明し、データフローのパフォーマンスを最適化するために値を変更するタイミングを理解するのに役立ちます。

Premium でのデータフローの設定の調整

データフローが有効になったら、 [管理ポータル] を使用して、データフローの作成方法と Power BI Premium サブスクリプションでのリソースの使用方法を変更または調整できます。 Power BI Premium の場合、メモリの設定を変更する必要はありません。 Power BI Premium のメモリは、基になるシステムを自動的に管理します。次の手順は、データフローの設定を調整する方法を示しています。

Admin ポータルでテナント設定を選択して、作成されたすべての容量を一覧表示します。設定を管理する容量を選択します。
Power BI Premium 容量には、データフローで使用可能なリソースが反映されます。次の画像に示すように、 [サイズの変更] ボタンを選択することで容量のサイズを変更できます。

Premium 容量 SKU - ハードウェアをスケールアップする

Power BI Premium ワークロードでは、仮想コアを使用して、さまざまなワークロードの種類にわたって高速なクエリを提供します。「容量と SKU」には、使用可能な各ワークロードオファリングにおける現在の仕様を示すグラフが含まれています。 A3 以上の容量ではコンピューティングエンジンを利用できます。したがって、拡張コンピューティングエンジンを使用する必要がある場合は、そこから始めます。

拡張コンピューティングエンジン - パフォーマンスを向上させる機会

拡張コンピューティングエンジンは、クエリを高速にできるエンジンです。 Power BI ではコンピューティングエンジンを使用して、クエリおよび更新操作を処理します。拡張コンピューティングエンジンは標準エンジンに比べて改善されており、SQL キャッシュにデータを読み込むことで機能し、SQL を使用してテーブル変換、更新操作を高速化し、DirectQuery 接続を有効にします。計算対象エンティティについて、 [オン] または [最適化] に構成した状態で、ビジネスロジックでそれが許可されている場合、パフォーマンスを向上させるために Power BI で SQL が使用されます。エンジンを [オン] にすると、DirectQuery 接続も提供されます。データフローの使用状況で、強化されたコンピューティングエンジンが適切に使用されていることを確認します。ユーザーは拡張コンピューティングエンジンを、データフローごとにオン、最適化、またはオフに構成することができます。

注意

拡張コンピューティングエンジンは一部のリージョンではまだご利用いただけません。

一般的なシナリオに関するガイダンス

このセクションでは、Power BI Premium でデータフローワークロードを使用する場合の一般的なシナリオに関するガイダンスを提供します。

長い更新時間

長い更新時間は通常、並列処理の問題です。次のオプションをこの順番で確認する必要があります。

長い更新時間の重要な概念は、データ準備の性質です。データソースを利用し、実際に準備を行い、事前クエリロジックを実行することで、長い更新時間を最適化できる場合は常にそのようにする必要があります。特に、ソースとして SQL などのリレーショナルデータベースを使用する場合は、最初のクエリをソースで実行できるかどうかを確認し、そのソースクエリをデータソースの初期抽出データフローに使用します。ソースシステムでネイティブクエリを使用できない場合は、データフロー engine がデータソースにフォールドできる操作を実行します。
同じ容量での更新時間の分散を評価します。更新操作は、大量のコンピューティングを必要とするプロセスです。レストランの例えを使用すると、更新時間の分散は、レストランの客数を制限することに似ています。レストランがゲストをスケジュールして容量を計画するのと同様に、使用量がピークに満たない時間帯の更新操作も検討する必要があります。これが容量の負担の緩和に役立つ場合があります。

このセクションの手順で必要な並列処理の次数が得られない場合は、容量を上位の SKU にアップグレードすることを検討してください。その後、このシーケンスの前の手順をもう一度行います。

コンピューティングエンジンを使用したパフォーマンスの向上

次の手順を行い、ワークロードによって確実にコンピューティングエンジンがトリガーされ、常にパフォーマンスが向上するようにします。

同じワークスペース内の計算およびリンクされたエンティティの場合:

"取り込み" の場合は、データセット全体のサイズを小さくする場合にのみフィルターを使用して、可能な限り迅速にストレージにデータを取り込むことに集中します。変換ロジックをこの手順から切り離し、エンジンが材料の初期収集に集中できるようにすることをお勧めします。次に、リンクまたは計算されたエンティティを使用して、変換とビジネスロジックを同じワークスペース内の別個のデータフローに分割します。これにより、エンジンがアクティブ化し、計算を高速化することができます。コンピューティングエンジンを利用するには、ロジックを別個に準備する必要があります。
フォールドする操作 (結合、結合、変換、およびその他の操作など) を確実に実行してください。
公開されているガイドラインと制限事項内でのデータフローの構築。

DirectQuery を使用することもできます。

コンピューティングエンジンはオンになっているがパフォーマンスが低下している

コンピューティングエンジンがオンになっていても、パフォーマンスの低下が見られるシナリオについて調べる場合は、次の手順を行います。

ワークスペース全体に存在する計算およびリンクされたエンティティを制限します。
コンピューティングエンジンをオンにして最初の更新を実行すると、データはレイクとキャッシュに書き込まれます。この二重書き込みでは、更新が遅くなります。
複数のデータフローにリンクされているデータフローがある場合は、すべての更新が同時に行われないように、必ずソースデータフローの更新をスケジューリングしてください。

データフローと Power BI の詳細については、以下の記事を参照してください。

次の方法で共有

Power BI Premium データフロー ワークロードを構成する

Power BI Premium でのデータフローの有効化

Premium でのデータフローの設定の調整

Premium 容量 SKU - ハードウェアをスケールアップする

拡張コンピューティング エンジン - パフォーマンスを向上させる機会

一般的なシナリオに関するガイダンス

長い更新時間

コンピューティング エンジンを使用したパフォーマンスの向上

コンピューティング エンジンはオンになっているがパフォーマンスが低下している

関連するコンテンツ

フィードバック

その他のリソース

Power BI Premium データフローワークロードを構成する

拡張コンピューティングエンジン - パフォーマンスを向上させる機会

コンピューティングエンジンを使用したパフォーマンスの向上

コンピューティングエンジンはオンになっているがパフォーマンスが低下している