データフローの構成と使用

[アーティクル]
02/02/2024

データフローを使用すると、複数のソースのデータを統合し、その統合されたデータをモデリング用に準備することができます。データフローを作成するたびに、データフローのデータを最新の情報に更新するよう求められます。データフローを Power BI Desktop 内のセマンティックモデルで使用したり、リンクテーブルまたは計算テーブルとして参照したりするには、事前に更新する必要があります。

Note

データフローは、米国政府機関 DoD のお客様向けの Power BI サービスではご利用いただけません。使用できる機能と使用できない機能について詳しくは、米国政府機関のお客様の Power BI 機能の利用可能性に関する記事を参照してください。

データフローを構成する

データフローの更新を構成するには、[その他のオプション] (省略記号) を選択して、[設定] を選択します。

Power BI データフローのドロップダウン設定のスクリーンショット。

以下のセクションで説明するように、 [設定] オプションを使用すると、データフローに対する多くのオプションが提供されます。

データフローのドロップダウンで [設定] を選択した後のデータフローの設定ページのスクリーンショット。

[所有権の取得] : データフローの所有者でない場合、これらの設定の多くが無効になります。データフローの所有権を取得するには、 [引き継ぎ] を選択して制御を受け取ります。必要なアクセスレベルがあることを確認するために、資格情報を入力するように求められます。
[ゲートウェイの接続]: このセクションを使用すると、データフローでゲートウェイを使用するかどうかを選択し、使用するゲートウェイを選択できます。データフローの編集の一環としてゲートウェイを指定している場合は、所有権を取得するときに、データフローの編集オプションを使って資格情報を更新する必要がある場合があります。
[データソースの資格情報]: このセクションを使用すると、使用されている資格情報を選択し、データソースへの認証方法を変更できます。
[秘密度ラベル]: ここでは、データフロー内のデータの秘密度を定義できます。秘密度ラベルの詳細については、「Power BI で秘密度ラベルを適用する方法」を参照してください。
[スケジュールされている更新]: ここでは、選択したデータフローを更新する時刻を定義できます。データフローは、セマンティックモデルと同じ頻度で更新できます。
[コンピューティングエンジンの拡張設定]: ここでは、データフローをコンピューティングエンジン内に格納するかどうかを定義できます。コンピューティングエンジンにより、このデータフローを参照する後続のデータフローで、マージ、結合、その他の変換を、それ以外の場合より速く実行できます。また、データフローに対して DirectQuery を実行することもできます。 [オン] を選択すると、データフローは常に DirectQuery モードでサポートされ、すべての参照でエンジンを利用できます。 [最適化] を選択すると、このデータフローへの参照がある場合にのみエンジンが使用されるようになります。 [オフ] を選択すると、このデータフローに対してコンピューティングエンジンと DirectQuery 機能が無効になります。
[推奨]: データフローを認定または昇格するかどうかを定義できます。

注意

Pro ライセンスまたは Premium Per User (PPU) を持つユーザーは、Premium ワークスペースにデータフローを作成できます。

注意事項

データフローを含むワークスペースが削除されると、そのワークスペース内のすべてのデータフローも削除されます。ワークスペースの復旧が可能な場合でも、削除されたデータフローを直接、または Microsoft からのサポートを通じても復旧できません。

データフローを更新する

データフローは、相互に重なる構成要素として機能します。 Raw Data という名前のデータフローと、Raw Data データフローへのリンクテーブルが含まれる Transformed Data という名前のリンクテーブルがあるとします。 Raw Data データフローのスケジュールされた更新がトリガーされると、完了時にそれを参照するデータフローがトリガーされます。この機能により、更新のチェーン効果が作成され、データフローを手動でスケジュールする必要がなくなります。リンクテーブルの更新を処理する場合は、次の点に注意する必要があります。

リンクテーブルは、同じワークスペース内に存在する場合にのみ、更新によってトリガーされます。
ソーステーブルが更新中であるか、ソーステーブルの更新が取り消し中である場合、リンクテーブルは編集用にロックされます。参照チェーン内のいずれかのデータフローの更新が失敗した場合、すべてのデータフローが古いデータにロールバックされます (データフローの更新は、ワークスペース内でトランザクションとして処理されます)。
ソースの更新の完了によってトリガーされた場合、参照テーブルのみが更新されます。すべてのテーブルをスケジュールするには、リンクテーブルにもスケジュールの更新を設定する必要があります。二重の更新を回避するため、リンクされたデータフローには更新スケジュールを設定しないでください。

更新の取り消し データフローにおいては、セマンティックモデルとは異なり、更新をキャンセルする機能がサポートされています。更新の実行時間が長い場合は、[その他のオプション] (データフローの横にある省略記号) を選択し、[更新の取り消し] を選択できます。

増分更新 (Premium のみ) 増分更新するようにデータフローを設定することもできます。これを行うには、増分更新用に設定するデータフローを選択し、増分更新アイコンを選択します。

テーブルの増分更新アクションが強調表示されているスクリーンショット。

増分更新を設定すると、日付範囲を指定するパラメーターがデータフローに追加されます。増分更新の設定方法について詳しくは、「データフローでの増分更新の使用」を参照してください。

状況によっては、増分更新を設定しないようにする必要があります。

リンクテーブルでデータフローが参照されている場合は、増分更新を使用しないでください。データフローでは、クエリの折りたたみはサポートされていません (テーブルで DirectQuery が有効にされている場合でも)。
データフローを参照するセマンティックモデルでは、増分更新を使用しないでください。データフローへの更新は一般にパフォーマンスが優れているため、増分更新は必要ありません。更新に時間がかかりすぎる場合は、コンピューティングエンジンまたは DirectQuery モードの使用を検討してください。

データフローを使用する

データフローは、次の 3 つの方法で使用できます。

データフローからリンクテーブルを作成して、別のデータフロー作成者がデータを使用できるようにします。
データフローからセマンティックモデルを作成して、ユーザーがデータを利用してレポートを作成できるようにします。
CDM (Common Data Model) 形式から読み取ることのできる外部ツールから接続を作成します。

Power BI Desktop からの使用 データフローを使用するには、Power BI Desktop を開き、[データを取得] ドロップダウンで [データフロー] を選択します。

Note

データフローコネクタを使用すると、現在ログインしているユーザーとは異なる資格情報のセットが使用されます。これは、マルチテナントユーザーをサポートするための仕様です。

接続先のデータフローとテーブルを選択します。

注意

存在しているワークスペースに関係なく、また Premium または非 Premium ワークスペースで定義されているかどうかにかかわらず、任意のデータフローまたはテーブルに接続できます。

接続するデータフローを選択する Power BI Desktop のナビゲーターのスクリーンショット。

DirectQuery が使用可能な場合は、DirectQuery またはインポートを使用してテーブルに接続するかどうかを選択するように求められます。

DirectQuery モードでは、大規模なセマンティックモデルのローカルな問い合わせをすばやく実行できます。ただし、それ以上の変換を実行することはできません。

インポートを使用すると、データが Power BI に取り込まれ、データフローとは無関係にセマンティックモデルを更新する必要があります。

データフローと Power BI の詳細については、以下の記事を参照してください。

次の方法で共有

データフローの構成と使用

データフローを構成する

データフローを更新する

データフローを使用する

フィードバック

その他のリソース

次の方法で共有

データフローの構成と使用

データフローを構成する

データフローを更新する

データフローを使用する

関連するコンテンツ

フィードバック

その他のリソース