データフローの構成と使用
データフローを使用すると、複数のソースのデータを統合し、その統合されたデータをモデリング用に準備することができます。 データフローを作成するたびに、データフローのデータを最新の情報に更新するよう求められます。 データフローを Power BI Desktop 内のセマンティック モデルで使用したり、リンク テーブルまたは計算テーブルとして参照したりするには、事前に更新する必要があります。
Note
データフローは、米国政府機関 DoD のお客様向けの Power BI サービスではご利用いただけません。 使用できる機能と使用できない機能について詳しくは、米国政府機関のお客様の Power BI 機能の利用可能性に関する記事を参照してください。
データフローを構成する
データフローの更新を構成するには、[その他のオプション] (省略記号) を選択して、[設定] を選択します。
以下のセクションで説明するように、 [設定] オプションを使用すると、データフローに対する多くのオプションが提供されます。
[所有権の取得] : データフローの所有者でない場合、これらの設定の多くが無効になります。 データフローの所有権を取得するには、 [引き継ぎ] を選択して制御を受け取ります。 必要なアクセス レベルがあることを確認するために、資格情報を入力するように求められます。
[ゲートウェイの接続]: このセクションを使用すると、データフローでゲートウェイを使用するかどうかを選択し、使用するゲートウェイを選択できます。 データフローの編集の一環としてゲートウェイを指定している場合は、所有権を取得するときに、データフローの編集オプションを使って資格情報を更新する必要がある場合があります。
[データ ソースの資格情報]: このセクションを使用すると、使用されている資格情報を選択し、データ ソースへの認証方法を変更できます。
[秘密度ラベル]: ここでは、データフロー内のデータの秘密度を定義できます。 秘密度ラベルの詳細については、「Power BI で秘密度ラベルを適用する方法」を参照してください。
[スケジュールされている更新]: ここでは、選択したデータフローを更新する時刻を定義できます。 データフローは、セマンティック モデルと同じ頻度で更新できます。
[コンピューティング エンジンの拡張設定]: ここでは、データフローをコンピューティング エンジン内に格納するかどうかを定義できます。 コンピューティング エンジンにより、このデータフローを参照する後続のデータフローで、マージ、結合、その他の変換を、それ以外の場合より速く実行できます。 また、データフローに対して DirectQuery を実行することもできます。 [オン] を選択すると、データフローは常に DirectQuery モードでサポートされ、すべての参照でエンジンを利用できます。 [最適化] を選択すると、このデータフローへの参照がある場合にのみエンジンが使用されるようになります。 [オフ] を選択すると、このデータフローに対してコンピューティング エンジンと DirectQuery 機能が無効になります。
[推奨]: データフローを認定または昇格するかどうかを定義できます。
注意
Pro ライセンスまたは Premium Per User (PPU) を持つユーザーは、Premium ワークスペースにデータフローを作成できます。
注意事項
データフローを含むワークスペースが削除されると、そのワークスペース内のすべてのデータフローも削除されます。 ワークスペースの復旧が可能な場合でも、削除されたデータフローを直接、または Microsoft からのサポートを通じても復旧できません。
データフローを更新する
データフローは、相互に重なる構成要素として機能します。 Raw Data という名前のデータフローと、Raw Data データフローへのリンク テーブルが含まれる Transformed Data という名前のリンク テーブルがあるとします。 Raw Data データフローのスケジュールされた更新がトリガーされると、完了時にそれを参照するデータフローがトリガーされます。 この機能により、更新のチェーン効果が作成され、データフローを手動でスケジュールする必要がなくなります。 リンク テーブルの更新を処理する場合は、次の点に注意する必要があります。
リンク テーブルは、同じワークスペース内に存在する場合にのみ、更新によってトリガーされます。
ソース テーブルが更新中であるか、ソース テーブルの更新が取り消し中である場合、リンク テーブルは編集用にロックされます。 参照チェーン内のいずれかのデータフローの更新が失敗した場合、すべてのデータフローが古いデータにロールバックされます (データフローの更新は、ワークスペース内でトランザクションとして処理されます)。
ソースの更新の完了によってトリガーされた場合、参照テーブルのみが更新されます。 すべてのテーブルをスケジュールするには、リンク テーブルにもスケジュールの更新を設定する必要があります。 二重の更新を回避するため、リンクされたデータフローには更新スケジュールを設定しないでください。
更新の取り消し データフローにおいては、セマンティック モデルとは異なり、更新をキャンセルする機能がサポートされています。 更新の実行時間が長い場合は、[その他のオプション] (データフローの横にある省略記号) を選択し、[更新の取り消し] を選択できます。
増分更新 (Premium のみ) 増分更新するようにデータフローを設定することもできます。 これを行うには、増分更新用に設定するデータフローを選択し、増分更新アイコンを選択します。
増分更新を設定すると、日付範囲を指定するパラメーターがデータフローに追加されます。 増分更新の設定方法について詳しくは、「データフローでの増分更新の使用」を参照してください。
状況によっては、増分更新を設定しないようにする必要があります。
リンク テーブルでデータフローが参照されている場合は、増分更新を使用しないでください。 データフローでは、クエリの折りたたみはサポートされていません (テーブルで DirectQuery が有効にされている場合でも)。
データフローを参照するセマンティック モデルでは、増分更新を使用しないでください。 データフローへの更新は一般にパフォーマンスが優れているため、増分更新は必要ありません。 更新に時間がかかりすぎる場合は、コンピューティング エンジンまたは DirectQuery モードの使用を検討してください。
データフローを使用する
データフローは、次の 3 つの方法で使用できます。
データフローからリンク テーブルを作成して、別のデータフロー作成者がデータを使用できるようにします。
データフローからセマンティック モデルを作成して、ユーザーがデータを利用してレポートを作成できるようにします。
CDM (Common Data Model) 形式から読み取ることのできる外部ツールから接続を作成します。
Power BI Desktop からの使用 データフローを使用するには、Power BI Desktop を開き、[データを取得] ドロップダウンで [データフロー] を選択します。
Note
データフロー コネクタを使用すると、現在ログインしているユーザーとは異なる資格情報のセットが使用されます。 これは、マルチテナント ユーザーをサポートするための仕様です。
接続先のデータフローとテーブルを選択します。
注意
存在しているワークスペースに関係なく、また Premium または非 Premium ワークスペースで定義されているかどうかにかかわらず、任意のデータフローまたはテーブルに接続できます。
DirectQuery が使用可能な場合は、DirectQuery またはインポートを使用してテーブルに接続するかどうかを選択するように求められます。
DirectQuery モードでは、大規模なセマンティック モデルのローカルな問い合わせをすばやく実行できます。 ただし、それ以上の変換を実行することはできません。
インポートを使用すると、データが Power BI に取り込まれ、データフローとは無関係にセマンティック モデルを更新する必要があります。
関連するコンテンツ
データフローと Power BI の詳細については、以下の記事を参照してください。