Data Factory for Microsoft Fabric のデータフロー アクティビティを使用すると、Dataflow Gen2 を実行できます。
前提 条件
開始するには、次の前提条件を満たす必要があります。
- アクティブなサブスクリプションを持つテナント アカウント。 アカウントを無料で作成します。
- ワークスペースが作成されます。
パイプラインにデータフロー アクティビティを追加する
パイプラインでデータフロー アクティビティを使用するには、次の手順を実行します。
アクティビティを作成する
ワークスペースに新しいパイプラインを作成します。
パイプライン アクティビティ ペインでデータフローを検索し、それを選択してパイプラインキャンバスに追加します。
キャンバス上の新しいデータフロー アクティビティがまだ選択されていない場合は選択します。
[ 全般 設定 ] タブを構成するには、[ 全般 設定] ガイダンスを参照してください。
注
タイムアウトと取り消しは、CI/CD がサポートされている Dataflow Gen2 にのみ適用されます。 CI/CD がサポートされていない Dataflow Gen2 の実行の場合、タイムアウトは無視され、パイプラインの取り消しによってデータフローの実行は停止されません。
データフロー アクティビティの設定
[ 設定] タブを選択し、実行する既存のワークスペースとデータフローを選択します。 CI/CD と Git 統合サポート (プレビュー) を使用して Dataflow Gen2 を作成した場合は、ドロップダウンから選択することもできます。
通知オプションは現在使用できません。
パブリック パラメーター モードが有効になっている CI/CD を使用して Dataflow Gen2 を選択すると、選択したデータフローで使用可能なすべてのパラメーター、その型、既定値が一覧表示される [データフロー パラメーター] セクションが表示されます。
必須パラメーターは、名前の横にアスタリスクが付いて表示されますが、省略可能なパラメーターにはアスタリスクがありません。 さらに、オプションのパラメーターはグリッドから選択および削除できますが、必要なパラメーターを削除することはできないため、データフローを実行するには渡す必要があります。
更新ボタンを選択して、データフローに最新のパラメーター情報を要求できます。
[データフロー パラメーター] セクションには、渡すパラメーターの名前と、渡す型と値を入力できます。
注
データフロー パイプライン アクティビティ設定で DataflowId をパラメーター化すると、CI/CD がサポートされていない従来の Dataflow Gen2 バージョンのみがサポートされます。 つまり、DataflowId のパラメーター化を使用して CI/CD サポートを使用してデータフローを呼び出すことはできません。
パイプラインを保存して実行またはスケジュールする
パイプラインに必要なその他のアクティビティを構成したら、パイプライン エディターの上部にある [ ホーム ] タブに切り替え、保存ボタンを選択してパイプラインを保存します。 [ 実行 ] を選択して直接実行するか、スケジュールを設定する場合は [スケジュール ] を選択します。 ここで実行履歴を表示したり、他の設定を構成したりすることもできます。
トラブルシューティングのヒント
注意事項
データフロー アクティビティで表示されるエラー情報が不完全または部分的である可能性があります。 トラブルシューティングのシナリオでは、データフロー アクティビティに表示される情報のみに依存しないでください。
ヒント
データフローの実行に関する詳細については、Dataflow Gen2 (CI/CD) 内およびワークスペース エクスプローラーで使用できる [最近の実行 ] ダイアログを参照してください。
データフロー実行のトラブルシューティングを行うときは、特定の実行の詳細なログをダウンロードできる Dataflow Gen2 (CI/CD) の最近の実行 内で開始することを強くお勧めします。 データフローでオンプレミス データ ゲートウェイが使用されている場合は、ゲートウェイがインストールされているマシン内にある詳細なゲートウェイ ログを調べることもできます。
また、Fabric コミュニティ フォーラムを通じて、またはエンジニアの 1 人が支援できる専用のサポート ケースを作成して、サポートを要求することもできます。