データ パイプラインを使用してウェアハウスを読み込む
Microsoft Fabric のウェアハウスには統合されたデータ インジェスト ツールが用意されており、ユーザーはコーディングまたはコーディング以外のエクスペリエンスを通じて大規模にデータを読み込んでウェアハウスに取り込むことができます。
データ パイプラインは、データ統合のためのクラウドベースのサービスであり、大規模なデータ移動とデータ変換のためのワークフローを作成できます。 さまざまなデータ ストアからデータを取り込んで読み込むことができるデータ パイプラインを作成およびスケジュールできます。 データ フローを使用して、視覚的にデータを変換する複雑な ETL、または ELT プロセスを構築できます。
Microsoft Fabric のデータ パイプラインのほとんどの機能は Azure Data Factory のものであり、Microsoft Fabric エコシステム内でその機能をシームレスに統合して利用できます。
Note
ウェアハウス内のすべてのデータは、Delta Parquet 形式で OneLake に自動的に格納されます。
データ パイプラインを作成する
データ パイプライン エディターを起動するには、いくつかの方法があります。
ワークスペースから:[+ 新規] を選択し、[データ パイプライン] を選びます。 一覧に表示されない場合は、[その他のオプション] を選択し、[Data Factory] セクションで [データ パイプライン] を見つけます。
ウェアハウス資産から -[データの取得]、[新しいデータ パイプライン] の順に選択します。
パイプラインを作成するときに使用できるオプションは 3 つあります。
オプション | 説明 |
---|---|
"1.パイプライン アクティビティを追加する | 独自のパイプラインを作成できるパイプライン エディターを起動します。 |
2.データをコピーする | さまざまなデータ ソースからデータのコピー先にデータをコピーするためにアシスタントを起動します。 新しいパイプライン アクティビティは、事前構成済みのデータのコピー タスクを使用して最後に生成されます。 |
3.開始するタスクを選ぶ | 定義済みのテンプレートのコレクションから選ぶと、多くのシナリオに基づいてパイプラインを開始するのに役立ちます。 |
データのコピー アシスタントを構成する
データのコピー アシスタントでは、データのコピー タスクの構成を容易にするステップ バイ ステップ インターフェイスが提供されます。
- データ ソースを選ぶ:コネクタを選択し、接続情報を指定します。
- データ ソースに接続する:データを選択してプレビューし、選びます。 これは、テーブルまたはビューから行うことも、独自のクエリを指定して選択をカスタマイズすることもできます。
- データのコピー先を選ぶ:コピー先としてデータ ストアを選択します。
- データのコピー先に接続する:列を選択してソースからコピー先にマップします。 新規または既存のテーブルに読み込むことができます。
- 設定:ステージングや既定値などの他の設定を構成します。
データをコピーした後は、他のタスクを使用してさらに変換および分析できます。 また、データのコピー タスクを使用して、変換や分析の結果を発行し、ビジネス インテリジェンス (BI) やアプリケーションで使用することもできます。
データ パイプラインをスケジュールする
データ パイプライン エディターから [スケジュール] を選択して、データ パイプラインをスケジュールできます。
また、データ パイプライン エディターの [ホーム] メニューで [設定] を選択して、スケジュールを構成することもできます。
グラフィカル ユーザー インターフェイスを使用するため、コード不要またはローコード エクスペリエンスのデータ パイプラインをお勧めします。 スケジュールに従って実行するか、さまざまなデータ ソースに接続するデータ ワークフローに最適です。
データ パイプラインの詳細については、「データ パイプラインを使用してウェアハウスにデータを取り込む」を参照してください。