次の方法で共有


Azure Blob Storage からレイクハウスへのコピー

このチュートリアルでは、CSV ファイルをソースの Azure Blob Storage の入力フォルダーからコピー先のレイクハウスに移動させるデータ パイプラインを構築します。

前提条件

開始するには、次の前提条件を満たしている必要があります。

  • プロジェクト Microsoft Fabric が有効になっているワークスペースがあることを確認します: ワークスペースの作成

  • [今すぐ試す] ボタンを選択して、コピーの Azure Blob Storage データ ソースを準備します。 この Azure Blob Storage 用に新しいリソース グループを作成し、[確認と作成]>[作成] を選択します。

    最初のデータ ファクトリのデモを試す

    [プロジェクトの詳細] 画面のスクリーンショット。

    次に、Azure Blob Storage が作成され、作成された Azure Blob Storage の入力フォルダーに moviesDB2.csv がアップロードされます。

    フォルダー内の新しいストレージが表示される場所を示すスクリーンショット。

データ パイプラインを作成する

  1. app.powerbi.com ページで [データ ファクトリ] に切り替えます。

    [データ ファクトリ] オプションが表示されるメニューのスクリーンショット。

  2. このデモ用に新しいワークスペースを作成します。

    ワークスペース画面のスクリーンショット。

  3. [新規] を選択し、[データ パイプライン] を選択します。

    [新規] メニューのスクリーンショット。

コピー アシスタントを使用してデータをコピーする

このセッションでは、次の手順を使用してデータ パイプラインの構築を開始します。 これらの手順では、コピー アシスタントを使用して、Azure Blob Storage の入力フォルダーからコピー先のレイクハウスに CSV ファイルをコピーします。

手順 1: コピー アシスタントを使用して作業を開始する

  1. キャンバス上の [データのコピー アシスタント] を選び、コピー アシスタント ツールを開いて作業を開始します。 または、リボンの [アクティビティ] タブの [データのコピー] ドロップ ダウン リストから [コピー アシスタントを使用する] を選びます。

    コピー アシスタントを選択するための 2 つのオプションのスクリーンショット。

手順 2 - ソースを構成する

  1. 選択フィルターに「BLOB」と入力し、[Azure BLOB] を選択して、[次へ] を選択します。

    データ ソースとして Azure Blob Storage を選択する場所を示すスクリーンショット。

  2. [接続] ドロップ ダウンで [新しい接続の作成] を選択して、アカウント名または URL を指定し、データ ソースへの接続を作成します。

    [新しい接続] を選ぶ場所を示すスクリーンショット。

    1. 指定されたストレージ アカウントを使用して [新しい接続の作成] を選択した後は、[認証の種類] を入力するだけです。 このデモでは、[アカウント キー] を選択しますが、好みに応じて他の認証の種類を選択することもできます。

      [データのコピー] アシスタントの [データ ソースに接続] 画面を示すスクリーンショット。

    2. 接続が正常に作成されたら、データ ソースに接続するするために [次へ] を選択するだけです。

  3. プレビューするソース構成で moviesDB2.csv ファイルを選択し、[次へ] を選択します。

    データ ソースを選択する方法を示すスクリーンショット。

手順 3: コピー先を構成する

  1. [レイクハウス] を選択します。

    [データ変換先の選択] ダイアログを示すスクリーンショット。[レイクハウス] が選択されています。

  2. 新しいレイクハウスの名前を指定します。 その後、[作成と接続] を選択します。

    [データ変換先の選択] ダイアログを示すスクリーンショット。新規レイクハウスのオプションが選択されています。

  3. ソース データを構成してコピー先にマップします。次に、[次へ] を選択してコピー先の構成を完了します。

    [データのコピー] アシスタントの [データ変換先に接続] ダイアログを示すスクリーンショット。テーブル名 MoviesDB が入力されています。

手順 4: Copy アクティビティを確認して作成する

  1. 前の手順で行った Copy アクティビティの設定を確認し、[保存および実行] を選んで完了します。 または、必要に応じてツールで前の手順に戻って、設定を編集することもできます。

    [データのコピー] アシスタント ダイアログの [確認と作成] 画面を示すスクリーンショット。

  2. 完了すると、Copy アクティビティがデータ パイプライン キャンバスに追加され、[データ転送をすぐに開始] ボックスチェックを選択したままにした場合は直接実行されます。

    完成した Copy アクティビティを示すスクリーンショット。

データ パイプラインを実行およびスケジュールする

  1. [確認と作成] ページの [データ転送をすぐに開始] チェックボックスを残さない場合は、[ホーム] タブに切り替えて 、[実行] を選択します。 次に、[保存および実行] を選択します。

    [ホーム] タブにある Copy アクティビティの [実行] ボタンを示すスクリーンショット。

    Copy アクティビティの [保存および実行] ダイアログを示すスクリーンショット。

  2. [出力] タブで、Copy アクティビティの名前を含むリンクを選択して進行状況を監視し、実行の結果をチェックします。

    実行の [詳細] ボタンを示すスクリーンショット。

  3. [データの詳細をコピーします] ダイアログには、状態、読み取りおよび書き込みデータの量、開始時刻と停止時間、期間など、実行の結果が表示されます。

    [データの詳細をコピーします] ダイアログを示すスクリーンショット。

  4. 必要に応じて、特定の頻度でパイプラインを実行するようにスケジュールすることもできます。 次の例は、パイプラインを 15 分ごとに実行するようにスケジュールする方法を示しています。

    [スケジュールの構成] ダイアログを示すスクリーンショット。

    15 分ごとに実行するようにスケジュールが構成されたパイプラインを示すスクリーンショット。

このサンプルのパイプラインは、Azure Blob Storage から レイクハウスにデータをコピーする方法を示しています。 以下の方法を学習しました。

  • データ パイプラインを作成する。
  • コピー アシスタントを使用してデータをコピーする。
  • データ パイプラインを実行およびスケジュールする。

次は、パイプライン実行の監視について詳しく説明します。