演習 - データファクトリーのコピーアクティビティを使用する

完了

Data Factory インスタンスの作成が完了したら、[作成] & [監視] ボタンをクリックして、データ パイプラインの作成を開始できるリソースに移動できます。 これにより、次の画面が開きます。

Azure Data Factory での著作

パイプラインの最初の手順は、次の手順を使用して、ソースとコピー先の間でデータをコピーするコピー アクティビティを作成することです。

  1. 左側のサイドバーにある 鉛筆アイコン をクリックするか、[パイプラインの作成] ボタンをクリックして作成キャンバスの を開き、作成キャンバスを開きます。

    [パイプラインの作成] オプションが強調表示されているスクリーンショット。

  2. パイプラインを作成します。 [ファクトリ リソース] ウィンドウで [+] ボタンをクリックし、パイプライン 選択します。

    [Data Factory] タブの下にファクトリ リソースを示すスクリーンショット。プラス記号が選択され、パイプラインが公開され、両方が強調表示されます。

  3. コピー アクティビティを追加します。 アクティビティ ペインで、Move and Transform アコーディオンを開き、データのコピー アクティビティをパイプライン キャンバスにドラッグします。

    コピー アクティビティの使用

コピー アクティビティが追加されたら、ソース データの定義を開始します。

  1. コピー アクティビティの設定の [ソース] タブで、[+ 新しい] をクリックしてデータ ソースを選択します。

    データ ソースとして作成

  2. たとえば、データストアの一覧で Amazon S3 タイルを選択し、続行 をクリックします。

    データソースとして Amazon S3 を選択

  3. ファイル形式の一覧で、DelimitedText形式のタイルを選択し、続行をクリックします

    書式の選択リストで選択された区切りテキストを示すスクリーンショット。

  4. プロパティの設定 ウィンドウで、データセットにわかりやすい を付け、リンクされたサービスのドロップダウンをクリックします。 S3 のリンク サービスを作成していない場合は、[新規] を選択します。

    リンクされたサービスの下でフィルターが強調表示されている [プロパティの設定] ウィンドウを示すスクリーンショット。

  5. S3 のリンクされたサービス構成ウィンドウに固有の、S3 アクセス キーの秘密鍵を指定します。 Data Factory サービスは、Microsoft が管理する証明書を使用して資格情報を暗号化します。 詳細については、「データ移動のセキュリティに関する考慮事項」を参照してください。 資格情報が有効であることを確認するには、[テスト接続 をクリックします。 完了したら [作成] をクリックします。

    キーを使用したデータ ソース アクセスの設定

  6. リンクされたサービスを作成して選択したら、データセット設定の残りの部分を指定します。 これらの設定では、接続内でデータをプルする方法と場所を指定します。 完了したら 完了 をクリックします。

    データ ソース設定の完了

  7. データセットが正しく構成されていることを確認するには、コピー アクティビティの [ソース] タブ [データ のプレビュー] をクリックして、データの小さなスナップショットを取得します。

    データをプレビューする

ソース データを定義すると、データの読み込み先となるシンクを定義します。 この例では、次の手順を実行することで、シンクは Azure Data Lake Storage Gen2 になります。

  1. [シンク] タブで、[+ 新しい] をクリックします。

    コピー アクティビティ でのデータ シンクの定義

  2. Azure Data lake Storage Gen2 タイルを選択し、クリックして続行

    データセットの定義

  3. プロパティの設定 サイド ナビゲーションで、データセットにわかりやすい 付け、リンクされたサービスのドロップダウンをクリックします。 ADLS のリンクサービスを作成していない場合は、[新規] を選択します。

    データセットのプロパティの設定

  4. ADLS のリンクされたサービス構成ウィンドウで、認証方法の を選択し、資格情報 入力します。 次の例では、アカウント キーを選択し、ドロップダウンからストレージ アカウントを選択しています。

    データセットプロパティの最終処理

  5. リンクされたサービスを構成したら、ADLS データセット構成を入力します。 完了したら、完了をクリックします。

    データセットのプロパティを完了

この時点で、コピー アクティビティを完全に構成しました。

  1. テストするには、パイプライン キャンバスの上部にある デバッグ ボタンをクリックします。 これにより、パイプラインデバッグの実行が開始されます。

    コピー アクティビティのテストをする

  2. パイプライン デバッグ実行の進行状況を監視するには、パイプラインの [出力] タブをクリックします。

    コピー活動の監視

  3. アクティビティ出力の詳細な説明を表示するには、眼鏡アイコンをクリックします。 これにより、データの読み取り/書き込み、スループット、詳細な期間の統計情報などの有用なメトリックを提供するコピー監視画面が開きます。

    コピー アクティビティの結果の表示

コピーが期待どおりに動作したことを確認するには、ADLS gen2 ストレージ アカウントを開き、ファイルが想定どおりに書き込まれたかどうかを確認します