演習 - データファクトリーのコピーアクティビティを使用する
Data Factory インスタンスの作成が完了したら、[作成] & [監視] ボタンをクリックして、データ パイプラインの作成を開始できるリソースに移動できます。 これにより、次の画面が開きます。
Azure Data Factory での著作
パイプラインの最初の手順は、次の手順を使用して、ソースとコピー先の間でデータをコピーするコピー アクティビティを作成することです。
左側のサイドバーにある 鉛筆アイコン をクリックするか、[パイプラインの作成] ボタンをクリックして作成キャンバスの を開き、作成キャンバスを開きます。
![[パイプラインの作成] オプションが強調表示されているスクリーンショット。](../../wwl-data-ai/petabyte-scale-ingestion-azure-data-factory/media/create-pipeline-designer.png)
パイプラインを作成します。 [ファクトリ リソース] ウィンドウで [+] ボタンをクリックし、パイプライン 選択します。
![[Data Factory] タブの下にファクトリ リソースを示すスクリーンショット。プラス記号が選択され、パイプラインが公開され、両方が強調表示されます。](../../wwl-data-ai/petabyte-scale-ingestion-azure-data-factory/media/open-create-pipeline-designer.png)
コピー アクティビティを追加します。 アクティビティ ペインで、Move and Transform アコーディオンを開き、データのコピー アクティビティをパイプライン キャンバスにドラッグします。
コピー アクティビティの使用
コピー アクティビティが追加されたら、ソース データの定義を開始します。
コピー アクティビティの設定の [ソース] タブで、[+ 新しい] をクリックしてデータ ソースを選択します。

たとえば、データストアの一覧で Amazon S3 タイルを選択し、続行 をクリックします。

ファイル形式の一覧で、DelimitedText形式のタイルを選択し、続行をクリックします

プロパティの設定 ウィンドウで、データセットにわかりやすい 名 を付け、リンクされたサービスのドロップダウンをクリックします。 S3 のリンク サービスを作成していない場合は、[新規] を選択します。
![リンクされたサービスの下でフィルターが強調表示されている [プロパティの設定] ウィンドウを示すスクリーンショット。](../../wwl-data-ai/petabyte-scale-ingestion-azure-data-factory/media/data-source-file-format.png)
S3 のリンクされたサービス構成ウィンドウに固有の、S3 アクセス キーの と 秘密鍵を指定します。 Data Factory サービスは、Microsoft が管理する証明書を使用して資格情報を暗号化します。 詳細については、「データ移動のセキュリティに関する考慮事項」を参照してください。 資格情報が有効であることを確認するには、[テスト接続 をクリックします。 完了したら [作成] をクリックします。

リンクされたサービスを作成して選択したら、データセット設定の残りの部分を指定します。 これらの設定では、接続内でデータをプルする方法と場所を指定します。 完了したら 完了 をクリックします。

データセットが正しく構成されていることを確認するには、コピー アクティビティの [ソース] タブ [データ のプレビュー] をクリックして、データの小さなスナップショットを取得します。
データをプレビューする
ソース データを定義すると、データの読み込み先となるシンクを定義します。 この例では、次の手順を実行することで、シンクは Azure Data Lake Storage Gen2 になります。
[シンク] タブで、[+ 新しい] をクリックします。
でのデータ シンクの定義Azure Data lake Storage Gen2 タイルを選択し、クリックして続行
データセットの定義
プロパティの設定 サイド ナビゲーションで、データセットにわかりやすい 名 付け、リンクされたサービスのドロップダウンをクリックします。 ADLS のリンクサービスを作成していない場合は、[新規] を選択します。

ADLS のリンクされたサービス構成ウィンドウで、認証方法の を選択し、資格情報 入力します。 次の例では、アカウント キーを選択し、ドロップダウンからストレージ アカウントを選択しています。

リンクされたサービスを構成したら、ADLS データセット構成を入力します。 完了したら、完了をクリックします。

この時点で、コピー アクティビティを完全に構成しました。
テストするには、パイプライン キャンバスの上部にある デバッグ ボタンをクリックします。 これにより、パイプラインデバッグの実行が開始されます。
コピー アクティビティのテストをする
パイプライン デバッグ実行の進行状況を監視するには、パイプラインの [出力] タブをクリックします。
コピー活動の監視
アクティビティ出力の詳細な説明を表示するには、眼鏡アイコンをクリックします。 これにより、データの読み取り/書き込み、スループット、詳細な期間の統計情報などの有用なメトリックを提供するコピー監視画面が開きます。
コピー アクティビティの結果の表示
コピーが期待どおりに動作したことを確認するには、ADLS gen2 ストレージ アカウントを開き、ファイルが想定どおりに書き込まれたかどうかを確認します