次の方法で共有


クイック スタート: コピー アクティビティを使用して専用 SQL プールにデータを読み込む

Azure Synapse Analytics には、データの取り込み、変換、モデル化、分析に役立つさまざまな分析エンジンが用意されています。 専用 SQL プールでは、T-SQL ベースのコンピューティング機能とストレージ機能が提供されます。 Synapse ワークスペースに専用 SQL プールを作成した後、データを読み込み、モデル化し、処理し、分析分析情報を迅速に提供できます。

このクイック スタートでは、 Azure SQL Database から Azure Synapse Analytics にデータを読み込む方法について説明します。 その他の種類のデータ ストアからデータをコピーする場合も、同様の手順で実行できます。 この同様のフローは、他のソースとシンクのデータ コピーにも適用されます。

[前提条件]

  • Azure サブスクリプション: Azure サブスクリプションをお持ちでない場合は、開始する前に 無料の Azure アカウント を作成してください。
  • Azure Synapse ワークスペース: 「クイック スタート: Synapse ワークスペースを作成する」の手順に従って、Azure portal を使用して Synapse ワークスペースを作成します
  • Azure SQL Database: このチュートリアルでは、Azure SQL Database 内に Adventure Works LT サンプル データセットからのデータをコピーします。 SQL Database 内にこのサンプル データベースを作成するには、Azure SQL Database でのサンプル データベースの作成に関する記事の手順に従います。 または、同様の手順に従って、他のデータ ストアを使用することもできます。
  • Azure ストレージ アカウント: コピー操作の ステージング 領域として Azure Storage が使用されます。 Azure ストレージ アカウントがない場合は、「ストレージ アカウントの作成」の手順をご覧ください。
  • Azure Synapse Analytics: シンク データ ストアとして専用 SQL プールを使用します。 Azure Synapse Analytics インスタンスがない場合は、 専用 SQL プールを作成 する手順を参照してください。

Synapse ワークスペースが作成されたら、Synapse Studio を開く 2 つの方法があります。

  • Azure portal で Synapse ワークスペースを開きます。 [はじめに] の下の [Synapse Studio を開く] カードで、[開く] を選択します。
  • Azure Synapse Analytics を開き、ワークスペースにサインインします。

このクイック スタートでは、"adftest2020" という名前のワークスペースを例として使用します。 Synapse Studio のホーム ページに自動的に移動します。

Synapse Studio のホーム ページ

リンクされたサービスを作成します

Azure Synapse Analytics では、リンクされたサービスを使用して、他のサービスへの接続情報を定義します。 このセクションでは、次の 2 種類のリンクされたサービスを作成します。Azure SQL Database と Azure Data Lake Storage Gen2 (ADLS Gen2) のリンクされたサービスです。

  1. Synapse Studio のホーム ページで、左側のナビゲーションの [ 管理 ] タブを選択します。

  2. [外部接続] で、[リンクされたサービス] を選択します。

    新しいリンクされたサービスを作成する

  3. リンクされたサービスを追加するには、[ 新規] を選択します。

  4. ギャラリーで [Azure SQL Database] を選択し、 [続行] を選択します。 検索ボックスに「sql」と入力してコネクタをフィルター処理できます。

    新しい Azure SQL Database のリンクされたサービスを作成する

  5. [新しいリンクされたサービス] ページで、ドロップダウン リストからサーバー名と DB 名を選択し、ユーザー名とパスワードを指定します。 [ 接続のテスト ] をクリックして設定を検証し、[ 作成] を選択します。

    Azure SQL Database のリンクされたサービスを構成する

  6. 手順 3 から 4 を繰り返しますが、代わりにギャラリーから Azure Data Lake Storage Gen2 を選択します。 [新しいリンクされたサービス] ページで、ドロップダウン リストからストレージ アカウント名を選択します。 [ 接続のテスト ] をクリックして設定を検証し、[ 作成] を選択します。

    Azure Data Lake Storage Gen2 の構成

パイプラインを作成する

パイプラインには、一連のアクティビティを実行するための論理フローが含まれています。 このセクションでは、Azure SQL Database から専用 SQL プールにデータを取り込むコピー アクティビティを含むパイプラインを作成します。

  1. [ 統合 ] タブに移動します。パイプライン ヘッダーの横にあるプラス アイコンを選択し、[パイプライン] を選択します。

    新しいパイプラインを作成する

  2. [アクティビティ] ウィンドウの [移動と変換] で、[データのコピー] をパイプライン キャンバスにドラッグします。

  3. コピー アクティビティを選択し、[ソース] タブに移動します。 [新規 ] を選択して新しいソース データセットを作成します。

    ソース データセットを作成する

  4. データ ストアとして Azure SQL Database を選択し、[ 続行] を選択します。

  5. [ プロパティの設定 ] ウィンドウで、前の手順で作成した Azure SQL Database のリンクされたサービスを選択します。

  6. [テーブル名] で、次のコピー アクティビティで使用するサンプル テーブルを選択します。 このクイック スタートでは、例として "SalesLT.Customer" テーブルを使用します。

    ソース データセットのプロパティを設定する

  7. 完了したら、[OK] を選択します。

  8. コピー アクティビティを選択し、[シンク] タブに移動します。[ 新規 ] を選択して新しいシンク データセットを作成します。

  9. データ ストアとして Azure Synapse 専用 SQL プール を選択し、[ 続行] を選択します。

  10. [ プロパティの設定 ] ウィンドウで、前の手順で作成した SQL Analytics プールを選択します。 既存のテーブルに書き込む場合は、[ テーブル名 ] でドロップダウンから選択します。 それ以外の場合は、[編集] をオンにして、新しいテーブル名を入力します。 完了したら、[OK] を選択します。

  11. シンク データセットの設定では、[テーブル] オプション フィールドで [ テーブルの自動作成 ] を有効にします。

    自動作成を有効にする

  12. [ 設定] ページで、[ ステージングを有効にする] チェック ボックスをオンにします。 このオプションは、ソース データが PolyBase と互換性がない場合に適用されます。 [ ステージング設定] セクションで、前の手順で作成した Azure Data Lake Storage Gen2 のリンクされたサービスをステージング ストレージとして選択します。

    このストレージは、PolyBase を使用して Azure Synapse Analytics に読み込む前に、データをステージングするために使用されます。 コピーが完了すると、Azure Data Lake Storage Gen2 の中間データが自動的にクリーンアップされます。

    ステージングを有効にする

  13. パイプラインを検証するには、ツール バーの [検証 ] を選択します。 パイプライン検証出力の結果がページの右側に表示されます。

パイプラインをデバッグして発行する

パイプラインの構成が完了したら、成果物を発行する前にデバッグ実行を実行して、すべてが正しいことを確認できます。

  1. パイプラインをデバッグするには、ツール バーで [デバッグ] を選択します。 ウィンドウ下部の [出力] タブにパイプラインの実行の状態が表示されます。

    パイプラインをデバッグする

  2. パイプラインの実行が成功したら、上部のツール バーで [ すべて発行] を選択します。 このアクションにより、作成したエンティティ (データセットとパイプライン) が Synapse Analytics サービスに発行されます。

  3. [正常に発行されました] というメッセージが表示されるまで待機します。 通知メッセージを表示するには、右上にあるベル ボタンを選択します。

パイプラインをトリガーして監視する

このセクションでは、前の手順で発行したパイプラインを手動でトリガーします。

  1. ツール バーの [トリガーの追加] を選択し、[Trigger Now]\(今すぐトリガー\) を選択します。 [Pipeline Run]\(パイプラインの実行\) ページで [OK] を選択します。

  2. 左側のサイドバーにある [モニター ] タブに移動します。 手動トリガーによってトリガーされたパイプラインの実行が表示されます。

  3. パイプラインの実行が正常に完了したら、[ パイプライン名 ] 列の下にあるリンクを選択して、アクティビティの実行の詳細を表示するか、パイプラインを再実行します。 この例では、アクティビティが 1 つだけなので、一覧に表示されるエントリは 1 つのみです。

  4. コピー操作の詳細を確認するには、[アクティビティ名] 列の [詳細] リンク (眼鏡アイコン) を選択します。 ソースからシンクにコピーされるデータの量、データのスループット、実行ステップと対応する期間、使用される構成などの詳細を監視できます。

    アクティビティの詳細

  5. パイプラインの実行ビューに戻るには、上部の [すべてのパイプラインの実行] リンクを選択します。 [最新の情報に更新] を選択して、一覧を更新します。

  6. データが専用 SQL プールに正しく書き込まれているかどうかを確認します。

次のステップ

次の資料に進んで、Azure Synapse Analytics のサポートを確認します。