データ ハブを探索する

完了

データ ハブを使用すると、次の手順に示すように、ソース データおよびリンク サービスとやり取りして探索することができます。

  1. Azure Synapse Studio の左側で、データ ハブをクリックします。

    Navigating hubs in Azure Synapse Studio

    データ ハブから、ワークスペース内のプロビジョニングされた SQL プール データベースと SQL サーバーレス データベースのほか、ストレージ アカウントやその他のリンク サービスなどの外部データ ソースにアクセスできます。

  2. データ ハブ (1)[ワークスペース] (2) タブで、[データベース] の下にある [SQLPool01] (3) SQL プールを展開します。

    Viewing workspaces in the data hub in Azure Synapse Studio

  3. [テーブル][プログラミングとストアド プロシージャ] の順に展開します。

    SQL プールの下に一覧表示されるテーブルには、SAP Hana、Twitter、Azure SQL Database、オーケストレーション パイプラインからコピーされた外部ファイルなど、複数のソースからのデータが格納されています。 Synapse Analytics では、これらのデータ ソースを組み合わせて分析とレポート作成を行うことができ、すべてを 1 か所で行うことができます。

    ストアド プロシージャなど、使い慣れたデータベース コンポーネントも表示されます。 ストアド プロシージャは、T-SQL スクリプトを使用して実行したり、オーケストレーション パイプラインの一部として実行したりできます。

  4. [リンク] タブを選択し、[Azure Data Lake Storage Gen2] グループを展開して、ワークスペースの [プライマリ ストレージ] を展開します。

    Viewing linked in the data hub in Azure Synapse Studio

    すべての Synapse ワークスペースには、プライマリ ADLS Gen2 アカウントが関連付けられています。 これは、データ レイクとして機能します。これは、オンプレミスのデータ ストアからコピーされたファイルなどのフラット ファイル、外部のサービスやアプリケーションから直接エクスポートされたデータまたはコピーされたデータ、テレメトリ データなどを格納するのに適した場所です。すべてが 1 か所にまとめられます。

    この例では、ファイルとフォルダーを保持するコンテナーがいくつかあり、ワークスペース内から探索して使用することができます。 こちらには、たとえば、外部データベースからインポートされたマーケティング キャンペーン データ、CSV ファイル、財務情報のほか、機械学習アセット、IoT デバイス テレメトリ、SAP Hana データ、ツイートなどがあります。

    すべてのデータが 1 か所に配置されているため、この場所で今すぐにプレビューを開始できます。

    キャンペーン データを見てみましょう。

  5. customcsv ストレージ コンテナーを選択します。

    Viewing containers in the data hub in Azure Synapse Studio

    キャンペーン データをプレビューして、新しいキャンペーン名を調べましょう。

  6. CampaignAnalyticsLatest.csv ファイル (1) を右クリックし、[プレビュー] (2) を選択します。

    Preview data in the data hub in Azure Synapse Studio

    エクスプローラーの機能を使用すると、ファイルをすばやく検索して、それらに対してアクションを実行できます。ファイルの内容をプレビューしたり、新しい SQL スクリプトやノートブックを生成してファイルにアクセスしたり、新しいデータ フローまたはデータセットを作成したり、ファイルを管理したりすることができます。

    View data in the data hub in Azure Synapse Studio