Azure Synapse Analytics ワークスペースを作成する

完了

Azure Synapse Analytics をデプロイするための最初の手順は、Azure Synapse Analytics ワークスペースをデプロイすることです。 このデプロイでは、ワークスペース データを格納するプライマリ ストレージおよびコンテナーとして機能する Azure Data Lake Storage Gen2 アカウントを含むいくつかのリソースが作成されます。 このワークスペースでは、データが Apache Spark テーブルに格納されます。 また、/synapse/workspacename というフォルダーに Spark アプリケーション ログが格納されます。 作成されたエンドポイントは、SQL オンデマンド サービスと Azure Synapse Analytics ワークスペース自体に接続するために使用できます。

Azure Synapse Analytics では、要件に基づいてシームレスに混在および照合できるプール (SQL プールまたは Spark プール) をワークスペース内に作成することができます。 これは、Azure Synapse Analytics の共有メタデータを使用して行うことができます。これにより、さまざまなエンジンがデータベースとテーブルを共有できるようになります。

たとえば、共有の Hive 互換のメタデータ システムにより、データ レイク内のファイルで定義されたテーブルを、Spark または Hive でシームレスに使用できます。 SQL と Spark を使用して、データ レイクに保存されている Parquet、CSV、TSV、JSON ファイルを直接探索して分析できます。 また、SQL データベースと Spark データベース間でやり取りされるデータの高速かつスケーラブルな読み込みとアンロードも行われます。

この機能により、最新のデータ ウェアハウス ワークロード パターンが可能になり、ワークスペース SQL エンジンは Spark で作成されたデータベースとテーブルにアクセスできるようになります。 また、SQL エンジンは、他のエンジンと共有されていない独自のオブジェクトを作成することもできます。

Azure Synapse Analytics ワークスペースは、これらのリソースに関する情報を表示し、Azure portal 内からそれらのリソースに接続できる一元的な場所です。 初期セットアップは次のようになります。

View the Azure Synapse Analytics Workspace

サーバーレス SQL オンデマンド エンドポイントと Azure Data Lake Storage Gen2 (ADLS Gen2) アカウントを使用して、データ レイクにファイルをアップロードし、サーバーレス SQL オンデマンド サービスを使用してファイルを準備および探索することにより、製品の価値をすぐに実感できます。

さらに、サービスの一部の側面は Azure portal で管理できますが、ベスト プラクティスとして、Azure Synapse Studio に接続して、そこからアクティビティを実行することをお勧めします。