サーバーレス SQL プールで Apache Spark for Azure Synapse 外部テーブル定義を同期する

Tip

Microsoft Fabric Data Warehouse は、将来のアーキテクチャ、組み込みの AI、および新機能を備えた、Data Lake 基盤上のエンタープライズ規模のリレーショナルウェアハウスです。データウェアハウスを初めて使用する場合は、Fabric Data Warehouseから始めます。既存の dedicated SQL プールワークロードは、Fabric にアップグレードして、データサイエンス、リアルタイム分析、レポートの新機能にアクセスできます。

Fabric無料試用版を開始します。
Fabric Data Warehouse 用マイグレーションアシスタント

サーバーレス SQL プールでは、Apache Spark からメタデータを自動的に同期できます。サーバーレスの Apache Spark プールに存在するデータベースごとに、サーバーレス SQL プールデータベースが作成されます。

Parquet または CSV に基づいて Azure Storage に配置された Spark 外部テーブルごとに、サーバーレス SQL プールデータベースに外部テーブルが作成されます。そのため、Spark プールをシャットダウンしても、サーバーレス SQL プールから Spark 外部テーブルに対してクエリを実行できます。

Spark でテーブルがパーティション分割されている場合、ストレージ内のファイルはフォルダー別に整理されます。サーバーレス SQL プールはパーティションメタデータを使用し、クエリに関連するフォルダーとファイルのみを対象とします。

メタデータ同期は、Azure Synapse ワークスペースにプロビジョニングされたサーバーレス Apache Spark プールごとに自動的に構成されます。 Spark 外部テーブルのクエリをすぐに開始できます。

Azure Storage にある各 Spark Parquet または CSV 外部テーブルは、サーバーレス SQL プールデータベースに対応する dbo スキーマ内の外部テーブルで表されます。

Spark 外部テーブルクエリの場合は、外部 [spark_table] を対象とするクエリを実行します。次の例を実行する前に、ファイルが配置されているストレージアカウントに正しいアクセス権があることを確認してください。

SELECT * FROM [db].dbo.[spark_table]

Apache Spark データ型から SQL データ型へのマッピング

Apache Spark データ型と SQL データ型のマッピングの詳細については、 Azure Synapse Analytics 共有メタデータテーブルに関するページを参照してください。

次のステップ

ストレージアクセス制御の詳細については、ストレージアクセス制御に関する記事に進んでください。

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-05-03

サーバーレス SQL プールで Apache Spark for Azure Synapse 外部テーブル定義を同期する

Apache Spark データ型から SQL データ型へのマッピング

次のステップ

フィードバック

その他のリソース