レイク データベースを使用する

完了

レイク データベースを作成したら、テーブル スキーマに一致するデータ ファイルをデータ レイク内の適切なフォルダーに格納し、SQL を使用してクエリを実行できます。

サーバーレス SQL プールの使用

サーバーレス SQL プールを使用して、SQL スクリプト内のレイク データベースに対してクエリを実行できます。

たとえば、 RetailDB という名前のレイク データベースに Customer テーブルが含まれているとします。 次のような標準の SELECT ステートメントを使用してクエリを実行できます。

USE RetailDB;
GO

SELECT CustomerID, FirstName, LastName
FROM Customer
ORDER BY LastName;

OPENROWSET 関数を使用したり、基になるファイル ストレージからデータにアクセスするために追加のコードを含めたりする必要はありません。 サーバーレス SQL プールは、ファイルへのマッピングを自動的に処理します。

Apache Spark プールの使用

サーバーレス SQL プールを使用するだけでなく、Apache Spark プールで Spark SQL を使用してレイク データベース テーブルを操作することもできます。

たとえば、次のコードを使用して、 Customer テーブルに 新しい顧客レコードを挿入できます。

%%sql
INSERT INTO `RetailDB`.`Customer` VALUES (123, 'John', 'Yang')

その後、次のコードを使用してテーブルのクエリを実行できます。

%%sql
SELECT * FROM `RetailDB`.`Customer` WHERE CustomerID = 123