Lake データベース

2025-04-11

Azure Synapse Analytics の Lake データベースを使用すると、お客様は、データベースのデザイン、格納されているデータに関するメタ情報、データを格納する方法と場所を記述できる可能性をまとめることができます。レイクデータベースでは、データがどのように構造化されているかを理解するのが難しいという今日のデータレイクの課題に対処しています。

Lake database の概要

データベースデザイナー

Synapse Studio の新しいデータベースデザイナーを使用すると、自分の Lake データベース用にデータモデルを作成し、さらに情報を追加することができます。どのエンティティと属性も、モデルに関する詳細情報を提供するために記述することができます。これには、エンティティだけでなく、リレーションシップも含まれます。特に、関係をモデル化できないことは、データレイクのインタラクションにとっての課題でした。この課題は、データベースで使用できるがレイクでは利用できない手段を提供する統合されたデザイナーによって解決されました。また、説明と場合によってはデモ値をモデルに追加する機能により、今後この機能を操作するユーザーは、必要な場所に情報を格納してデータについて理解を深めることもできます。

注記

レイクデータベース内のメタデータの最大サイズは 10 GB です。サイズが 10 GB を超えるモデルを公開または更新しようとすると失敗します。この問題を解決するには、テーブルと列を削除してモデルのサイズを小さくします。この制限を回避するには、大規模なモデルを複数のレイクデータベースに分割することを検討してください。

データストレージ

Lake データベースでは、Azure ストレージアカウントのデータレイクを使用して、データベースのデータを格納します。データは、Parquet、Delta、または CSV 形式に格納することができ、さまざまな設定を使用してストレージを最適化できます。各 Lake データベースは、リンクサービスを使用して、ルートデータフォルダーの場所を定義します。エンティティごとに、既定では、データレイク上のこのデータベースフォルダー内に個別のフォルダーが作成されます。既定では、Lake データベース内のすべてのテーブルで同じ形式が使用されますが、データの形式と場所は、要求された場合、エンティティごとに変更できます。

注記

Lake データベースを公開しても、Spark または SQL でデータのクエリを実行するために必要な基礎の構造またはスキーマは作成されません。公開後に、パイプラインを使って Lake データベースにデータを読み込み、クエリを開始してください。

現時点では、レイクデータベースの Delta 形式のサポートは、Synapse Studio ではサポートされていません。

ストレージと Synapse の間のレイクデータベースオブジェクトの同期は一方向です。 Synapse Studio のデータベースデザイナーを使用し、レイクデータベースオブジェクトの作成またはスキーマ変更を必ず実行してください。このような変更を代わりに Spark から行うか、ストレージで直接行う場合、レイクデータベースの定義が同期されなくなります。同期されないと、データベースデザイナーに古いレイクデータベースの定義が表示されることがあります。レイクデータベースの再び同期させるには、このような変更をデータベースデザイナーで複製し、発行する必要があります。

データベースコンピューティング

Lake データベースは、Synapse SQL サーバーレス SQL プールと Apache Spark で公開されており、ストレージをコンピューティングから切り離す機能をユーザーに提供しています。レイクデータベースに関連付けられているメタデータを使用すると、さまざまなコンピューティングエンジンでは容易に、統合されたエクスペリエンスを提供するだけでなく、本来データレイクでサポートされていなかった追加情報 (リレーションシップなど) も使用できるようになります。

次のリンクを使用して、データベースデザイナーの機能の詳細を引き続き確認します。

次の方法で共有

Lake データベース

データベース デザイナー

データ ストレージ

データベース コンピューティング

関連するコンテンツ

フィードバック

その他のリソース

データベースデザイナー

データストレージ

データベースコンピューティング