Microsoft Fabric Lakehouse を探索する

完了

レイクハウスはデータベースとして表示され、Delta 形式テーブルを使用して、データ レイクを基盤として構築されます。 レイクハウスは、リレーショナル データ ウェアハウスの SQL ベースの分析機能と、データ レイクの柔軟性とスケーラビリティを組み合わせたものです。 レイクハウスにすべてのデータ形式を格納し、さまざまな分析ツールやプログラミング言語で使用できます。 クラウドベースのソリューションとして、レイクハウスは自動的にスケーリングされ、高可用性とディザスター リカバリーを提供できます。

レイクハウスの図。データ レイクのフォルダー構造とデータ ウェアハウスのリレーショナル機能が表示されています。

レイクハウスには、次のような利点があります。

  • レイクハウスを使用すると、Spark エンジンと SQL エンジンを使用して大規模なデータを処理し、機械学習または予測モデリング分析をサポートできます。
  • レイクハウス データは、"スキーマ オン リード形式" で編成されます。これは定義済みのスキーマを使用するのではなく、自分で必要に応じてスキーマを定義することを意味します。
  • レイクハウスを使用すると、データの一貫性と整合性のための ACID (原子性、一貫性、分離性、持続性) トランザクションが Delta Lake 形式のテーブルを介してサポートされます。
  • レイクハウスは、データ エンジニア、データ サイエンティスト、データ アナリストがデータにアクセスして使用するための一元化された場所です。

レイクハウスは、データの一貫性が維持されるスケーラブルな分析ソリューションが必要な場合に最適なオプションです。 どのソリューションが最適かを判断するには、特定の要件を評価することが重要です。

Microsoft Fabric のレイクハウス

Microsoft Fabric では、Premium レベルのワークスペースにレイクハウスを作成できます。 レイクハウスを作成した後、ローカル ファイル、データベース、API を含め、さまざまなソースから任意の一般的な形式のデータを読み込むことができます。 Microsoft Fabric の Data Factory パイプラインまたはデータフロー (Gen2) を使用してデータ インジェストを自動化することもできます。 さらに、Azure Data Lake Store Gen2 やレイクハウス自体のストレージの外部にある Microsoft OneLake の場所など、外部ソース内のデータへの Fabric "ショートカット" を作成できます。 Lakehouse Explorer を使用すると、ファイル、フォルダー、ショートカット、テーブルを参照し、Fabric プラットフォーム内でその内容を表示できます。

Lakehouse にデータを取り込んだ後、ノートブックまたはデータフロー (Gen2) を使用してデータを探索および変換できます。

注意

Power Query は、従来のプログラミングの代替として変換を視覚的に表現する、Excel または Power BI を使用しているデータ アナリストにとって使い慣れたツールであり、データフロー (Gen2) はこれに基づいています。

Data Factory パイプラインを使用して Spark、データフロー、およびその他のアクティビティを調整することができ、複雑なデータ変換プロセスを実装できるようになります。

データ変換後、SQL を使用してクエリを実行することや、機械学習モデルのトレーニング、リアルタイム インテリジェンスの実行、Power BI でのレポート開発に使用することができます。

データ分類やアクセス制御などのデータ ガバナンス ポリシーをレイクハウスに適用することもできます。