簡介

已完成

Linux 基礎 Delta Lake 是 Spark 的開放原始碼儲存層,可針對批次和串流資料啟用關聯式資料庫功能。 藉由使用 Delta Lake,您可以在 Spark 中實作「資料湖存放庫」架構,以支援 SQL 型的資料操作語意,並支援強制執行交易和結構描述。 其實作結果是建立一個分析資料存放區,可提供關聯式資料庫系統的許多優點,並具備資料湖中資料檔案儲存體的彈性。

在本課程模組中,您將了解如何:

  • 描述 Delta Lake 的核心特性和功能。
  • 在 Azure Databricks 中建立和使用 Delta Lake 資料表。
  • 建立 Delta Lake 資料的 Spark 目錄資料表。
  • 使用 Delta Lake 資料表來處理串流資料。

注意

Azure Databricks 叢集中可用的 Delta Lake 版本取決於所使用的 Databricks Runtime 版本。 本課程模組中的資訊反映的是與 Databricks Runtime 14.3 版中 Spark 3.5.0 一起安裝的 Delta Lake 3.x 版。