簡介
Apache Spark 是用於大規模資料處理和分析的開放原始碼架構。 Apache Spark 已整合至 Microsoft Fabric,以提供巨量資料平台進行分析。
網狀架構 Spark 叢集提供功能強大的記憶體內部分散式架構,可用於大規模資料處理。 在 Microsoft Fabric 中,Spark 可以與其他分析服務搭配使用,例如 Lakehouses、筆記本和資料管線。
在本課程模組中,您會探索如何使用 Spark 搭配筆記本,在網狀架構湖存放庫中內嵌、處理和分析資料。