高階商業智慧的效能取決於 Lakehouse 資料的準備與傳遞效率。 透過採用架構模式、套用語意結構並進行針對性優化,您可以降低查詢複雜度、提升儀表板響應性,並降低計算成本。
下表總結了建議的做法、預期的影響、相關文件及相關行動項目。 本內容主要針對設計、優化及維護 Lakehouse 分析工作負載的資料工程師、商業智慧開發者及儀表板作者。
資料準備
| 最佳做法 | Impact | Docs | 行動項目 |
|---|---|---|---|
| 採用勳章架構 | 加速將原始資料轉化為現成且可靠的資料產品,方便使用。 | 檢視並實作獎章圖層 | |
| 使用液體聚類 | 透過跳過檔案和資料來提升查詢效能。 | 將這些過濾模式套用到大型表格中 | |
| 使用受管理資料表 | Azure Databricks 會自動管理並優化儲存層及查詢效能。 | 建立管理資料表 | |
| 使用預測優化或手動優化表格 | 透過優化檔案大小與版面配置、刪除舊檔案及更新統計資料,提升查詢效能。 | 啟用生產資料表的相關功能,或排程定期優化作業,並在數據變更後進行資料表分析 | |
| 星型結構模式中的模型資料 | 讓資料更容易查詢和使用。 | 設計事實與尺寸表 | |
| 避免使用寬泛的資料型態和高基數欄位 | 優化資料模型大小與記憶體使用,並提升查詢效率。 | 回顧資料類型與基數 | |
| 宣告主鍵與外鍵(使用 RELY) | 透過消除不必要的連接與聚合來優化查詢。 | 定義事實表與維度表上的鍵 | |
| 使用自動產生欄位 | 減少查詢時計算數值的需求。 | 識別經常計算的欄位 | |
| 使用實體化檢視與持久化資料表 | 透過預先彙整資料來提升效能,針對最常見且資源密集的查詢。 | 為常見查詢建立彙整檢視 |