本教學概述如何使用具體化湖視圖來實施獎章架構的步驟和注意事項。 在本教學課程結束時,您將瞭解具體化湖檢視的主要特性和功能,並能夠建立自動化的數據轉換工作流程。 本教學課程的目的不是參考架構、完整的特性和功能清單,或特定最佳做法的建議。
先決條件
作為本教學課程的必要條件,請完成下列步驟:
- 登入您的Power BI 帳戶,或如果您還沒有帳戶,請註冊免費試用。
- 在您的租用戶中啟用 Microsoft Fabric 鏡像。 選取畫面左下方的預設Power BI圖示,然後選取 [網狀架構]。
- 建立啟用Microsoft Fabric的工作區。
- 從 [工作區] 索引標籤中選取工作區,然後選取 [+ 新增專案],然後選擇 [管線]。 提供管線的名稱,然後選取 [ 建立]。
- 建立已啟用架構的 Lakehouse 。 將它命名為 SalesLakehouse ,並將範例數據檔載入 Lakehouse。 如需詳細資訊,請參閱 Lakehouse 教學課程。
案例概觀
在本教學課程中,您將採用一個虛構零售組織 Contoso 的範例,該組織使用 Medallion 架構進行數據分析,以獲得對其零售銷售運營有實際行動價值的深入洞察。 它旨在簡化分析過程,藉由將數據組織成三個層級,從而對業務績效提供更深入的見解,包括銅級(原始數據)、銀級(清理和豐富數據)及金級(匯總和分析的數據)。
下圖代表 SalesLakehouse 中每一層獎章架構中的不同實體:
實體
訂單:此實體包含每個客戶訂單的詳細數據,例如訂單日期、出貨詳細數據、產品類別和子類別。 深入解析可用來優化出貨策略、識別熱門產品類別,以及改善訂單管理。
銷售:藉由分析銷售數據,Contoso 可以評估主要計量,例如總營收、獲利率、訂單優先順序和折扣。 這些因素之間的相互關聯可讓您更清楚地瞭解客戶購買行為,以及折扣策略的效率。
位置:這會擷取銷售和訂單的地理維度,包括城市、州、區域和客戶區段。 其可協助 Contoso 找出高效能的區域、解決低效能區域,以及針對特定客戶區段的個人化策略。
代理程式效能:透過代理程式管理交易、其傭金和銷售數據的詳細數據,Contoso 可以評估個別的代理程式效能、激勵最佳表現者,以及設計有效的傭金結構。
代理程式傭金:納入傭金數據可確保透明度,並提供更好的成本管理。 瞭解傭金率與代理程式效能之間的相互關聯有助於精簡獎勵系統。
範例數據集
Contoso 會以 CSV 格式在 ADLS Gen2 內維護其零售作業原始數據。 我們利用這些數據來建立青銅層,然後使用青銅層來建立具體化湖視圖,形成獎牌建築的銀層和金層。 首先,從 網狀架構範例存放庫下載範例 CSV 檔案。
建立管線
高階步驟如下:
- 銅層:將原始數據以 CSV 檔案導入到資料湖倉。
- 銀層:使用物化資料湖視圖清洗數據。
- 黃金層:使用具體化湖泊檢視來匯整分析和報告所需的數據。
建立銷售分析獎章架構的銅層
將不同的實體對應的 CSV 檔案從下載的資料匯入 Lakehouse。 若要這樣做,請流覽至您的 Lakehouse,並將下載的數據上傳至 Lakehouse 的 [ 檔案 ] 區段。 它會建立名為 tutorial 的資料夾。
接下來,從 [ 數據表 ] 區段建立它的快捷方式。 選取[...] 於數據表區段旁,然後選取新增架構捷徑,再選取Microsoft OneLake。 從數據源類型選擇 SalesLakehouse 。 展開 [ 檔案] 區段,然後選擇 教學課程 資料夾,然後選取 [ 建立]。 您也可以使用其他替代 選項將資料放入 Lakehouse。
從 [ 數據表] 區段,將 tutorial 資料夾重新命名為 bronze。
建立獎章架構的銀層和金層
將下載的筆記本檔案上傳至您的工作區。
從「Lakehouse」開啟筆記本。 如需更多資訊,請參閱 使用筆記本探索湖倉數據。
使用 Spark SQL 執行筆記本的所有儲存格,以使用資料品質約束來建立具體化湖泊檢視。 在成功執行所有儲存格後,刷新 SalesLakehouse 來源,以查看新創建的銀和金架構的具體化湖檢視。
排程流程
建立銀層和金層的具體化湖檢視之後,流覽至 Lakehouse,然後選取 [受控具體化湖視圖 ] 以查看譜系檢視。 它會根據相依性自動產生,每個相依具體化湖檢視都會形成譜系的節點。
從導覽功能區選取 [ 排程 ]。 開啟重新整理功能並設定排程。
監視與疑難排解
下拉功能表會列出目前和過去的執行記錄。
藉由選取任何執行,您可以在右側面板中找到具體化湖視圖的詳細資訊。 底部活動面板提供節點執行狀態的高階概觀。
選取歷程中的任何節點,以查看節點執行詳細數據,並連結至詳細記錄。 如果節點狀態為 [失敗],則也會顯示錯誤訊息。
選取 [詳細記錄] 連結會將您重新導向至 [ 監視中樞 ],您可以從中存取 Spark 錯誤記錄,以進行進一步的疑難解答。
選取具體化湖檢視頁面功能區上的 [數據質量報告 ] 按鈕,以建立或檢視自動產生的數據質量報告。