Lakehouse 教學課程:建立 Lakehouse、內嵌範例數據,以及建置報表
在本教學課程中,您會建置 Lakehouse、內嵌範例數據到 Delta 數據表、視需要套用轉換,然後建立報表。
必要條件
- 建立 Lakehouse 之前,您必須先 建立 Fabric 工作區。
- 在內嵌 CSV 檔案之前,您必須先設定 OneDrive。 如果您尚未設定 OneDrive,請註冊 Microsoft 365 免費試用: 免費試用 - 試用一個月Microsoft 365。
建立 Lakehouse
在 Power BI 中,從左側功能表中選取 [工作區 ]。
若要開啟您的工作區,請在位於頂端的搜尋文字框中輸入其名稱,然後從搜尋結果中選取它。
從左下方的切換器中,選取 [資料工程師 ing]。
在 資料工程師 畫面中,選取 [Lakehouse] 以建立 Lakehouse。
在 [新增湖屋] 對話框中,於 [名稱] 字段中輸入 wwilakehouse。
選取 [建立 ] 以建立並開啟新的 Lakehouse。
內嵌範例資料
注意
如果您尚未設定 OneDrive,請註冊 Microsoft 365 免費試用: 免費試用 - 試用一個月Microsoft 365。
從網狀架構範例存放庫下載dimension_customer.csv檔案。
在 [首頁] 索引標籤的 [取得 Lakehouse 中的數據] 底下,您會看到將數據載入 Lakehouse 的選項。 選取 [新增數據流 Gen2]。
在新的數據流畫面上,選取 [從文字/CSV 檔案匯入]。
在 [ 連接到數據源] 畫面上 ,選取 [上傳檔案 ] 單選按鈕。 拖放您在步驟 1 中下載的dimension_customer.csv檔案。 上傳檔案之後,請選取 [ 下一步]。
從 [ 預覽檔案數據] 頁面預覽數據,然後選取 [建立] 繼續並返回數據流畫布。
在 [ 查詢設定 ] 窗格中,將 [ 名稱 ] 欄位更新為 dimension_customer。
注意
網狀架構預設會在數據表名稱結尾新增空格和數位。 數據表名稱必須是小寫,且不得包含空格。 請適當地重新命名它,並從數據表名稱中移除任何空格。
在本教學課程中,您會將客戶數據與 Lakehouse 建立關聯。 如果您有其他想要與 Lakehouse 產生關聯的數據項,您可以新增這些專案:
從功能表項中,選取 [新增數據目的地 ],然後選取 [Lakehouse]。 從 [ 連線到數據目的地 ] 畫面,視需要登入您的帳戶,然後選取 [ 下一步]。
流覽至 工作區中的 wwilakehouse 。
如果dimension_customer數據表不存在,請選取 [新增數據表] 設定,然後輸入數據表名稱dimension_customer。 如果數據表已經存在,請選取 [現有數據表 ] 設定,然後從物件總管中的資料表清單中選擇 [dimension_customer ]。 選取 [下一步]。
在 [ 選擇目的地設定 ] 窗格中,選取 [取代 為 更新方法]。 選取 [ 儲存設定 ] 以返回數據流畫布。
從數據流畫布中,您可以輕鬆地根據業務需求來轉換數據。 為了簡單起見,我們在本教學課程中不會進行任何變更。 若要繼續,請選取 畫面右下方的 [發佈 ]。
數據流名稱旁的旋轉圓形表示正在項目檢視中發佈。 發佈完成時,請選取 ... 並選取 [ 屬性]。 將數據流重新命名為 Load Lakehouse 數據表 ,然後選取 [ 儲存]。
選取資料流名稱旁的 [ 立即 重新整理] 選項,以重新整理數據流。 此選項會執行數據流,並將數據從來源檔案移至 lakehouse 數據表。 進行中時,您會在項目檢視的 [重新整理] 資料行底下看到旋轉圓圈。
重新整理數據流之後,請在左側導覽列中選取新的 Lakehouse,以檢視 dimension_customer Delta 數據表。
選取數據表以預覽其數據。 您也可以使用 Lakehouse 的 SQL 分析端點,以 SQL 語句查詢數據。 從畫面右上方的 Lakehouse 下拉功能表中選取 [SQL 分析端點]。
選取dimension_customer數據表來預覽其數據,或選取 [新增 SQL 查詢] 來撰寫 SQL 語句。
下列範例查詢會根據 dimension_customer 數據表的 BuyingGroup 數據行來匯總數據列計數。 SQL 查詢檔案會自動儲存以供日後參考,您可以根據您的需求重新命名或刪除這些檔案。
若要執行文稿,請選取 腳本檔案頂端的 [執行 ] 圖示。
SELECT BuyingGroup, Count(*) AS Total FROM dimension_customer GROUP BY BuyingGroup
建置報表
先前所有 Lakehouse 數據表和檢視都會自動新增至語意模型。 在最近的更新中,對於新的 Lakehouse,您必須手動將數據表新增至語意模型。 開啟您的 Lakehouse 並切換至 SQL 分析端點 檢視。 從 [報告] 索引標籤中,選取 [管理預設語意模型],然後選取您要新增至語意模型的數據表。 在此情況下,請選取 dimension_customer 數據表。
若要確保語意模型中的數據表一律同步,請切換至 SQL 分析端點 檢視,然後開啟 Lakehouse 設定 窗格。 選取 [預設 Power BI 語意模型 ],然後開啟 [ 同步處理預設 Power BI 語意模型]。 如需詳細資訊,請參閱 預設Power BI語意模型。
新增數據表之後,Fabric 會建立與 Lakehouse 同名的語意模型。
您可以從語意模型窗格檢視所有資料表。 您可以選擇從頭開始建立報表、編頁報表,或讓Power BI 根據您的資料自動建立報表。 在本教學課程中,在 [探索此數據] 底下,選取 [自動建立報表]。 在下一個教學課程中,我們會從頭開始建立報表。
因為數據表是維度,而且其中沒有任何量值,所以 Power BI 會建立數據列計數的量值,並將其匯總到不同的數據行,並建立不同的圖表,如下圖所示。 您可以從頂端功能區選取 [儲存 ],以儲存此報表供未來使用。 您可以藉由包含或排除其他數據表或數據行,來變更此報表以符合您的需求。