共用方式為


為 Direct Lake 建立湖倉

本文說明如何建立 lakehouse、在 Lakehouse 中建立 Delta 數據表,然後在 Microsoft Fabric 工作區中建立 lakehouse 的基本語意模型。

開始建立 Direct Lake 的湖房之前,請務必閱讀 Direct Lake 概觀

建立湖倉

  1. 在您的 Microsoft Fabric 工作區中,選取 [ 新增>更多選項],然後在 [資料工程] 中,選取 [ Lakehouse] 磚。

    顯示資料工程中 Lakehouse 磁磚的螢幕截圖。

  2. 在 [新增 Lakehouse] 對話方塊中,輸入名稱,然後選擇 [建立]。 名稱只能包含英文字母、數字和下劃線符號。

    顯示 [新增湖倉] 對話框的截圖。

  3. 確認新的 Lakehouse 已建立並成功開啟。

    在工作區中建立的 Lakehouse 螢幕擷取畫面。

在湖倉中建置 Delta 資料表

建立新的 Lakehouse 之後,您必須建立至少一個 Delta 數據表,讓 Direct Lake 可以存取某些數據。 Direct Lake 可以讀取 parquet 格式的檔案,但為了達到最佳效能,最好使用 VORDER 壓縮方法來壓縮數據。 VORDER 會使用 Power BI 引擎的原生壓縮演算法來壓縮數據。 如此一來,引擎就可以儘快將數據載入記憶體。

有多種方法可以將資料載入湖倉,包括管道和腳本。 下列步驟將使用 PySpark,根據 Azure 開放資料集,將 Delta 資料表新增至湖倉系統:

  1. 在新建立的 Lakehouse 中,選取 [ 開啟筆記本],然後選取 [新增筆記本]。

    顯示新筆記本命令的螢幕快照。

  2. 將下列代碼段複製並貼到第一個程式代碼數據格中,讓SPARK存取開啟的模型,然後按下 Shift + Enter 以執行程式代碼。

    # Azure storage access info
    blob_account_name = "azureopendatastorage"
    blob_container_name = "holidaydatacontainer"
    blob_relative_path = "Processed"
    blob_sas_token = r""
    
    # Allow SPARK to read from Blob remotely
    wasbs_path = 'wasbs://%s@%s.blob.core.windows.net/%s' % (blob_container_name, blob_account_name, blob_relative_path)
    spark.conf.set(
      'fs.azure.sas.%s.%s.blob.core.windows.net' % (blob_container_name, blob_account_name),
      blob_sas_token)
    print('Remote blob path: ' + wasbs_path)
    
    
  3. 確認程式代碼已成功輸出遠端 Blob 路徑。

    顯示遠端 Blob 路徑輸出的螢幕快照。

  4. 將下列程式碼複製並貼到下一個儲存格中,然後按 Shift + Enter

    # Read Parquet file into a DataFrame.
    df = spark.read.parquet(wasbs_path)
    print(df.printSchema())
    
    
  5. 確認程式代碼已成功輸出 DataFrame 架構。

    顯示數據框架架構輸出的螢幕快照。

  6. 將下列幾行複製並貼到下一個儲存格中,然後按 Shift + Enter。 第一個指令會啟用 VORDER 壓縮方法,而下一個指令會將 DataFrame 儲存為 Lakehouse 中的 Delta 數據表。

    # Save as delta table 
    spark.conf.set("spark.sql.parquet.vorder.enabled", "true")
    df.write.format("delta").saveAsTable("holidays")
    
    
  7. 確認所有SPARK作業都順利完成。 展開SPARK作業清單以檢視更多詳細資料。

    顯示SPARK作業展開清單的螢幕快照。

  8. 若要確認數據表已成功建立,請在左上方區域中,選取 數據表旁的省略號 (...),然後選取 [重新整理],然後展開 [數據表] 節點。

    螢幕擷取畫面顯示 [資料表] 節點附近的 [重新整理] 命令。

  9. 使用與上述方法或其他支援的方法相同,為您想要分析的數據新增更多 Delta 數據表。

為您的湖庫建立基本的 Direct Lake 模型

  1. 在您的 Lakehouse 中,選取 [ 新增語意模型],然後在對話方塊中選取要包含的資料表。

    建立新模型的對話框螢幕快照。

  2. 請選取 [確認] 以產生 Direct Lake 模型。 模型會根據您的 Lakehouse 名稱自動儲存在工作區中,然後模型會自行開啟。

    顯示Power BI 中開啟模型的螢幕快照。

  3. 選取 [開啟數據模型 開啟 Web 模型體驗,您可以在其中新增數據表關聯性和 DAX 量值。

    顯示Power BI中Web模型化的螢幕快照。

當您完成新增關聯性和 DAX 量值之後,您就可以建立報表、建置複合模型,並以與任何其他模型相同的方式透過 XMLA 端點查詢模型。