跨環境和工作區重複使用數據流的最佳做法

本文討論有效且有效率地重複使用數據流的最佳做法集合。 閱讀本文,以避免設計陷阱和潛在的效能問題,因為您開發數據流以供重複使用。

分隔數據轉換數據流與預備/擷取數據流

如果數據流執行所有動作,則很難在其他數據流或其他用途中重複使用其數據表。 要重複使用的最佳數據流是只執行幾個動作的數據流。 建立專門處理一項特定工作的數據流,是重複使用它們的最佳方式之一。 如果您有一組作為暫存數據流的 數據流,其唯一的動作是依原始來源系統擷取數據。 這些數據流可以在多個其他數據流中重複使用。

如果您有資料轉換數據流,您可以將數據流分割成執行一般轉換的數據流。 每個數據流只能執行一些動作。 每個數據流的這些動作可確保該資料流的輸出可供其他數據流重複使用。

Dataflow doing only a few actions.

將數據從數據源擷取到暫存數據流的影像,其中數據表會儲存在Dataverse或 Azure Data Lake 記憶體中。 然後,數據會移至轉換數據流,其中數據會轉換並轉換成數據倉儲結構。 最後,數據會載入Power BI語意模型。

使用多個工作區

每個工作區(或環境)僅適用於該工作區的成員。 如果您在一個工作區中建置所有數據流,您會將數據流的重複使用降至最低。 您可以擁有處理全公司數據表之數據流的一些泛型工作區。 您也可以有一些工作區,讓數據流跨多個部門處理數據表。 您也可以有一些工作區,讓數據流只用於特定部門。

Image showing the separate workspaces.

在工作區上設定正確的存取層級

若要授與其他工作區中數據流的存取權,以使用工作區中數據流的輸出,您只需要在工作區中提供檢視存取權即可。 若要深入瞭解 Power BI 工作區中的其他角色,請移至 新工作區中的角色。

Screenshot showing how to access to the Power BI workspace.

Power BI 中數據流上的背書

租用戶組織中可能會建立許多數據流,而且使用者很難知道哪一個數據流最可靠。 數據流的作者,或具有編輯存取權的使用者,可以在三個層級背書數據流:沒有簽署、升級或認證。

這些簽署層級可協助使用者更容易且更快速地尋找可靠的數據流。 具有較高簽署層級的數據流會先出現。 Power BI 系統管理員可以將數據流認可至認證層級的能力給其他人。 詳細資訊: 簽署 - 推廣及認證 Power BI 內容

Screenshot of the Power Query Navigator showing the promoted and certified endorsement labels on specific dataflows.

在多個數據流中分隔數據表

您可以在一個資料流中有多個資料表。 您可能會在多個數據流中分割數據表的原因之一,就是本文稍早所學到的關於分隔數據擷取和數據轉換數據流的其中一個原因。 在多個數據流中擁有數據表的另一個好理由是當您想要與其他數據表不同的重新整理排程時。

在下圖所示的範例中,銷售數據表必須每隔四小時重新整理一次。 日期數據表只需要每天重新整理一次,才能更新目前的日期記錄。 而產品對應數據表只需要每周重新整理一次。 如果您在一個數據流中擁有所有這些數據表,則只有一個全部的重新整理選項。 不過,如果您將這些數據表分割成多個數據流,您可以個別排程每個數據流的重新整理。

Image showing dataflows with different schedules for the refresh.

數據流數據表的良好數據表候選專案

當您在桌面工具中使用 Power Query 開發解決方案時,您可能會問自己:這些數據表中哪一個是適合移至數據流的候選專案? 要移至數據流的最佳數據表是需要在多個解決方案或多個環境或服務中使用的數據表。 例如,下圖中顯示的 Date 數據表必須用於兩個不同的 Power BI 檔案中。 您可以不要複製每個檔案中的數據表,而是將數據流中的數據表建置為數據表,並在那些 Power BI 檔案中重複使用該數據表。

Image showing a shared table used in a dataflow.