內部部署數據閘道大小調整

本文的目標是需要安裝和管理內部部署數據閘道Power BI 系統管理員。

每當 Power BI 必須存取無法透過因特網直接存取的數據時,就需要閘道。 它可以安裝在內部部署伺服器,或 VM 裝載的基礎結構即服務 (IaaS) 上。

閘道工作負載

內部部署數據閘道支援兩個工作負載。 請務必先了解這些工作負載,再討論閘道大小調整和建議。

快取的數據工作負載

取的數據 工作負載會擷取並轉換源數據,以載入 Power BI 語意模型(先前稱為數據集)。 它會在三個步驟中執行此動作:

  1. 連線:閘道會連線到源數據。
  2. 數據擷取和轉換:擷取數據,並在必要時轉換。 可能的話,Power Query 混搭引擎會將轉換步驟推送至數據源,也就是所謂的 查詢折疊。 如果不可能,則必須由閘道完成轉換。 在此情況下,閘道會耗用更多CPU和記憶體資源。
  3. 傳輸:數據會傳輸至 Power BI 服務—可靠且快速的因特網連線很重要,尤其是對於大型數據量而言。

快取資料的圖表,顯示連線到內部部署來源的內部部署數據閘道。

即時 連線 和 DirectQuery 工作負載

Live 連線 ion 和 DirectQuery 工作負載大多在傳遞模式中運作。 Power BI 服務 會傳送查詢,而網關會以查詢結果回應。 一般而言,查詢結果的大小很小。

此工作負載需要 CPU 資源來路由查詢和查詢結果。 CPU 的需求通常比快取數據工作負載所需的CPU需求要少得多,特別是當需要轉換數據以進行快取時。

可靠、快速且一致的連線能力對於確保報表用戶有回應式體驗非常重要。

顯示連線到內部部署來源的內部部署數據閘道的 Live 連線 ion 和 DirectQuery 圖表。

重設大小考慮

判斷閘道電腦的正確重設大小取決於下列變數:

  • 針對快取資料工作負載:
    • 並行語意模型重新整理的數目
    • 資料來源的類型(關係資料庫、分析資料庫、資料摘要或檔案)
    • 要從數據源擷取的數據量
    • Power Query 混搭引擎需要完成的任何轉換
    • 要傳送至 Power BI 服務 的數據量
  • 針對 Live 連線 ion 和 DirectQuery 工作負載:
    • 並行報表用戶的數目
    • 報表頁面上的視覺效果數目(每個視覺效果至少傳送一個查詢)
    • Power BI 儀錶板查詢快取更新的頻率
    • 使用 自動頁面重新 整理功能實時報表的數目
    • 語意模型是否強制執行 資料列層級安全性 (RLS)

一般而言,Live 連線 ion 和 DirectQuery 工作負載需要足夠的 CPU,而快取數據工作負載則需要更多 CPU 和記憶體。 這兩個工作負載都取決於與 Power BI 服務 和數據源的良好連線。

注意

Power BI 容量會限制模型重新整理平行處理原則,以及 Live 連線 ion 和 DirectQuery 輸送量。 沒有任何可調整閘道的大小,以提供超過 Power BI 服務 支援的內容。 進階版 SKU 的限制不同(和同等大小的 A SKU)。 如需詳細資訊,請參閱 Microsoft Fabric 容量授權什麼是 Power BI 進階版?(容量節點)

重要

本文有時是指 Power BI 進階版 或其容量訂用帳戶 (P SKU)。 請注意,Microsoft 目前正在合併購買選項,並淘汰每個容量 SKU 的 Power BI 進階版。 新的和現有的客戶應該考慮改為購買網狀架構容量訂用帳戶(F SKU)。

如需詳細資訊,請參閱 Power BI 進階版 授權Power BI 進階版 常見問題的重要更新。

建議

閘道大小調整建議取決於許多變數。 在本節中,我們會提供您可以考慮的一般建議。

初始重設大小

很難準確估計正確的大小。 建議您從至少 8 個 CPU 核心、8 GB RAM 和多個 Gb 網路配接器的電腦開始。 接著,您可以記錄 CPU 和記憶體系統計數器來測量一般閘道工作負載。 如需詳細資訊,請參閱 監視及優化內部部署數據閘道效能

連線性

規劃 Power BI 服務 與閘道之間最佳的連線能力,以及閘道和數據源。

  • 努力追求可靠性、快速速度和低、一致的延遲。
  • 消除閘道與數據源之間的機器躍點或減少。
  • 拿掉防火牆 Proxy 層強加的任何網路節流。 如需 Power BI 端點的詳細資訊,請參閱 將 Power BI URL 新增至您的允許清單
  • 設定 Azure ExpressRoute 以建立 Power BI 的私人受控連線。
  • 針對 Azure VM 中的數據源,請確定 VM 會與 Power BI 服務 共置。
  • 針對涉及動態 RLS 的 SQL Server Analysis Services (SSAS) 即時 連線 工作負載,請確定閘道電腦與 內部部署的 Active Directory 之間的良好連線能力。

叢集

您可以為大規模部署建立具有多個叢集成員的閘道, 叢集可避免單一失敗點,而且可以在閘道之間負載平衡流量。 您可以:

  • 在叢集中安裝一或多個閘道。
  • 將工作負載隔離至獨立閘道,或閘道伺服器的叢集。

如需詳細資訊,請參閱 管理內部部署數據閘道高可用性叢集和負載平衡

語意模型設計和設定

語意模型設計及其設定可能會影響閘道工作負載。 若要減少閘道工作負載,您可以考慮下列動作。

針對匯入語意模型:

  • 設定較不頻繁的數據重新整理。
  • 設定累加式重新整理,以將要傳輸的數據量降到最低。
  • 盡可能確保 進行查詢折疊
  • 特別是對於大型數據磁碟區或低延遲結果的需求,請將設計轉換成 DirectQuery 或 複合 模型。

針對 DirectQuery 語意模型:

  • 優化數據源、模型和報表設計—如需詳細資訊,請參閱 Power BI Desktop 中的 DirectQuery 模型指引。
  • 建立 匯總 以快取較高層級的結果,以減少 DirectQuery 要求的數目。
  • 在報表設計和容量設定中,限制 自動頁面重新 整理間隔。
  • 特別是強制執行動態 RLS 時,請限制儀錶板快取更新頻率。
  • 特別是針對較小的數據磁碟區或非揮發性數據,請將設計轉換成匯入或 複合 模型。

針對 Live 連線 ion 語意模型:

  • 特別是強制執行動態 RLS 時,請限制儀錶板快取更新頻率。

如需本文的詳細資訊,請參閱下列資源: