內部部署數據閘道大小調整
本文的目標是需要安裝和管理內部部署數據閘道的 Power BI 系統管理員。
每當 Power BI 必須存取無法透過因特網直接存取的數據時,就需要閘道。 它可以安裝在內部部署伺服器,或 VM 裝載的基礎結構即服務 (IaaS) 上。
閘道工作負載
內部部署數據閘道支援兩個工作負載。 請務必先了解這些工作負載,再討論閘道大小調整和建議。
快取的數據工作負載
快 取的數據 工作負載會擷取並轉換源數據,以載入 Power BI 語意模型(先前稱為數據集)。 它會在三個步驟中執行此動作:
- 連線:閘道會連線到源數據。
- 數據擷取和轉換:擷取數據,並在必要時轉換。 可能的話,Power Query 混搭引擎會將轉換步驟推送至數據源,也就是所謂的 查詢折疊。 如果不可能,則必須由閘道完成轉換。 在此情況下,閘道會耗用更多CPU和記憶體資源。
- 傳輸:數據會傳輸至 Power BI 服務—可靠且快速的因特網連線很重要,尤其是對於大型數據量而言。
即時 連線 和 DirectQuery 工作負載
Live 連線 ion 和 DirectQuery 工作負載大多在傳遞模式中運作。 Power BI 服務 會傳送查詢,而網關會以查詢結果回應。 一般而言,查詢結果的大小很小。
- 如需 Live 連線 ion 的詳細資訊,請參閱 Power BI 服務 中的語意模型(外部裝載的模型)。
- 如需 DirectQuery 的詳細資訊,請參閱 Power BI 服務 中的語意模型模式(DirectQuery 模式)。
此工作負載需要 CPU 資源來路由查詢和查詢結果。 CPU 的需求通常比快取數據工作負載所需的CPU需求要少得多,特別是當需要轉換數據以進行快取時。
可靠、快速且一致的連線能力對於確保報表用戶有回應式體驗非常重要。
重設大小考慮
判斷閘道電腦的正確重設大小取決於下列變數:
- 針對快取資料工作負載:
- 並行語意模型重新整理的數目
- 資料來源的類型(關係資料庫、分析資料庫、資料摘要或檔案)
- 要從數據源擷取的數據量
- Power Query 混搭引擎需要完成的任何轉換
- 要傳送至 Power BI 服務 的數據量
- 針對 Live 連線 ion 和 DirectQuery 工作負載:
- 並行報表用戶的數目
- 報表頁面上的視覺效果數目(每個視覺效果至少傳送一個查詢)
- Power BI 儀錶板查詢快取更新的頻率
- 使用 自動頁面重新 整理功能實時報表的數目
- 語意模型是否強制執行 資料列層級安全性 (RLS)
一般而言,Live 連線 ion 和 DirectQuery 工作負載需要足夠的 CPU,而快取數據工作負載則需要更多 CPU 和記憶體。 這兩個工作負載都取決於與 Power BI 服務 和數據源的良好連線。
注意
Power BI 容量會限制模型重新整理平行處理原則,以及 Live 連線 ion 和 DirectQuery 輸送量。 沒有任何可調整閘道的大小,以提供超過 Power BI 服務 支援的內容。 進階版 SKU 的限制不同(和同等大小的 A SKU)。 如需詳細資訊,請參閱 Microsoft Fabric 容量授權和什麼是 Power BI 進階版?(容量節點)
重要
本文有時是指 Power BI 進階版 或其容量訂用帳戶 (P SKU)。 請注意,Microsoft 目前正在合併購買選項,並淘汰每個容量 SKU 的 Power BI 進階版。 新的和現有的客戶應該考慮改為購買網狀架構容量訂用帳戶(F SKU)。
如需詳細資訊,請參閱 Power BI 進階版 授權和 Power BI 進階版 常見問題的重要更新。
建議
閘道大小調整建議取決於許多變數。 在本節中,我們會提供您可以考慮的一般建議。
初始重設大小
很難準確估計正確的大小。 建議您從至少 8 個 CPU 核心、8 GB RAM 和多個 Gb 網路配接器的電腦開始。 接著,您可以記錄 CPU 和記憶體系統計數器來測量一般閘道工作負載。 如需詳細資訊,請參閱 監視及優化內部部署數據閘道效能。
連線性
規劃 Power BI 服務 與閘道之間最佳的連線能力,以及閘道和數據源。
- 努力追求可靠性、快速速度和低、一致的延遲。
- 消除閘道與數據源之間的機器躍點或減少。
- 拿掉防火牆 Proxy 層強加的任何網路節流。 如需 Power BI 端點的詳細資訊,請參閱 將 Power BI URL 新增至您的允許清單。
- 設定 Azure ExpressRoute 以建立 Power BI 的私人受控連線。
- 針對 Azure VM 中的數據源,請確定 VM 會與 Power BI 服務 共置。
- 針對涉及動態 RLS 的 SQL Server Analysis Services (SSAS) 即時 連線 工作負載,請確定閘道電腦與 內部部署的 Active Directory 之間的良好連線能力。
叢集
您可以為大規模部署建立具有多個叢集成員的閘道, 叢集可避免單一失敗點,而且可以在閘道之間負載平衡流量。 您可以:
- 在叢集中安裝一或多個閘道。
- 將工作負載隔離至獨立閘道,或閘道伺服器的叢集。
如需詳細資訊,請參閱 管理內部部署數據閘道高可用性叢集和負載平衡。
語意模型設計和設定
語意模型設計及其設定可能會影響閘道工作負載。 若要減少閘道工作負載,您可以考慮下列動作。
針對匯入語意模型:
- 設定較不頻繁的數據重新整理。
- 設定累加式重新整理,以將要傳輸的數據量降到最低。
- 盡可能確保 進行查詢折疊 。
- 特別是對於大型數據磁碟區或低延遲結果的需求,請將設計轉換成 DirectQuery 或 複合 模型。
針對 DirectQuery 語意模型:
- 優化數據源、模型和報表設計—如需詳細資訊,請參閱 Power BI Desktop 中的 DirectQuery 模型指引。
- 建立 匯總 以快取較高層級的結果,以減少 DirectQuery 要求的數目。
- 在報表設計和容量設定中,限制 自動頁面重新 整理間隔。
- 特別是強制執行動態 RLS 時,請限制儀錶板快取更新頻率。
- 特別是針對較小的數據磁碟區或非揮發性數據,請將設計轉換成匯入或 複合 模型。
針對 Live 連線 ion 語意模型:
- 特別是強制執行動態 RLS 時,請限制儀錶板快取更新頻率。
相關內容
如需本文的詳細資訊,請參閱下列資源:
意見反應
https://aka.ms/ContentUserFeedback。
即將登場:在 2024 年,我們將逐步淘汰 GitHub 問題作為內容的意見反應機制,並將它取代為新的意見反應系統。 如需詳細資訊,請參閱:提交並檢視相關的意見反應