分享方式:


Power BI 散佈圖中的高密度取樣

Power BI 取樣演算法改進了散佈圖表示高密度資料的方式。

例如,您可以從組織的銷售活動建立散佈圖,每間商店每年都有數以萬計的資料點。 此類資訊的散佈圖將從有意義的資料表示中對資料取樣,以說明銷售是如何隨時間變化的。 本文說明高密度資料取樣的詳細資料。

散佈圖的螢幕擷取畫面,顯示高密度取樣資料。

注意

Power BI DesktopPower BI 服務散佈圖可使用本文中所述的高密度取樣演算法。

高密度散佈圖的運作方式

先前,Power BI 透過決定性方式選取完整基礎資料範圍中的範例資料點集合,以建立散佈圖。 具體來說,Power BI 會在散佈圖圖表數列中,選取第一個和最後一個資料列,然後平均分配剩餘的資料列,以便在散佈圖上繪製總計 3,500 個資料點。 例如,如果樣本有 35,000 個資料列,則會選取第一個和最後一個資料列來繪製,然後也會繪製每十個資料列 (35000 / 10 = 每十個資料列 = 3,500 個資料點)。 此外,先前資料數列中無法繪製的 null 值或點 (例如文字值) 的點不會顯示,因此在產生視覺效果時未考慮它們。 使用這樣的取樣,散佈圖的認知密度也是根據代表性資料點,因此隱含的視覺效果密度是取樣點的一種情況,而不是完整的基礎資料集合。

當您啟用高密度取樣時,Power BI 會實作演算法,消除重疊的點,並確保視覺效果上的點可以在與視覺效果互動時觸達。 演算法也可確保在視覺效果會代表資料集裡的所有點,為選取點的意義提供內容,而不只是繪製代表性的樣本。

根據定義,高密度資料被取樣以建立對交互性有響應的視覺效果。 視覺效果上有太多資料點會拖慢速度,並降低趨勢的可見度。 資料的取樣方式會推動取樣演算法的建立,以提供最佳視覺效果體驗並確保表示所有資料。 在 Power BI 中,此演算法已改善,可提供回應、表示和清楚保留整體資料集中重要點的最佳組合。

注意

使用高密度取樣演算法的散佈圖,最適合繪製在正方形的視覺效果,如同所有散佈圖一樣。

散佈圖取樣演算法的運作方式

散佈圖的高密度取樣演算法會利用方法,擷取並更有效地代表基礎資料,同時消除重疊的點。 演算法從每個資料點的小半徑開始,即視覺效果上指定點的視覺效果圓形大小。 然後,它會增加所有資料點的半徑。 當兩個 (或更多) 資料點重疊時,單一圓形 (半徑大小增加) 會代表這些重疊的資料點。 演算法會繼續增加資料點的半徑,直到半徑值導致有合理的資料點數目 (3,500) 顯示在散佈圖中。

此演算法中的方法可確保在產生的視覺效果中表示出極端值。 判斷重疊時,演算法會尊重小數位數,使得指數小數位數在視覺化時能忠實於基礎的視覺效果點。

演算法也會保留散佈圖的整體圖形。

注意

針對散佈圖使用高密度取樣演算法時,資料的「正確分佈」是目標,不是隱含的視覺效果密度。 例如,您可能會看到散佈圖,其中有許多在某個區域重疊 (密度) 的圓形,並想像許多資料點必須叢集在該處。 由於高密度取樣演算法可以使用一個圓形來表示許多資料點,因此這種隱含的視覺效果密度或「叢集」不會出現。 若要在指定區域裡有更多詳細資料,您可以使用交叉分析篩選器拉近。

此外,無法繪製的資料點 (例如 null 值或文字值) 會被忽略,因此會選取另一個可繪製的值。 這進一步確保維護散佈圖的真實圖形。

針對散佈圖使用標準演算法的時機

有些情況下無法套用高密度取樣至散佈圖,而會使用原始的演算法。 那些情况是:

  • 如果您以滑鼠右鍵按一下 [值] 下的值,然後從功能表將它設為 [顯示沒有資料的項目],散佈圖會還原成原始的演算法。

    [視覺效果] 功能表的螢幕擷取畫面,其中顯示包含 [顯示沒有資料的項目] 選取項目的 [值] 窗格。

  • [播放軸] 欄位中的任何值將導致散佈圖還原成原始的演算法。

  • 如果散佈圖上同時遺漏 X 和 Y 軸,圖表會還原為原始的演算法。

  • 在 [分析] 窗格中使用 [比率行] 會導致圖表還原成原始的演算法。

    [視覺效果] 功能表的螢幕擷取畫面,其中顯示 [分析] 窗格和 [比率行] 的指標。

如何開啟散佈圖的高密度取樣

若要將高密度取樣切換為 [開啟],請選取散佈圖,移至 [格式] 視覺效果窗格,展開 [一般] 卡片,然後在該卡片底部附近,將高密度取樣滑桿滑動至 [開啟]

[視覺效果] 功能表的螢幕擷取畫面,其中顯示 [格式] 視覺效果窗格、[一般] 卡片及 [高密度取樣] 切換滑桿的指標。

注意

開啟切換開關後,Power BI 將盡可能嘗試使用高密度取樣演算法。 當演算法無法使用時,例如當您在 [播放] 軸上放置值時,即使圖表已還原至標準演算法,切換開關也會保持 [開啟] 狀態。 如果您接著從 [播放] 軸移除值,或是狀況變更為可使用高密度取樣演算法,圖表會自動使用適合該圖表的高密度取樣,因為功能啟用中。

注意

資料點會依索引分組或選取。 具有圖例不會影響演算法的取樣。 它只影響視覺效果的順序。

考量與限制

高密度取樣演算法是對 Power BI 的重要改進。 不過。高密度取樣演算法只能搭配對以 Power BI 服務為基礎的模型、匯入的模型,或 DirectQuery 等的即時連線。