在 Power BI 中套用深入解析,以探索分佈差異的位置
適用於:Power BI Desktop Power BI 服務
在視覺效果中,您通常會看到數據點,並想知道不同類別的分佈是否相同。 透過Power BI中的深入解析,只要按幾下即可瞭解。
請考慮下列視覺效果,其中顯示 TotalSales by CountryName。 大部分的銷售來自 美國,佔來自其他國家/地區較少貢獻的所有銷售額的57%。 在這類情況下,探索不同的子擴展是否會看到相同的分佈,這通常很有趣。 例如,這在所有年份、所有銷售管道和所有類別的產品中都相同嗎? 雖然您可以套用不同的篩選,並以可視化方式比較結果,但這樣做可能會很耗時且容易出錯。
您可以告訴 Power BI 找出分佈的不同之處,並快速、自動化和深入分析數據。 以滑鼠右鍵按兩下資料點,然後選取 [分析>尋找此分佈的不同位置],並在易於使用的視窗中將深入解析傳遞給您。
在此範例中,自動化分析顯示 美國 和加拿大旅遊自行車的銷售比例低於來自其他國家/地區的比例。
使用深入解析
若要使用深入解析來尋找圖表上看到的分佈不同之處,只要以滑鼠右鍵按兩下任何數據點或整個視覺效果即可。 然後選取 [分析>尋找此分佈的不同位置]。
Power BI 會透過數據執行其機器學習演算法。 然後,它會以視覺效果填入視窗,以及哪些類別(數據行)的描述,以及這些類別的哪些值會導致最明顯的分佈。 深入解析會以柱形圖的形式提供,如下圖所示:
套用所選取的值具有預設色彩。 如原始起始視覺效果所示,整體值會以灰色顯示,以便輕鬆比較。 最多可包含三個不同的篩選條件(在此範例中為 Touring Bikes、 Mountain Bikes 和 Road Bikes ),也可以藉由選取數據點或使用 ctrl 鍵來選取多個來選擇不同的篩選。
針對簡單的加法量值,例如 此範例中的總銷售額 ,比較是以相對值而非絕對值為基礎。 旅遊自行車的銷售低於所有類別的整體銷售額:不過,根據預設,視覺效果會使用雙軸,允許在不同國家/地區之間銷售比例之間的比較。 這適用於旅遊自行車與所有類別的自行車。 切換視覺效果下方的切換可讓兩個值顯示在相同的軸上,讓絕對值可以輕鬆地進行比較,如下圖所示:
描述性文字也會指出可能附加至篩選值的重要性層級,因為有符合篩選條件的記錄數目。 在此範例中,您會看到雖然旅遊自行車的分佈可能不同,但它們只占記錄的 16.6%。
頁面頂端的豎起大拇指和向下拇指圖示存在,因此您可以提供有關視覺效果和功能的意見反應。 不過,這樣做並不會將演算法定型,以影響下次使用此功能時傳回的結果。
重要的是, + 視覺效果頂端的按鈕可讓您將選取的視覺效果新增至報表,就像您手動建立視覺效果一樣。 然後,您可以格式化或調整新增的視覺效果,就像對報表上的任何其他視覺效果一樣。 當您在 Power BI 中編輯報表時,您只能新增選取的深入解析視覺效果。
當報表處於讀取或編輯模式時,您可以使用深入解析。 這讓分析數據及建立視覺效果變得多才多藝,您可以新增至報表。
傳回結果的詳細數據
您可以將演算法視為採用模型中所有其他數據行,而且針對這些數據行的所有值,將它們套用為原始視覺效果的篩選。 然後演算法會尋找其中哪一個篩選值會產生與原始值最 不同的 結果。
您可能想知道有何 不同 意義。 例如,假設美國和加拿大之間的銷售整體分割如下:
國家/地區 | 銷售 ($M) |
---|---|
USA | 15 |
加拿大 | 5 |
然後,針對產品 「公路自行車」的特定類別,銷售的分割可能是:
國家/地區 | 銷售 ($M) |
---|---|
USA | 3 |
加拿大 | 1 |
雖然這些數據表中的數位各有不同,但美國和加拿大之間的相對值相同:整體為 75% 和 25%,對於公路自行車則為 75% 和 25%。 因此,這些不會被視為不同。 對於類似這樣的簡單加法量值,演算法會尋找相對值的差異。
相較之下,請考慮計算為利潤/成本的保證金等量值。 如果美國和加拿大的整體獲利率如下:
國家/地區 | Margin ≤ |
---|---|
USA | 15 |
加拿大 | 5 |
然後,針對產品 「公路自行車」的特定類別,銷售的分割可能是:
國家/地區 | Margin ≤ |
---|---|
USA | 3 |
加拿大 | 1 |
鑒於這類量值的性質,這很有趣。 對於此邊界範例之類的非加法量值,演算法會尋找絕對值的差異。
因此,顯示的視覺效果旨在顯示整體分佈之間的差異,如原始視覺效果中所見,以及套用特定篩選的值。
對於加法量值,例如 上一個範例中的 Sales ,會使用柱形圖和折線圖。 在那裡,使用具有適當縮放的雙軸,即可比較相對值。 數據行會顯示套用篩選的值,而該行會顯示整體值。 數據行軸位於左側,線條軸位於右側,如常一樣。 線條會使用 階梯 狀樣式來顯示,內含虛線,填滿灰色。 在上一個範例中,如果數據行座標軸最大值為 4,而線條軸最大值為 20,則它可讓您輕鬆比較美國和加拿大之間的相對值,以取得篩選和整體值。
同樣地,對於上一個範例中邊界之類的非加法量值,會使用柱形圖和折線圖,其中單一座標軸的使用表示可以輕鬆地比較絕對值。 填滿灰色的線條會顯示整體值。 無論比較實際或相對數字,判斷兩個分佈的度數是否不同,都不只是計算值差異的問題。 例如:
當母體的大小納入考慮時,當它套用到較小比例的整體母體時,差異在統計上較不顯著且較不有趣。 例如,針對特定產品,跨國家/地區的銷售分佈可能會有所不同。 如果有數千個產品,這不會很有趣,因此特定產品只佔整體銷售額的一小部分。
原始值偏高或接近零的類別差異,加權高於其他類別。 例如,如果國家或地區整體只貢獻 1% 的銷售量,但對於特定類型的產品貢獻 6%,則比貢獻從 50% 變更為 55% 的國家或地區更具統計意義,因此更有趣。
各種啟發學習法會考慮數據之間的其他關聯性,以選取最有意義的結果。
檢查不同的數據行和每個數據行的值之後,會選擇一組提供最大差異的值。 為了方便了解,這些數據行接著會輸出並依數據行分組,其值會先列出最大的差異。 每個數據行最多會顯示三個值,但如果有三個值有較大影響,或某些值比其他值更具影響,則可能不會顯示較少值。
這不一定是模型中所有數據行在可用時間都會檢查的情況,因此不保證會顯示最具影響的數據行和值。 不過,各種啟發學習法可確保先檢查最有可能的數據行。 例如,假設檢查所有數據行之後,判斷下列數據行/值對分佈的影響最大,從最大影響到最低:
Subcategory = Touring Bikes
Channel = Direct
Subcategory = Mountain Bikes
Subcategory = Road Bikes
Subcategory = Kids Bikes
Channel = Store
這些會依數據行順序取得輸出,如下所示:
子類別:旅遊自行車、山車、公路自行車(僅列出三個,文字包括 “...其中一些人「表示超過三人有重大影響)
Channel = Direct (僅列出直接列出,如果其影響層級大於 Store)
考量與限制
下列清單是目前不支援的 深入解析案例集合:
- TopN 篩選條件
- 量值篩選
- 非數值量值
- 使用「將值顯示為」
- 篩選量值 – 篩選量值是已套用特定篩選的視覺層級計算,例如 法國的總銷售額,並用於見解功能所建立的一些視覺效果
此外,深入解析目前不支援下列模型類型和數據源:
- DirectQuery
- 即時連線
- 內部部署 Reporting Services
- 內嵌
相關內容
如需詳細資訊,請參閱