建立關鍵影響因素視覺效果
適用於:Power BI Desktop Power BI 服務
關鍵影響因素視覺效果可協助您了解驅動您感興趣的計量的因素。 它會分析您的數據、排序重要因素,並將其顯示為關鍵影響因素。 例如,假設您想要找出哪些因素會影響員工營業額,也就是所謂的流失。 其中一個因素可能是僱用合同長度,另一個因素可能是通勤時間。
使用關鍵影響因素的時機
如果您要:
- 查看哪些因素會影響要分析的計量。
- 對比這些因素的相對重要性。 例如,短期合約是否比長期合約更影響流失?
關鍵影響因素視覺效果的功能
索引標籤:選取索引標籤以在檢視之間切換。 關鍵影響因素 會顯示所選計量值的主要參與者。 頂端區段 會顯示參與所選計量值的頂端區段。 區 段 是由值的組合所組成。 例如,一個區段可能是客戶至少 20 年且居住在西部地區的消費者。
下拉式方塊:正在調查的計量值。 在此範例中,請查看計量 評等。 選取的值為 Low。
重述:它可協助您解譯左窗格中的視覺效果。
左窗格:左窗格包含一個視覺效果。 在此情況下,左窗格會顯示最上層關鍵影響因素的清單。
重述:它可協助您解譯右窗格中的視覺效果。
右窗格:右窗格包含一個視覺效果。 在此情況下,柱形圖會顯示左窗格中選取之索引鍵影響因素 主題 的所有值。 左窗格中的可用性特定值會以綠色顯示。 [主題] 的所有其他值都會以黑色顯示。
平均線:[主題] 的所有可能值都會計算平均值,但可用性除外(這是選取的影響因素)。 因此,計算會套用至黑色的所有值。 它會告訴您其他 主題 的百分比低評等。 在此情況下,11.35% 的評等很低(以虛線顯示)。
複選框:篩選出右窗格中的視覺效果,只顯示該字段影響因素的值。 在此範例中,視覺效果會篩選以顯示可用性、安全性和流覽。
分析類別目錄的計量
觀看這段影片,瞭解如何使用類別計量建立關鍵影響因素視覺效果。 然後遵循步驟來建立一個。
注意
這段影片可能會使用舊版 Power BI Desktop 或 Power BI 服務。
- 您的產品經理希望找出哪些因素導致客戶對雲端服務留下負面評論。 若要遵循 Power BI Desktop 中的操作,請開啟 客戶意見反應 PBIX 檔案。
注意
客戶意見反應數據集是以 [Moro et al., 2014] S. Moro、 P. Cortez 和 P. Rita 為基礎。 「預測銀行電話行銷成功的數據驅動方法。」 決策支持系統,Elsevier,62:22-31,2014 年 6 月。
在 [視覺效果] 窗格的 [建置視覺效果] 底下,選取 [關鍵影響因素] 圖示。
將您想要調查的 計量移至 [分析] 欄位。 若要查看服務的客戶評分偏低,請選取 [客戶數據表>評等]。
將您認為可能會影響評等的欄位移至 [依說明] 欄位。 您可以視需要移動多個字段。 在此情況下,請從:
- Country-Region
- 組織中的角色
- 訂閱類型
- 公司大小
- Theme
將 [ 依] 字段保留空白。 只有在分析量值或摘要欄位時,才會使用此欄位。
若要將焦點放在負面評等,請在 [影響評等] 下拉式方塊中選取 [低]。
分析會在所分析欄位的數據表層級上執行。 在此情況下,它是 評等 計量。 此計量是在客戶層級定義。 每位客戶都有高分或低分。 所有說明因素都必須在客戶層級定義,視覺效果才能使用這些因素。
在上一個範例中,所有說明因素都有一對一或多對一的計量關聯性。 在此情況下,每位客戶都會將單一主題指派給其評等。 同樣地,客戶來自一個國家或地區、擁有一個成員資格類型,並在其組織中擔任一個角色。 說明因素已經是客戶的屬性,不需要轉換。 視覺效果可以立即加以使用。
稍後在本教學課程中,您會查看具有一對多關聯性的更複雜的範例。 在這些情況下,數據行必須先匯總到客戶層級,才能執行分析。
分析計量的數據表層級也會評估做為說明因素的量值和匯總。 本文稍後會示範一些範例。
解譯類別索引鍵影響因素
讓我們看看低評等的主要影響因素。
影響低評等可能性的最上層單一因素
此範例中的客戶可以有三個角色:取用者、系統管理員和發行者。 成為消費者是導致低評等的最上層因素。
更精確地說,您的取用者比給予您的服務負面分數的可能性要高 2.57 倍。 主要影響因素圖表列出 組織中的角色是左側清單中的取 用者。 在組織中選取 [角色] 是取用者,Power BI 會在右窗格中顯示更多詳細數據。 顯示每個角色對低評等可能性的比較效果。
- 14.93%的消費者給予低分。
- 所有其他角色的平均分數為5.78%的時間。
- 與所有其他角色相比,消費者的分數要低2.57倍。 您可以藉由將綠色列除以紅色虛線來判斷此分數。
影響低評等可能性的第二個單一因素
關鍵影響因素視覺效果會比較和排名許多不同變數的因素。 第二個影響因素與組織的角色無關。選取清單中的第二個影響因素,也就是主題是可用性。
第二個最重要的因素與客戶檢閱的主題有關。 評論產品可用性的客戶比評論其他主題的客戶(例如可靠性、設計或速度)的評分要低 2.55 倍。
在視覺效果之間,紅色虛線顯示的平均值從 5.78% 變更為 11.35%。 平均值是動態的,因為它是以所有其他值的平均值為基礎。 對於第一個影響因素,平均值會排除客戶角色。 針對第二個影響因素,它排除了可用性主題。
選取 [ 僅顯示影響因素 的值] 複選框,以僅使用有影響力的值進行篩選。 在此情況下,它們是驅動低分的角色。 12 個主題會縮減為 Power BI 識別為驅動低評等主題的四個主題。
與其他視覺效果互動
每次在畫布上選取交叉分析篩選器、篩選或其他視覺效果時,關鍵影響因素視覺效果就會重新執行對新數據部分的分析。 例如,您可以將公司大小移至報表,並將其作為交叉分析篩選器使用。 使用它來查看企業客戶的主要影響因素是否與一般母體不同。 企業規模大於 50,000 名員工。
選取 >50,000 重新執行分析,您可以看到影響因素已變更。 對於大型企業客戶,低評等的最高影響因素具有與安全性相關的主題。 您可能想要進一步調查,以查看大型客戶是否對某些特定安全性功能感到不滿。
解譯連續關鍵影響因素
到目前為止,您已瞭解如何使用視覺效果來探索不同類別字段如何影響低評等。 您也可以在 [依] 字段中有連續因素,例如年齡、高度和價格。 讓我們看看當「任期」從客戶數據表移至 [說明依據] 時會發生什麼情況。 任期描述客戶使用服務的時間長度。
隨著任期的增加,獲得較低評級的可能性也會增加。 此趨勢表明,長期客戶更有可能給予負面分數。 此深入解析很有趣,而且您可能想要稍後進行後續追蹤。
視覺效果顯示,每次任期上升 13.44 個月時,平均低評等的可能性增加 1.23 倍。 在此情況下,13.44 個月描述任期的標準偏差。 因此,您收到的深入解析會探討如何以標準數量增加任期,也就是任期的標準偏差,會影響獲得低評等的可能性。
右窗格中的散佈圖會繪製每個任期值之低評等的平均百分比。 它會以趨勢線反白顯示斜率。
量化連續關鍵影響因素
在某些情況下,您可能會發現連續因素會自動變成類別。 如果變數之間的關聯性不是線性的,我們就無法將關聯性描述為單純增加或減少(如上述範例所示)。
我們會執行相互關聯測試,以判斷影響因素與目標之間的線性。 如果目標是連續的,我們會執行 Pearson 相互關聯,如果目標為類別,我們會執行 Point Biserial 相互關聯測試。 如果我們偵測到關聯性不夠線性,我們會進行受監督的量化,併產生最多五個量化。為了找出哪些量化最合理,我們使用監督量化方法,查看說明因數與所分析目標之間的關聯性。
將量值和匯總解譯為關鍵影響因素
您可以使用量值和匯總作為分析中的說明因素。 例如,您可能會想要查看客戶支援票證計數,或開啟票證的平均持續時間在您收到的分數上有何影響。
在此情況下,您想要查看客戶是否影響其分數的支援票證數目。 現在,您會從支援票證數據表引進 支援票證標識符 。 因為客戶可以有多個支援票證,因此您可以將標識碼匯總至客戶層級。 匯總很重要,因為分析會在客戶層級執行,因此所有驅動程式都必須在該粒度層級定義。
讓我們看看標識碼的計數。 每個客戶數據列都有與其相關聯的支援票證計數。 在此情況下,當支援票證計數增加時,低評等的可能性會上升4.08倍。 右側的視覺效果會依客戶層級評估的不同 評等 值,顯示支援票證的平均數目。
解譯結果:最上層區段
您可以使用 [ 關鍵影響因素] 索引標籤個別評估每個因素。 您也可以使用 [ 熱門區段 ] 索引標籤來查看因素組合如何影響您正在分析的計量。
最上層區段一開始會顯示Power BI探索到的所有區段概觀。 下列範例顯示找到六個區段。 這些區段會依區段內低評等的百分比來排名。 例如,區段 1 有 74.3% 的客戶評分很低。 泡泡越高,評等比例越高。 泡泡的大小代表區段內有多少客戶。
選取泡泡會顯示該區段的詳細數據。 例如,如果您選取 [區段 1],您會發現它是由相對建立的客戶所組成。 他們已經客戶超過 29 個月,並有超過四個支援票證。 最後,它們不是發行者,因此他們是取用者或系統管理員。
在此群組中,74.3% 的客戶給予了低評等。 平均客戶給予低評等 11.7% 的時間,因此此區段的評等比例較高。 高出 63 個百分點。 區段 1 也包含大約 2.2% 的數據,因此它代表母體擴展的可尋址部分。
新增計數
有時候影響因素可能會有顯著的影響,但很少代表數據。 例如, Theme 是 可用性 是低評等的第三大影響因素。 不過,可能只有少數客戶抱怨可用性。 計數可協助您排定您想要專注於哪些影響因素的優先順序。
您可以透過 格式化窗格的 [分析] 卡片 開啟計數。
啟用計數之後,您會看到每個影響因素泡泡周圍的環形,代表影響因素所包含的大約百分比數據。 環圈的泡泡越多,它所包含的數據就越多。 我們可以看到 Theme 是 可用性 ,其中包含少量的數據。
您也可以使用視覺效果左下角的 [排序依據] 切換,先依計數排序泡泡,而不是影響。 訂用帳戶類型 是 頂級 影響因素,以計數為基礎。
圓圈周圍有完整環形表示影響因素包含 100% 的數據。 您可以使用格式化窗格的 [分析] 卡片中的 [計數類型] 下拉式清單,將計數類型變更為相對於最大影響因素。 現在具有最大數據量的影響因素會以完整環表示,而所有其他計數都會與其相對。
分析數值的計量
如果您將未合併的數值欄位移至 [分析] 字段,您可以選擇如何處理該案例。 您可以移至 [格式化] 窗格,並在類別分析類型和連續分析類型之間切換,來變更視覺效果的行為。
類別分析類型的行為如下所述。 例如,如果您正在查看從 1 到 10 的問卷分數,您可以詢問「調查分數影響 1 是什麼?」
連續分析類型會將問題變更為連續的問題。 在上述範例中,我們的新問題會是「調查分數對增加/減少有何影響?」
當您在您要分析的欄位中有許多唯一值時,這項區別會很有説明。 在下列範例中,我們會查看房價。 問『什麼影響房價是 156,214? 因為這是非常具體的,而且我們可能沒有足夠的數據來推斷模式。
相反,我們可能想問,『什麼影響房價上漲』? 這可讓我們將房價視為範圍,而不是相異的值。
解譯結果:關鍵影響因素
注意
本節中的範例會使用公用網域房價數據。 如果您想要跟著做,可以 下載範例數據集 。
在此案例中,我們將探討「影響房價上漲的影響」。 一些解釋性因素可能會影響房屋價格,如 年建(房屋建成 年)、 廚房品質 ,以及 YearRemodAdd (房屋改造年份)。
在下列範例中,我們會查看我們最高的影響因素,也就是廚房品質是優秀的。 結果類似於我們在分析類別計量時所看到的結果,但有一些重要的差異:
- 右邊的柱形圖會查看平均值,而不是百分比。 因此,它告訴我們,與沒有優秀廚房的房子的平均房價(點線)相比,一棟房子的平均房價是(綠色酒吧)
- 泡泡中的數位仍然是紅色虛線和綠色橫條之間的差異,但它以數位表示($158.49K),而不是可能性(1.93x)。 因此,平均而言,擁有優秀廚房的房屋比沒有優秀廚房的房屋貴近1.6億美元。
在下列範例中,我們看看持續因素(年房被改造)對房價的影響。 相較於我們分析類別計量連續影響因素的方式,差異如下:
- 右窗格中的散佈圖會繪製每一個不同年份重新模型值的平均房價。
- 泡沫中的價值表明,當房子被改造時,房屋標準偏差(在此案例中為20年)的房價上漲量(在此案例中為20年)增加了多少( 在此案例中為 20 美元)
最後,在措施的情況下,我們正在研究一棟房子的平均建成年份。 分析如下所示:
- 右窗格中的散佈圖繪製數據表中每個相異值的平均房價
- 泡沫中的值顯示,當平均年以標準偏差 (在此案例中為 30 年) 時,平均房價上漲幅度 (在此案例中為 $1.35K)
解譯結果:頂端區段
數值目標的熱門區段會顯示平均房價高於整體數據集的群組。 例如,下面我們可以看到第 1 區段是由車庫車(車庫可以容納的汽車數目)大於 2 的房屋,而 RoofStyle 是 Hip。 具有這些特性的房屋的平均價格為35.5萬美元,而數據中的整體平均價格為18萬美元。
分析量值或摘要數據行的計量
在量值或摘要數據行的情況下,分析預設為上述連續分析類型。 無法加以變更。 分析量值/摘要數據行與未匯總數值數據行之間的最大差異是分析執行所在的層級。
如果是未匯總的數據行,分析一律會在數據表層級執行。 在上述房價範例中,我們分析了 房價 計量,以查看對房價增加/減少的影響。 分析會自動在數據表層級執行。 我們的數據表具有每個房屋的唯一標識符,因此分析會在房屋層級執行。
對於量值和摘要數據行,我們不會立即知道要分析的數據行層級。 如果 房價 摘要為 平均值,我們需要考慮我們想要計算這個平均房價的水準。 這是鄰里一級的平均房價嗎? 還是區域層面?
量值和摘要數據行會自動在所使用的欄位說明層級進行分析。 假設我們有三個領域在說明依據, 我們有興趣: 廚房品質, 建築類型和空調。 平均房價 會針對這三個字段的每個唯一組合進行計算。 切換至數據表檢視來查看所評估數據的外觀,通常很有説明。
此分析非常摘要,因此回歸模型很難在可從中學習的數據中尋找任何模式。 我們應該在更詳細的層級執行分析,以取得更好的結果。 如果我們想要在房屋層級分析房價,我們需要明確地將標識符字段新增至分析。 然而,我們不希望房子標識碼被認為是一個影響者。 學習到,隨著房屋標識碼的上漲,房屋價格的上漲並不有説明。 [ 依欄位擴充 ] 選項在這裡派上用場。 您可以使用 [展開依據 ] 來新增您想要用來設定分析層級的欄位,而不需要尋找新的影響因素。
看看當我們將標識元新增至展開依據之後,視覺效果的外觀。 定義要評估量值的層級之後,解譯影響因素與 未匯總數值數據行完全相同。
如果您想要深入瞭解如何使用關鍵影響因素視覺效果來分析量值,請觀看下列影片。 若要瞭解 Power BI 如何在幕後使用 ML.NET,以自然的方式推斷數據和表面見解,請參閱 Power BI 使用 ML.NET 來識別關鍵影響因素。
注意
這段影片可能會使用舊版 Power BI Desktop 或 Power BI 服務。
考慮和疑難解答
視覺效果的限制為何?
關鍵影響因素視覺效果有一些限制:
- 不支援直接查詢
- 不支援對 Azure Analysis Services 和 SQL Server Analysis Services 的即時 連線
- 不支援發佈至 Web
- 需要 .NET Framework 4.6 或更高版本
- 不支援 SharePoint Online 內嵌
我看到找不到任何影響因素或區段的錯誤。 這是為什麼?
當您在 Explain by 中包含欄位,但沒有找到影響因素時,就會發生此錯誤。
- 您已在分析和說明中納入您正在分析的計量。 將它從 [說明依據] 中移除。
- 您的說明欄位具有太多類別,且很少觀察。 這種情況使得視覺效果很難判斷哪些因素是影響因素。 很難根據少數觀察進行一般化。 如果您要分析數值欄位,您可能會想要在 [分析] 卡片底下的 [格式化] 窗格中,從 [類別分析] 切換為 [連續分析]。
- 您的說明因素有足夠的觀察來一般化,但視覺效果找不到任何有意義的相互關聯來報告。
我看到我正在分析的計量沒有足夠的數據來執行分析的錯誤。 這是為什麼?
視覺效果的運作方式是查看一個群組的數據模式與其他群組相比。 例如,它會尋找與給予高評等的客戶相比,給予低評等的客戶。 如果您的模型中的數據只有一些觀察,則很難找到模式。 如果視覺效果沒有足夠的數據來尋找有意義的影響因素,表示需要更多數據來執行分析。
建議您至少有 100 個選取狀態的觀察。 在此情況下,狀態是變換的客戶。 您也需要至少 10 個觀察,以用於比較的狀態。 在此情況下,比較狀態是未變換的客戶。
如果您要分析數值欄位,您可能會想要在 [分析] 卡片底下的 [格式化] 窗格中,從 [類別分析] 切換為 [連續分析]。
我看到「分析」未摘要時的錯誤,分析一律會在其父數據表的數據列層級執行。 不允許透過 [展開依據] 字段變更此層級。 這是為什麼?
分析數值或類別數據行時,分析一律會在數據表層級執行。 例如,如果您要分析房價,而您的數據表包含標識符數據行,分析會自動在房屋標識符層級執行。
當您正在分析量值或摘要資料行時,您需要明確說明要執行分析的層級。 您可以使用 Expand by 來變更量值和摘要數據行的分析層級,而不需要新增影響因素。 如果 房價定義為量值,您可以將房屋 標識符數據行新增至 [展開依據 ],以變更分析層級。
我看到 [說明依據] 中的字段與包含我分析計量的數據表不是唯一相關的錯誤。 這是為什麼?
分析會在所分析欄位的數據表層級上執行。 例如,如果您分析服務的客戶意見反應,您可能會有一個數據表告訴您客戶是否給予高評等或低評等。 在此情況下,您的分析會在客戶數據表層級執行。
如果您有比包含計量的數據表更細微的層級所定義的相關數據表,您會看到此錯誤。 以下是範例:
- 您可以分析哪些可讓客戶提供低評等的服務。
- 您想要查看客戶取用您服務所在的裝置是否會影響他們給予的評論。
- 客戶可以透過多種不同方式取用服務。
- 在下列範例中,客戶 1000000 使用瀏覽器和平板電腦來與服務互動。
如果您嘗試使用裝置資料行作為說明因素,您會看到下列錯誤:
此錯誤隨即出現,因為裝置未在客戶層級定義。 一位客戶可以在多個裝置上取用服務。 若要讓視覺效果尋找模式,裝置必須是客戶的屬性。 有數個解決方案取決於您對企業的理解:
- 您可以將裝置的摘要變更為計數。 例如,如果裝置數目可能會影響客戶的分數,請使用計數。
- 您可以樞紐處理裝置數據行,以查看在特定裝置上取用服務是否會影響客戶的評等。
在此範例中,數據已樞紐處理,以建立瀏覽器、行動和平板電腦的新數據行(請務必在樞紐數據之後,刪除並重新建立模型檢視中的關聯性)。 您現在可以在說明依據中使用這些特定裝置。 所有裝置都會成為影響因素,瀏覽器對客戶分數的影響最大。
更精確地說,不使用瀏覽器來取用服務的客戶比執行服務的客戶低 3.79 倍。 在清單中下拉下,針對行動裝置,反向是 true。 使用行動應用程式的客戶比未使用行動應用程式的客戶更可能給予低分。
我看到一個警告,指出量值沒有包含在我的分析中。 這是為什麼?
分析會在所分析欄位的數據表層級上執行。 如果您分析客戶流失,您可能會有一個數據表,告訴您客戶是否變換。 在此情況下,您的分析會在客戶數據表層級執行。
量值和匯總預設會在數據表層級進行分析。 如果有平均每月支出的量值,則會在客戶數據表層級進行分析。
如果客戶數據表沒有唯一標識符,則您無法評估量值,而且分析會忽略該量值。 若要避免這種情況,請確定具有計量的數據表具有唯一標識符。 在此情況下,它是客戶數據表,唯一標識符是客戶標識符。 您也可以使用 Power Query 輕鬆地新增索引數據行。
我看到一個警告,指出我分析的計量有10個以上的唯一值,且此數量可能會影響分析的品質。 這是為什麼?
AI 視覺效果可以分析類別欄位和數值欄位。 在類別欄位的案例中,範例可能是[變換] 為 [是] 或 [否],而 [客戶滿意度] 為 [高]、[中] 或 [低]。 增加要分析的類別數目表示每個類別的觀察次數較少。 這種情況會使視覺效果難以在數據中尋找模式。
分析數值欄位時,您可以選擇將數值欄位視為文字,在此情況下,您將執行與類別數據相同的分析(類別分析)。 如果您有許多相異值,建議您將分析切換至 連續分析 ,這表示我們可以從數位增加或減少時推斷模式,而不是將它們視為相異值。 您可以在 [分析] 卡片底下的 [格式化] 窗格中,從類別分析切換為連續分析。
若要尋找更強大的影響因素,我們建議您將類似的值分組成單一單位。 例如,如果您有價格計量,您可能會將類似的價格分組為高、中和低類別,以取得更好的結果,而使用個別價格點。
我的數據中有一些因素看起來應該是關鍵影響因素,但它們不是。 這種情況如何發生?
在下列範例中,消費者的客戶會驅動低評等,評等 14.93% 為低。 系統管理員角色也有較高的低評等比例,為 13.42%,但並不被視為影響因素。
此判斷的原因是視覺效果也會在找到影響因素時考慮數據點的數目。 下列範例的取用者超過 29,000 個,系統管理員少 10 倍,約 2,900 個。 其中只有390人給予了低評等。 視覺效果沒有足夠的數據來判斷它是否找到具有系統管理員評等模式,或是否只是一個機會尋找。
關鍵影響因素的數據點限制為何? 我們會在 10,000 個數據點的範例上執行分析。 一邊的泡泡顯示了找到的所有影響因素。 另一邊的柱形圖和散佈圖會遵守這些核心視覺效果的取樣策略。
如何計算類別分析的關鍵影響因素?
在幕後,AI 視覺效果會使用 ML.NET 來執行羅吉斯回歸來計算主要影響因素。 羅吉斯回歸是一種統計模型,可比較不同的群組彼此。
如果您想要查看什麼驅動低評等,羅吉斯回歸會查看給予低分的客戶與給予高分的客戶有何不同。 如果您有多個類別,例如高、中性和低分數,則查看給予低評等的客戶與未給予低評等的客戶有何不同。 在此情況下,給予低分的客戶與給予高評等或中性評等的客戶有何不同?
羅吉斯回歸會搜尋數據中的模式,並尋找給予低評等的客戶與給予高評等的客戶有何不同。 例如,它可能會發現,支援票證較多的客戶比少數或沒有支援票證的客戶提供較高百分比的低評等。
羅吉斯回歸也會考慮有多少數據點存在。 例如,如果扮演系統管理員角色的客戶會按比例給予更多負面分數,但只有少數系統管理員,則此因素不會被視為具影響力。 因為沒有足夠的數據點可用來推斷模式,因此會進行此判斷。 統計測試,稱為 Wald 測試,用來判斷因素是否被視為影響因素。 視覺效果會使用 p 值 0.05 來判斷臨界值。
如何計算數值分析的關鍵影響因素?
在幕後,AI 視覺效果會使用 ML.NET 來執行線性回歸來計算主要影響因素。 線性回歸是一種統計模型,可查看您根據說明因素分析變更之字段的結果。
例如,如果我們正在分析房價,線性回歸將探討擁有絕佳廚房會對房價產生的影響。 與沒有優秀廚房的房子相比,有優秀的廚房的房子通常有較低的或更高的房價嗎?
線性回歸也會考慮數據點的數目。 例如,如果具有網球場的房屋價格較高,但我們很少有房子有一個網球場,這個因素並不被認為是有影響力的。 因為沒有足夠的數據點可用來推斷模式,因此會進行此判斷。 統計測試,稱為 Wald 測試,用來判斷因素是否被視為影響因素。 視覺效果會使用 p 值 0.05 來判斷臨界值。
如何計算區段?
在幕後,AI 視覺效果會使用 ML.NET 來執行判定樹來尋找有趣的子群組。 判定樹的目標是最終要有一個數據點的子群組,而數據點在您想要的計量中相對較高。 這可能是低評級或高價格的房屋的客戶。
判定樹會採用每個解釋性因素,並嘗試將哪一個因素給予最佳 分割。 例如,如果您篩選數據以只包含大型企業客戶,則會將給予高評等與低評等的客戶分開嗎? 或者最好篩選數據,只包含評論安全性的客戶?
判定樹進行分割之後,它會採用數據的子群組,並判斷該數據下一個最佳分割。 在此情況下,子群組是評論安全性的客戶。 在每次分割之後,判定樹也會考慮是否有足夠的數據點可讓此群組具有足夠的數據點來推斷模式,或是否為數據中的異常,而不是實際區段。 另一項統計測試會套用至檢查具有 p 值 0.05 之分割條件的統計重要性。
判定樹完成執行之後,它會取得所有分割,例如安全性批注和大型企業,並建立Power BI篩選器。 此篩選組合會封裝為視覺效果中的區段。
為什麼某些因素會成為影響因素或停止成為影響因素,因為我將更多欄位移至 [依 說明] 字段?
視覺效果會一起評估所有說明因素。 因素本身可能是影響因素,但當它被視為其他因素時,它可能不會。 假設您想要分析是什麼驅動房價高,臥室和房子大小作為說明因素:
- 就本身而言,更多的臥室可能是房價高企的驅動因素。
- 在分析中包含房屋大小表示您現在查看臥室會發生什麼情況,而房屋大小保持不變。
- 如果房屋大小固定在 1,500 平方英尺,則臥室數量的連續增加不太可能大幅提高房價。
- 臥室可能不像考慮房子大小之前那樣重要。
與 Power BI 同事共用報表時,您必須擁有個別的 Power BI Pro 授權,或報表儲存在 進階版 容量中。 請參閱 共用報表。
相關內容
意見反應
https://aka.ms/ContentUserFeedback。
即將登場:在 2024 年,我們將逐步淘汰 GitHub 問題作為內容的意見反應機制,並將它取代為新的意見反應系統。 如需詳細資訊,請參閱:提交並檢視相關的意見反應