瀏覽貝氏機率分類模型 (基本資料採礦教學課程)
Microsoft 貝氏機率分類演算法提供了幾個方法來顯示自行車購買與輸入屬性之間的互動。
Microsoft 貝氏機率分類檢視器會提供下列索引標籤,用來瀏覽貝氏機率分類採礦模型:
相依性網路
屬性設定檔
屬性特性
屬性辨識
下列章節說明如何瀏覽其他採礦模型。
相依性網路
[相依性網路] 索引標籤的運作方式與 Microsoft 樹狀檢視器的 [相依性網路] 索引標籤相同。 檢視器中的每一個節點各代表變數,節點之間的線條則代表關聯性。 在此檢視器中,您可以查看對於可預測屬性 Bike Buyer 的狀態具有影響力的所有屬性。
若要在相依性網路索引標籤中瀏覽模型
您可以使用 [採礦模型檢視器] 索引標籤頂端的 [採礦模型] 清單,切換到 TM_NaiveBayes 模型。
使用 [檢視器] 清單可切換到 [Microsoft 貝氏機率分類檢視器]。
按一下 [Bike Buyer] 節點來識別它的相依性。
粉紅色的陰影表示所有屬性都會影響自行車的購買。
調整滑動軸來識別最具影響力的屬性。
隨著您將滑動軸往下移,就只會留下對 [Bike Buyer] 資料行影響最大的屬性。 當您調整滑動軸時,您可以發現幾個最具影響力的屬性如下:擁有的汽車數量、通勤距離及小孩總數。
回到頁首
屬性設定檔
[屬性設定檔] 索引標籤會描述輸入屬性的不同狀態如何影響可預測屬性的結果。
若要在屬性設定檔索引標籤中瀏覽模型
在 [可預測] 方塊中,請確認已選取 [Bike Buyer]。
如果 [採礦圖例] 阻礙了 [屬性設定檔] 的顯示,請將它移開。
在 [長條圖列] 方塊中,選取 [5]。
在我們的模型中,5 是任何一個變數的最大狀態數。
能夠影響這個可預測屬性所處狀態的屬性,會與輸入屬性之每一個狀態的值及其在可預測屬性之每一個狀態中的分佈情況一同列出。
在 [屬性] 資料行中,尋找 [Number Cars Owned]。 請注意自行車買主 (標記為 1 的資料行) 與非買主 (標記為 0 的資料行) 的長條圖差異。 沒有任何汽車或是擁有一輛汽車的人比較可能購買自行車。
按兩下自行車買主資料行 (標記為 1) 中的 [Number Cars Owned] 資料格。
[採礦圖例] 會顯示更詳細的檢視。
回到頁首
屬性特性
您可以使用 [屬性特性] 索引標籤選取屬性和值,以查看其他屬性的值顯示在選定值案例中的頻率為何。
若要在屬性特性索引標籤中瀏覽模型
在 [屬性] 清單中,確認已選取 [Bike Buyer]。
請將 [值] 設定為 1。
在此檢視器中,您將會看到家裡沒有小孩、通勤距離很短而且住在北美地區的客戶比較可能購買自行車。
回到頁首
屬性辨識
您可以使用 [屬性辨識] 索引標籤來調查自行車購買的兩個離散值與其他屬性值之間的關聯性。 因為 TM_NaiveBayes 模型只有 2 個狀態 (即 1 與 0),所以您完全不需要變更檢視器。
在此檢視器中,您可以看出沒有汽車的人傾向於購買自行車,而擁有兩輛汽車的人則傾向於不購買自行車。