共用方式為


探索時序群集模型 (元數據採礦教學課程)

既然您已使用區域模型建置 時序叢集 ,您可以在數據採礦設計師的 [ 採礦模型 查看器] 索引標籤中使用 [Microsoft時序叢集查看器] 加以探索。 Microsoft時序叢集查看器包含五個索引標籤:叢集圖表叢集配置檔叢集特性、叢集區分狀態轉換。 如需如何使用這個查看器的詳細資訊,請參閱 使用Microsoft時序叢集查看器流覽模型

叢集圖表分頁

[ 叢集圖表] 索引標籤會以圖形方式顯示資料庫中探索到演算法的叢集。 圖表中的佈局呈現叢集之間的關係,類似叢集緊密分組在一起。 根據預設,每個節點的陰影代表叢集中所有案例的密度:節點的陰影越暗,其包含的案例越多。 您可以變更節點底紋的意義,使其代表每個叢集內屬性和狀態的支援。

您也可以重新命名叢集,以便更輕鬆地識別和使用目標叢集。 在本教學課程中,您將重新命名具有太平洋地區客戶百分比最高的叢集,以及整體案例最多的叢集。

備註

當您重新處理模型時,指派給特定叢集的案例可能會變更,視數據和模型參數而定。 此外,如果您重新命名叢集,當您重新處理採礦模型時,名稱將會遺失。

變更用來強調叢集的屬性

  1. [底紋變數 ] 列表中,選取 [ 模型]。

  2. 狀態 列表中選取 單車帽

    此圖表會更新以顯示每個叢集中所選產品的濃度。 具有最深底紋的叢集包含自行車帽的最高密度。 您可以變更陰影變數,以使用任何輸入欄位的任何狀態。

  3. 遮蔽變數列表中,選取人口

    當您將陰影變數變更為人口時,圖表會更新以依大小比較叢集。 具有最深底紋的叢集包含比其他叢集更多的案例。

重新命名模型中的節點

  1. 將 [底紋變數] 變更為 Region,並將 [狀態] 設定為 [太平洋]。

  2. 突出顯示圖中最深色的節點。

  3. 以滑鼠右鍵按下此叢集,然後選取 [重新命名叢集]。

  4. 輸入 Pacific Cluster 。的名稱

  5. Shading Variable 的值變更為 Population

  6. 在更新的圖表中,找出最深的叢集,這應該是最大的叢集。 如果您無法透過底紋顯示哪一個叢集是最大的,請將滑鼠暫停在每個叢集上並檢視工具提示,然後選擇包含最多案例的叢集。

  7. 以滑鼠右鍵按下此叢集,然後選取 [重新命名叢集]。 輸入新名稱 Largest Cluster

您可以從代表叢集的節點鑽研,以檢視每個叢集中案例的詳細數據。 如果您想要對分析的結果採取動作,例如傳送電子郵件給客戶,這非常有用。 您也可以瀏覽結構中包含的案例的其他屬性,但未在模型中使用,例如 Region 和 IncomeGroup。 如需從採礦模型鑽研到基礎案例的詳細資訊,請參閱鑽研查詢(數據採礦)。

若要從叢集圖表鑽研至詳細數據

  1. 以滑鼠右鍵按一下 Pacific Cluster,選取 鑽研,然後選取 模型和結構資料行

    鑽研 對話框隨即開啟。 模型中未使用但可用於查詢的數據行前面會加上 Structure

    您可以看到此叢集主要包含來自太平洋地區的客戶,只有來自其他區域的少數客戶。

  2. 單擊巢狀數據行 v Assoc Seq Line Items 中的加號,以檢視特定客戶訂單中的項目順序。

  3. 關閉 鑽研 對話框。

    備註

    [ 播放] 按鈕可讓您重新查詢數據;不過,重新查詢不會變更所顯示的數據,除非模型已在背景中由一些其他進程動態更新。

回到頂端

叢集配置檔索引標籤

[ 叢集設定檔] 索引標籤會顯示每個叢集中的序列。 叢集會列在 [狀態 ] 資料行右邊的個別數據行中。

在查看器中, Model 數據列描述叢集中專案的整體分佈,而 Model.samples 數據列包含專案的序列。 Model.samples 數據列每個儲存格中的每一行色彩序列都代表叢集中隨機選取使用者的行為。

個別序列直方圖中的每個色彩都代表產品模型。 [採礦圖例] 會使用色彩編碼和產品型號名稱來顯示產品的序列。 如果您已將其他數據行新增至叢集模型,例如「區域」或「收入群組」,則檢視者會包含每個數據行的額外數據列,以顯示每個叢集內這些值的分佈。

若要檢視叢集中最常見的序列

  1. 以滑鼠右鍵按兩下叢集Largest Cluster資料列中的 [模型] 資料列,然後選取 [顯示圖例]。

    Color 資料行包含陰影列,表示序列中找到之項目的頻率。 每個項目都會以不同的色彩表示。 [意義] 資料行會列出每個色彩的產品型號名稱。 [ 分佈 ] 欄會告訴您序列中包含此項目之案例的百分比。

  2. 關閉 採礦傳奇

  3. 以滑鼠右鍵按兩下資料列中標題為 [母體擴展] 的Model.samples資料列,然後選取 [顯示圖例]。

  4. 掃描整體模型中的序列清單.

    採礦清單會先列出最常見的序列,因此您可以看到Mountain Tire Tube是許多序列中的第一個項目。 這意味著客戶很可能先把山輪胎管放在購物籃里。

從叢集檢視器深入查看案例

  1. 在 [屬性] 窗格中向下捲動,直到您找到 Region 屬性欄位為止。

    此數據列包含模型中每個叢集的直方圖,以及一個代表模型中使用的整個案例集的 總體直方圖。 直方圖是具有不同色彩的直方圖,其中每個色彩都代表屬性,而該屬性的彩色區段大小代表該屬性的案例百分比。

  2. 比較您重新命名的Pacific ClusterLargest Cluster叢集的直方圖。 每個叢集都會出現在不同的數據行中。

    兩者看起來都像純色,但色彩不同。

  3. 在數據 Region 列中,將滑鼠停留在彩色直方圖 Largest Cluster 上。

    工具提示會顯示每個區域實際案例的百分比值。

  4. 按右鍵按資料列中Region的彩色直方圖Pacific Cluster,選取 [鑽取],然後選取 [僅限模型欄]。

  5. 移動滾動條以檢閱此叢集中的所有客戶。

    同樣地,深入了解細節時,您可以看到這個叢集主要包含來自太平洋地區的訂單,但也有一些來自北美和歐洲地區的訂單。

  6. 關閉 鑽取 對話框。

回到頂端

叢集特性標籤

[ 叢集特性 ] 索引標籤會藉由顯示可視化方式代表所選叢集屬性值重要性的橫條,摘要說明叢集中狀態之間的轉換。 [變數] 欄位會告訴您模型認為對於選取的叢集或群體而言很重要的部分:特定值或值之間的關係,稱為過渡[值] 資料行提供有關值或轉換的詳細數據,而 Probability 數據行以可視化方式代表此屬性或轉換的權數。

若要檢視叢集的重要屬性

  1. 在 [ 叢集 ] 下拉式清單中,選取 Pacific Cluster

    清單會更新以顯示您重新命名 Pacific Cluster之叢集的特性。 在這裡叢集中,最重要的特性是 Region

  2. 將滑鼠停留在行中 Region 的陰影欄上。

    值為 Pacific 的機率很高。 如需如何解譯這些值的詳細資訊,請參閱 Microsoft時序群集演算法技術參考

  3. 查看叢集的特性清單,直到您找到第一個轉換列為止。

  4. 變數欄中包含文字 "轉換",並且在欄中包含某些循序屬性值的組合。 序列也可以包含起點和遺漏值。

    例如,假設轉換具有值 [Start] -> Road Tire Tube。 這表示此叢集中的客戶經常將 Road Tire Tube 放在購物籃中。 這可能表示產品是客戶先尋找的熱門專案,或可能只表示產品很容易在購買網站上找到。

  5. 捲動清單,直到您找到沒有 [開始]遺漏 的第一個轉換為止。

    例如,假設您找到過渡:Touring Tire、Touring Tire Tube。 這表示此叢集中的客戶經常以這個順序一起購買這些專案。

  6. 停留滑鼠於此轉換的陰影區域上。

    此轉換的機率會顯示為百分比。

  7. Cluster 下拉式清單中,選取 Population (All)

    屬性清單會更新,以顯示用來建立模型之所有訂單的特性。 在此採礦模型中,區分叢集的最重要特性是 Region,其值為 北美洲

檢閱這些工作之後,您就會發現兩件事。 第一個是您需要大量數據,才能取得有意義的組合數目。 例如,具有最高機率的序列可能會包含 [Start]Missing 狀態。

第二個是,Region 的屬性具有很強的叢集效果,因此更難看出序列的群組。 因此,您決定建立另一個只使用序列的模型,且不包含區域或收入的數據行。

回到頂端

叢集辨識標籤

[ 叢集辨識 ] 索引卷標可協助您比較兩個叢集,以判斷哪一個屬性會區分特定叢集與另一個叢集。 索引標籤包含四個數據行: 變數叢集 1 和叢集2。 您可以選擇任何叢集作為 叢集 1叢集 2 來使用。

Variables 欄位告訴您屬性的名稱,這名稱可以是欄位名稱,或是欄位名稱與文字轉換的結合。 [ 值] 資料行會顯示屬性或轉換的確切值。 叢集 1叢集 2 列中的陰影條表示您比較的叢集中的屬性強度。 長條越長,叢集就越可能包含具有該屬性的案例。

使用 [叢集辨識] 標籤來比較兩個叢集

  1. 在 [ 叢集辨識] 索引標籤的 [ 叢集 1] 中,選取 Pacific Cluster

    根據預設, [叢集 2 ] 的選取項目會變更為 [太平洋叢集的補充]。

    與所有其他案例區別 Pacific Cluster 的最上層屬性是區域。 區域是叢集的強屬性,因此會遮蔽其他屬性。 若要避免這種影響,請嘗試比較數個較小的叢集彼此。 當您這樣做時,屬性清單會變更,而且可能包含模型之間的更多轉換。

  2. 找出過渡列,並將滑鼠停留在陰影條上。

    資料列中的項目可以包括狀態和轉換。 每個項目的陰影顯示辨識分數。 若要深入瞭解不同分數的意義,請參閱時序群集模型的採礦模型內容(Analysis Services - 數據採礦)。

回到頂端

狀態轉換標籤頁

在 [ 狀態轉換 ] 索引標籤上,您可以選取叢集並瀏覽其狀態轉換。 如果您從叢集下拉式清單中選取 母體(全部),圖表會顯示整個採礦模型的狀態分佈。

圖形中的每個節點都代表您嘗試分析之序列的狀態或可能值。 節點的背景色彩代表該狀態的頻率。 線條會連接某些狀態,表示狀態之間的轉換。 您可以向上或向下移動滑桿,以變更轉換的機率閾值。 數位與某些節點相關聯,表示該狀態的機率。

要探索狀態轉換索引標籤中的關聯性

  1. 在 [採礦模型檢視器] 的 [ 狀態轉換 ] 索引標籤中,從叢集清單中選取 Pacific Cluster 。 確定已選取 [ 顯示邊緣卷標 ] 選項。

    圖表會更新以顯示此叢集中最常見的轉換。

  2. 單擊由線條連接到其他節點的任何節點。

    圖表會更新並醒目提示相關的節點。 行旁的數值表示轉換的機率。

  3. 將滑桿向上提高到 [所有連結],以增加圖形中包含的轉換數目。

  4. 選取 全體人口叢集

    請注意,當您載入不同的叢集時,圖表會重設為預設的顯示設定,因此滑桿控件會重設為中間位置。

  5. 按兩下圖形中最深的節點,其應該是 Sport-100

    請注意,此產品没有任何線路連接到其他產品。

  6. 將滑桿向上提高一個步驟,以增加圖表中包含的轉換數目。 不要直接前往所有連結

    圖表會藉由將更多轉換新增至圖形來更新,但不包含Sport-100模型。

  7. 將滑桿控件一路移至 [所有連結]。 請點擊 [Sport-100] 節點,如果尚未選取它。

    圖表會更新以顯示包含 Sport-100 產品的多次變化。 連接線上箭號的方向會告訴您是否選取了 Sport-100 專案做為第一個專案或配對中的第二個專案。

  8. 點擊 Touring Tire 的節點,然後將滑桿控件移回到中間位置。

    起初,有許多轉換線將 Touring Tire 連接到其他產品,但當您提高機率閾值時,可能性較小的轉換將從圖中移除,只留下 Touring Tire 到 Touring Tire Tube 的轉換。 這種轉換表示,如果客戶將Touring Tire 放入購物籃中,則客戶下一步將Touring Tire Tube放入購物籃的可能性很大。

回到頂端

一般內容樹狀結構檢視器

不論演算法或模型類型為何,此查看器都可用於所有模型。 MicrosoftGeneric 內容樹檢視器可從 [查看器] 下拉式清單中取得。

內容樹狀結構是以一系列節點表示的任何採礦模型,其中每個節點代表訓練數據的已學習知識。 節點可以包含模式、規則集、叢集,或共用某些屬性之日期範圍的定義。 節點的確切內容會根據演算法和可預測的屬性而有所不同,但內容的一般表示法相同。

您可以展開每個節點以查看詳細數據層級的增加,並將任何節點的內容複製到剪貼簿。 如需詳細資訊,請參閱 使用Microsoft泛型內容樹視圖器流覽模型

若要使用泛型內容樹視圖器檢視時序叢集模型的詳細數據

  1. 在 [ 採礦模型查看器] 索引標籤中,按兩下 [ 查看器 ] 列表,然後選取 [Microsoft一般內容樹視圖器]。

  2. 在 [ 節點標題 ] 窗格中,按下 Pacific Cluster (1)

    此節點的名稱包含您指派給叢集的易記名稱,以及基礎節點識別碼。 您可以使用節點識別子向下切入模型中的其他詳細數據。

  3. 展開第一個子節點,命名為叢集 1 的序列層級

    叢集的時序層級節點包含有關該叢集中之狀態和轉換的詳細數據。 您可以使用NODE_DISTRIBUTION數據行中提供的這些詳細數據,來探索每個叢集的序列和狀態,或一段時間的模型。

  4. 繼續展開節點,並在 HTML 查看器窗格中檢視詳細數據。

如需採礦模型內容的詳細資訊,以及如何在查看器中使用詳細數據,請參閱時序群集模型的採礦模型內容(Analysis Services - 數據採礦)。

回到頂端

課程中的下一個工作

建立相關的時序群集模型 (元數據採礦教學課程)

另請參閱

Microsoft時序群集演算法
時序群集模型查詢範例