共用方式為


建立交叉驗證報告

本主題會逐步引導您使用數據採礦設計師中的 [精確度圖表] 索引標籤來建立交叉驗證報告。 如需交叉驗證報告外觀及其包含的統計量值的一般資訊,請參閱交叉驗證(Analysis Services - 數據採礦)。

交叉驗證報告與精確度圖表基本不同,例如增益圖或分類矩陣。

  • 交叉驗證會評估模型或結構中使用的數據整體分佈;因此,您不會指定測試數據集。 交叉驗證一律只會使用用來定型模型或採礦結構的原始數據。

  • 交叉驗證只能針對單一可預測的結果執行。 如果 結構支援具有不同可預測屬性的模型,您必須為每個可預測輸出建立個別的報表。

  • 只有與目前選取結構相關的模型可供交叉驗證使用。

  • 如果目前選取的結構支援叢集和非叢集模型的組合,當您按兩下 [取得結果] 時,交叉驗證預存程式會自動載入具有相同預測數據行的模型,並忽略不共用相同可預測屬性的叢集模型。

  • 只有當採礦結構不支援任何其他可預測屬性,而叢集模型本身沒有可預測屬性時,您才能建立交叉驗證報告。

選取採礦結構

  1. 在 SQL Server Data Tools 中開啟數據採礦設計工具 (SSDT)。

  2. 在 [方案總管] 中,開啟包含您要建立報表之結構或模型的資料庫。

  3. 按兩下採礦結構,以在數據採礦設計師中開啟結構及其相關模型。

  4. 按一下 採礦精確度圖表 標籤。

  5. 按兩下 [ 交叉驗證] 索引標籤。

設定交叉驗證選項

  1. 在 [ 交叉驗證] 索引標籤的 [ 折疊計數] 中,按下向下箭號以選取介於 1 到 10 之間的數位。 預設值為 10。

    分區數代表將在原始數據集內建立的數據分割數。 如果您將 [折疊計數] 設定為 1,則會使用訓練集而不進行分割。

  2. 針對 [目標屬性],按兩下向下箭號,然後從清單中選取資料行。 如果模型是叢集模型,請選取 [#Cluster 來指出模型沒有可預測的屬性。 請注意,只有在採礦結構不支援其他類型的可預測屬性時,才能使用值 #Cluster

    每個報表只能選取一個可預測的屬性。 根據預設,報表中包含具有相同可預測屬性的所有相關模型。

  3. [最大案例] 中,輸入足夠大的數位,以在數據分割到指定的折疊數目時,提供代表性的數據樣本。 如果數位大於模型定型集中的案例計數,則會使用所有案例。

    如果定型數據集非常大,則設定 Max Cases 的值會限制已處理的案例總數,並讓報表更快完成。 不過,您不應該將 [最大案例 ] 設定為太低,或可能沒有足夠的數據進行交叉驗證。

  4. 選擇性地,針對 [目標狀態],輸入您想要建立模型的可預測屬性值。 例如,如果數據行 [Bike Buyer] 有兩個可能的值,1(是)和 2(否),您可以輸入值 1 來評估模型的正確性,以取得所需的結果。

    備註

    如果您未輸入值,則無法使用 [目標臨界值 ] 選項,而且模型會評估可預測屬性的所有可能值。

  5. 或者,針對 [目標臨界值],輸入介於 0 到 1 之間的十進位數,以指定預測必須計算為精確的最小機率。

    如需有關如何設定機率閾值的其他秘訣,請參閱 交叉驗證報告中的量值

  6. 按兩下 [取得結果]。

  1. [交叉驗證] 標籤上以滑鼠右鍵按一下已完成的報告。

  2. 在快捷方式功能表中,選取 [ 列印 ] 或 [ 列印預覽 ] 以先檢閱報表。

在 Microsoft Excel 中建立報表複本

  1. 以滑鼠右鍵按兩下 [交叉驗證] 索引標籤上已完成的報告。

  2. 在快捷方式功能表中,選取 [全選]。

  3. 以滑鼠右鍵按下選取的文字,然後選取 [ 複製]。

  4. 將選取範圍貼到開啟的 Excel 活頁簿中。 如果您使用 [貼上] 選項,報表會貼入 Excel 做為 HTML,以保留數據列和數據行格式。 如果您使用[貼上特殊]選項貼上文字或 Unicode 文字的報表,報表會以列分隔格式貼上。

另請參閱

交叉驗證報告中的量值