SystemGetClusterCrossValidationResults (Analysis Services - 數據採礦)
適用於: SQL Server 2019 和舊版 Analysis Services Azure Analysis Services Fabric/Power BI Premium
重要
SQL Server 2017 Analysis Services 中已淘汰數據採礦,現在已在 SQL Server 2022 Analysis Services 中停止。 檔不會更新為已淘汰和已停止的功能。 若要深入瞭解,請參閱 Analysis Services 回溯相容性。
將採礦結構分割成指定的交叉區段數目、為每個分割區定型模型,然後傳回每個分割區的精確度計量。
附註 此預存程式只能與包含至少一個叢集模型的採礦結構搭配使用。 若要交叉驗證非叢集模型,您必須使用 SystemGetCrossValidationResults (Analysis Services - 數據採礦)。
語法
SystemGetClusterCrossValidationResults(
<structure name>,
[,<mining model list>]
,<fold count>}
,<max cases>
<test list>])
參數
採礦結構
目前資料庫中採礦結構的名稱。
(必要)
採礦模型清單
要驗證的採礦模型逗號分隔清單。
如果未指定採礦模型清單,則會針對與指定結構相關聯的所有叢集模型執行交叉驗證。
注意
若要交叉驗證不是叢集模型的模型,您必須使用不同的預存程式,SystemGetCrossValidationResults (Analysis Services - 數據採礦)。
(選擇性)
折疊計數
整數,指定要分隔數據集的數據分割數目。 最小值為 2。 折疊數目上限 最大整數 或大小寫數目,以較低者為準。
每個分割區大約會包含此案例數目:最大案例/折數。
沒有預設值。
注意
折疊數目嚴重影響執行交叉驗證所需的時間。 如果您選取的數位太高,查詢可能會長時間執行,而在某些情況下,伺服器可能會變得沒有回應或逾時。
(必要)
最大案例
整數,指定可以測試的案例數目上限。
值為 0 表示將使用數據源中的所有案例。
如果您指定的數位高於數據集中實際案例數目,則會使用數據源中的所有案例。
(必要)
測試清單
指定測試選項的字串。
注意 此參數保留供日後使用。
(選擇性)
傳回類型
傳回型別數據表包含每個個別分割區的分數,以及所有模型的匯總。
下表描述傳回的數據行。
數據行名稱 | 描述 |
---|---|
ModelName | 已測試之模型的名稱。 |
AttributeName | 可預測數據行的名稱。 針對叢集模型,一律 null。 |
AttributeState | 可預測數據列中的指定目標值。 針對叢集模型,一律 null。 |
PartitionIndex | 以 1 為基礎的索引,可識別套用結果的數據分割。 |
PartitionSize | 整數,指出每個分割區包含多少個案例。 |
測試 | 已執行的測試類型。 |
量 | 測試所傳回之量值的名稱。 每個模型的量值取決於可預測的值類型。 如需每個量值的定義,請參閱 交叉驗證(Analysis Services - 資料採礦)。 如需針對每個可預測類型傳回的量值清單,請參閱交叉驗證報表中的 量值。 |
價值 | 指定之測試量值的值。 |
言論
若要傳回整個數據集的精確度計量,請使用 SystemGetClusterAccuracyResults (Analysis Services - 數據採礦)。
此外,如果採礦模型已分割成折疊,您可以使用 SystemGetClusterAccuracyResults (Analysis Services - 數據採礦),略過處理並只傳回交叉驗證的結果。
例子
下列範例示範如何將採礦結構分割成三個折疊,然後測試兩個與採礦結構相關聯的群集模型。
程序代碼的第三行會列出您想要測試的特定採礦模型。 如果您未指定清單,則會使用與 結構相關聯的所有叢集模型。
程序代碼的第四行會指定折疊數,而第五行則指定要使用的案例數目上限。
因為這些是叢集模型,因此您不需要指定可預測的屬性或值。
CALL SystemGetClusterCrossValidationResults(
[v Target Mail],
[Cluster 1], [Cluster 2],
3,
10000
)
範例結果:
ModelName | AttributeName | AttributeState | PartitionIndex | PartitionSize | 測試 | 量 | 價值 |
---|---|---|---|---|---|---|---|
叢集 1 | 1 | 3025 | 聚類 | 案例可能性 | 0.930524511864121 | ||
叢集 1 | 2 | 3025 | 聚類 | 案例可能性 | 0.919184178430778 | ||
叢集 1 | 3 | 3024 | 聚類 | 案例可能性 | 0.929651120490248 | ||
叢集 2 | 1 | 1289 | 聚類 | 案例可能性 | 0.922789726933607 | ||
叢集 2 | 2 | 1288 | 聚類 | 案例可能性 | 0.934865535691068 | ||
叢集 2 | 3 | 1288 | 聚類 | 案例可能性 | 0.924724595688798 |
要求
交叉驗證僅適用於從 SQL Server 2008 開始的 SQL Server Enterprise。
另請參閱
SystemGetCrossValidationResults (Analysis Services - 數據採礦)
SystemGetAccuracyResults (Analysis Services - 數據採礦)
SystemGetClusterCrossValidationResults
SystemGetClusterAccuracyResults (Analysis Services - 數據採礦)
意見反應
https://aka.ms/ContentUserFeedback。
即將登場:在 2024 年,我們將逐步淘汰 GitHub 問題作為內容的意見反應機制,並將它取代為新的意見反應系統。 如需詳細資訊,請參閱:提交並檢視相關的意見反應