Artykuł
07/22/2011

SystemGetCrossValidationResults (Analysis Services - wyszukiwania danych)

Partycje struktura wyszukiwania do określonej liczby przekrój poprzeczny pociągów modelu dla każdej partycji, a następnie zwraca dokładność pomiarów dla każdej partycji.

Ostrzeżenie

Ta procedura składowana nie można użyć do cross-sprawdzanie poprawności modeli klastrów lub modeli utworzonych za pomocą Microsoft algorytm szeregu czasowego lub Microsoft sekwencji klastrowanie algorytmu.Do sprawdzania granic klastrowanie modeli, można użyć oddzielnej procedura składowana, SystemGetClusterCrossValidationResults (Analysis Services - wyszukiwania danych).

Składnia

SystemGetCrossValidationResults(
<mining structure>
[, <mining model list>]
,<fold count>
,<max cases>
,<target attribute>
[,<target state>]
[,<target threshold>]
[,<test list>])

Argumenty

mining structure
Nazwa struktura wyszukiwania w bieżącej bazie danych.

(wymagane)
mining model list
Rozdzielana przecinkami lista modeli wyszukiwania do sprawdzania poprawności.

Jeśli nazwa modelu zawiera znaki, które nie są prawidłowe w imieniu identyfikator, nazwę muszą być ujęte w nawiasy.

Jeżeli nie określono listę modeli górnictwa, krzyżowe sprawdzanie poprawności jest przeprowadzana na podstawie wszystkich modeli skojarzone z określonej struktury, które zawierają przewidywalne atrybut.

Ostrzeżenie

Do sprawdzania granic klastrowanie modeli, należy użyć oddzielnej procedura składowana, SystemGetClusterCrossValidationResults (Analysis Services - wyszukiwania danych).

(opcjonalnie)
fold count
Liczba całkowita, która określa numer partycji, w którym do rozdzielenia zestaw danych.Wartość minimalna to 2.Maksymalna liczba zgięcia jest maximum integer lub liczba przypadków dolnym.

Każda partycja będzie zawierać około to liczba przypadków: max cases/fold count.

Nie ma wartości domyślnej.

Ostrzeżenie

Liczba zgięcia znacznie wpływa na czas wymagany do wykonania krzyżowe sprawdzanie poprawności.Jeśli wybierasz numer, który jest zbyt wysoka, kwerenda może działać bardzo długi czas, a w niektórych przypadkach serwer może przestać odpowiadać lub limit czasu.

(wymagane)
max cases
Liczba całkowita, która określa maksymalną liczbę przypadków, które mogą być badane przez wszystkie zgięcia.

Wartość 0 wskazuje, że wszystkie przypadki dane źródło będą używane.

Jeżeli określono wartość większą niż rzeczywista liczba przypadków zestaw danych wszystkich przypadkach danych źródło będą używane.

Nie ma wartości domyślnej.

(wymagane)
target attribute
Ciąg zawierający nazwę atrybut przewidywalne.Przewidywalne atrybut może być kolumna, kolumna tabela zagnieżdżonej lub kolumnie klucz tabela zagnieżdżonej model wyszukiwania.

Ostrzeżenie

Istnienie atrybut miejsce docelowe jest sprawdzana tylko przy uruchomieniu czas.

(wymagane)
target state
Formułę, która określa wartość do przewidywania.Jeśli miejsce docelowe jest określona, metryki są zbierane tylko określoną wartość.

Jeśli wartość nie została określona lub jest null, metryki są obliczane dla najbardziej prawdopodobnego stanu dla każdej przewidywanie.

Wartością domyślną jest null.

Określona wartość nie jest prawidłowa dla określonego atrybut lub formuła nie jest poprawny typ dla określonego atrybut, błąd jest wywoływane podczas sprawdzania poprawności.

(opcjonalnie)
target threshold
Double większa niż 0 i mniejsza niż 1.Wskazuje wynik minimalne prawdopodobieństwo uzyskanej przewidywanie Państwo określone miejsce docelowe jest liczone jako poprawne.

Funkcja przewidywanie ma prawdopodobieństwa mniejsza niż wartość ta jest uważana za nieprawidłowe.

Jeśli wartość nie została określona lub jest null, najbardziej prawdopodobnego stanu jest używany, niezależnie od jego wynik prawdopodobieństwo.

Wartością domyślną jest null.

Ostrzeżenie

Usługi Analysis Servicesnie podniesie błąd, jeśli użytkownik zestaw state threshold do 0,0, ale nigdy nie należy używać wartości.W rezultacie próg 0.0 oznacza prognoz z 0% prawdopodobieństwa są liczone jako poprawne.

(opcjonalnie)
test list
Ciąg, który określa opcje badania.

Uwaga tego parametru jest zarezerwowana do użytku w przyszłości.

(opcjonalnie)

Zwracany typ

Zestaw wierszy, który jest zwracany zawiera wyniki dla każdej partycji w każdym modelu.

W poniższej tabela opisano kolumny w zestawie zestaw wierszy.

Nazwa kolumny	Opis
ModelName	Nazwa modelu, która została zbadana.
Nazwa_atrybutu	Nazwa przewidywalna kolumna.
AttributeState	Wartość miejsce docelowe określonego przewidywalna kolumna.Jeśli wartość ta jest null, najbardziej prawdopodobne przewidywanie użyto. Jeśli kolumna zawiera wartości, dokładności modelu jest oceniane przeciwko tylko tę wartość.
PartitionIndex	1 Na podstawie indeksu identyfikującego partycji, które dotyczą wyniki.
PartitionSize	Liczba całkowita wskazująca liczbę przypadków zostały uwzględnione w każdej partycji.
Test	Kategoria test, który został wykonany.Opis kategorii i testów, które są zawarte w każdej kategorii, zobacz Raport sprawdzania poprawności krzyżowych (Analysis Services - wyszukiwania danych).
Miara	Nazwa miara zwracane przez badania.Środki dla każdego modelu zależą od typu wartości przewidywalne.Definicję każdego miara Sprawdzanie poprawności krzyżowych (Analysis Services - wyszukiwania danych). Listę środków zwracane dla każdego typu przewidywalny, zobacz Raport sprawdzania poprawności krzyżowych (Analysis Services - wyszukiwania danych).
Wartość	Wartość miara badania.

Uwagi

Zwrócić dokładności metryki dla kompletny zestaw danych, SystemGetAccuracyResults (Analysis Services - wyszukiwania danych).

Jeśli model wyszukiwania ma już zostały podzielone na zgięcia, można pominąć przetwarzania i zwracają tylko wyniki krzyżowe sprawdzanie poprawności za pomocą SystemGetAccuracyResults (Analysis Services - wyszukiwania danych).

Przykłady

Poniższy przykład ilustruje sposób partycji struktura wyszukiwania do sprawdzania poprawności krzyżowe do dwóch zgięciach i badanie dwóch modeli wyszukiwania, skojarzonych z struktura wyszukiwania, [v Target Mail].

Trzech linii kodu wyświetla listę modeli wyszukiwania, które chcesz przetestować.Jeśli lista nie jest określony, wszystkie modele klastrowanie związane ze strukturą są używane.Czterech linii kodu określa liczbę partycji.Ponieważ nie określono wartości dla max cases, wszystkie przypadki, w struktura wyszukiwania są używane i równomiernie rozłożone na partycje.

Wiersz pięciu Określa atrybut przewidywalny, kupujący rowerów i sześciu linii określa wartość przewidywanie 1 (co oznacza "tak, zostanie Kup").

Wartość NULL w wierszu siedmiu wskazuje, że brak jest paska minimalne prawdopodobieństwo, muszą być spełnione.Dlatego pierwszym przewidywanie, zawierający prawdopodobieństwa zera będą używane oceny dokładności.

CALL SystemGetCrossValidationResults(
[v Target Mail],
[Target Mail DT], [Target Mail NB],
2,
'Bike Buyer',
1,
NULL
)

Przykładowe wyniki:

ModelName	Nazwa_atrybutu	AttributeState	PartitionIndex	PartitionSize	Test	Miara	Wartość
Poczta docelowej DT	Kupujący Bike	1	1	500	Klasyfikacja	Dodatnia wartość PRAWDA	144
Poczta docelowej DT	Kupujący Bike	1	1	500	Klasyfikacja	Fałszywie pozytywna	105
Poczta docelowej DT	Kupujący Bike	1	1	500	Klasyfikacja	Ujemna wartość PRAWDA	186
Poczta docelowej DT	Kupujący Bike	1	1	500	Klasyfikacja	Fałszywe negatywne	65
Poczta docelowej DT	Kupujący Bike	1	1	500	Prawdopodobieństwo	Wynik dziennika	-0.619042807138345
Poczta docelowej DT	Kupujący Bike	1	1	500	Prawdopodobieństwo	Winda	0.0740963734002671
Poczta docelowej DT	Kupujący Bike	1	1	500	Prawdopodobieństwo	Błąd średnia kwadratowa	0.346946279977653
Poczta docelowej DT	Kupujący Bike	1	2	500	Klasyfikacja	Dodatnia wartość PRAWDA	162
Poczta docelowej DT	Kupujący Bike	1	2	500	Klasyfikacja	Fałszywie pozytywna	86
Poczta docelowej DT	Kupujący Bike	1	2	500	Klasyfikacja	Ujemna wartość PRAWDA	165
Poczta docelowej DT	Kupujący Bike	1	2	500	Klasyfikacja	Fałszywe negatywne	87
Poczta docelowej DT	Kupujący Bike	1	2	500	Prawdopodobieństwo	Wynik dziennika	-0.654117781086519
Poczta docelowej DT	Kupujący Bike	1	2	500	Prawdopodobieństwo	Winda	0.038997399132084
Poczta docelowej DT	Kupujący Bike	1	2	500	Prawdopodobieństwo	Błąd średnia kwadratowa	0.342721344892651