SystemGetCrossValidationResults (Analysis Services - wyszukiwania danych)
Partycje struktura wyszukiwania do określonej liczby przekrój poprzeczny pociągów modelu dla każdej partycji, a następnie zwraca dokładność pomiarów dla każdej partycji.
Ostrzeżenie
Ta procedura składowana nie można użyć do cross-sprawdzanie poprawności modeli klastrów lub modeli utworzonych za pomocą Microsoft algorytm szeregu czasowego lub Microsoft sekwencji klastrowanie algorytmu.Do sprawdzania granic klastrowanie modeli, można użyć oddzielnej procedura składowana, SystemGetClusterCrossValidationResults (Analysis Services - wyszukiwania danych).
Składnia
SystemGetCrossValidationResults(
<mining structure>
[, <mining model list>]
,<fold count>
,<max cases>
,<target attribute>
[,<target state>]
[,<target threshold>]
[,<test list>])
Argumenty
mining structure
Nazwa struktura wyszukiwania w bieżącej bazie danych.(wymagane)
mining model list
Rozdzielana przecinkami lista modeli wyszukiwania do sprawdzania poprawności.Jeśli nazwa modelu zawiera znaki, które nie są prawidłowe w imieniu identyfikator, nazwę muszą być ujęte w nawiasy.
Jeżeli nie określono listę modeli górnictwa, krzyżowe sprawdzanie poprawności jest przeprowadzana na podstawie wszystkich modeli skojarzone z określonej struktury, które zawierają przewidywalne atrybut.
Ostrzeżenie
Do sprawdzania granic klastrowanie modeli, należy użyć oddzielnej procedura składowana, SystemGetClusterCrossValidationResults (Analysis Services - wyszukiwania danych).
(opcjonalnie)
fold count
Liczba całkowita, która określa numer partycji, w którym do rozdzielenia zestaw danych.Wartość minimalna to 2.Maksymalna liczba zgięcia jest maximum integer lub liczba przypadków dolnym.Każda partycja będzie zawierać około to liczba przypadków: max cases/fold count.
Nie ma wartości domyślnej.
Ostrzeżenie
Liczba zgięcia znacznie wpływa na czas wymagany do wykonania krzyżowe sprawdzanie poprawności.Jeśli wybierasz numer, który jest zbyt wysoka, kwerenda może działać bardzo długi czas, a w niektórych przypadkach serwer może przestać odpowiadać lub limit czasu.
(wymagane)
max cases
Liczba całkowita, która określa maksymalną liczbę przypadków, które mogą być badane przez wszystkie zgięcia.Wartość 0 wskazuje, że wszystkie przypadki dane źródło będą używane.
Jeżeli określono wartość większą niż rzeczywista liczba przypadków zestaw danych wszystkich przypadkach danych źródło będą używane.
Nie ma wartości domyślnej.
(wymagane)
target attribute
Ciąg zawierający nazwę atrybut przewidywalne.Przewidywalne atrybut może być kolumna, kolumna tabela zagnieżdżonej lub kolumnie klucz tabela zagnieżdżonej model wyszukiwania.Ostrzeżenie
Istnienie atrybut miejsce docelowe jest sprawdzana tylko przy uruchomieniu czas.
(wymagane)
target state
Formułę, która określa wartość do przewidywania.Jeśli miejsce docelowe jest określona, metryki są zbierane tylko określoną wartość.Jeśli wartość nie została określona lub jest null, metryki są obliczane dla najbardziej prawdopodobnego stanu dla każdej przewidywanie.
Wartością domyślną jest null.
Określona wartość nie jest prawidłowa dla określonego atrybut lub formuła nie jest poprawny typ dla określonego atrybut, błąd jest wywoływane podczas sprawdzania poprawności.
(opcjonalnie)
target threshold
Double większa niż 0 i mniejsza niż 1.Wskazuje wynik minimalne prawdopodobieństwo uzyskanej przewidywanie Państwo określone miejsce docelowe jest liczone jako poprawne.Funkcja przewidywanie ma prawdopodobieństwa mniejsza niż wartość ta jest uważana za nieprawidłowe.
Jeśli wartość nie została określona lub jest null, najbardziej prawdopodobnego stanu jest używany, niezależnie od jego wynik prawdopodobieństwo.
Wartością domyślną jest null.
Ostrzeżenie
Usługi Analysis Servicesnie podniesie błąd, jeśli użytkownik zestaw state threshold do 0,0, ale nigdy nie należy używać wartości.W rezultacie próg 0.0 oznacza prognoz z 0% prawdopodobieństwa są liczone jako poprawne.
(opcjonalnie)
test list
Ciąg, który określa opcje badania.Uwaga tego parametru jest zarezerwowana do użytku w przyszłości.
(opcjonalnie)
Zwracany typ
Zestaw wierszy, który jest zwracany zawiera wyniki dla każdej partycji w każdym modelu.
W poniższej tabela opisano kolumny w zestawie zestaw wierszy.
Nazwa kolumny |
Opis |
---|---|
ModelName |
Nazwa modelu, która została zbadana. |
Nazwa_atrybutu |
Nazwa przewidywalna kolumna. |
AttributeState |
Wartość miejsce docelowe określonego przewidywalna kolumna.Jeśli wartość ta jest null, najbardziej prawdopodobne przewidywanie użyto. Jeśli kolumna zawiera wartości, dokładności modelu jest oceniane przeciwko tylko tę wartość. |
PartitionIndex |
1 Na podstawie indeksu identyfikującego partycji, które dotyczą wyniki. |
PartitionSize |
Liczba całkowita wskazująca liczbę przypadków zostały uwzględnione w każdej partycji. |
Test |
Kategoria test, który został wykonany.Opis kategorii i testów, które są zawarte w każdej kategorii, zobacz Raport sprawdzania poprawności krzyżowych (Analysis Services - wyszukiwania danych). |
Miara |
Nazwa miara zwracane przez badania.Środki dla każdego modelu zależą od typu wartości przewidywalne.Definicję każdego miara Sprawdzanie poprawności krzyżowych (Analysis Services - wyszukiwania danych). Listę środków zwracane dla każdego typu przewidywalny, zobacz Raport sprawdzania poprawności krzyżowych (Analysis Services - wyszukiwania danych). |
Wartość |
Wartość miara badania. |
Uwagi
Zwrócić dokładności metryki dla kompletny zestaw danych, SystemGetAccuracyResults (Analysis Services - wyszukiwania danych).
Jeśli model wyszukiwania ma już zostały podzielone na zgięcia, można pominąć przetwarzania i zwracają tylko wyniki krzyżowe sprawdzanie poprawności za pomocą SystemGetAccuracyResults (Analysis Services - wyszukiwania danych).
Przykłady
Poniższy przykład ilustruje sposób partycji struktura wyszukiwania do sprawdzania poprawności krzyżowe do dwóch zgięciach i badanie dwóch modeli wyszukiwania, skojarzonych z struktura wyszukiwania, [v Target Mail].
Trzech linii kodu wyświetla listę modeli wyszukiwania, które chcesz przetestować.Jeśli lista nie jest określony, wszystkie modele klastrowanie związane ze strukturą są używane.Czterech linii kodu określa liczbę partycji.Ponieważ nie określono wartości dla max cases, wszystkie przypadki, w struktura wyszukiwania są używane i równomiernie rozłożone na partycje.
Wiersz pięciu Określa atrybut przewidywalny, kupujący rowerów i sześciu linii określa wartość przewidywanie 1 (co oznacza "tak, zostanie Kup").
Wartość NULL w wierszu siedmiu wskazuje, że brak jest paska minimalne prawdopodobieństwo, muszą być spełnione.Dlatego pierwszym przewidywanie, zawierający prawdopodobieństwa zera będą używane oceny dokładności.
CALL SystemGetCrossValidationResults(
[v Target Mail],
[Target Mail DT], [Target Mail NB],
2,
'Bike Buyer',
1,
NULL
)
Przykładowe wyniki:
ModelName |
Nazwa_atrybutu |
AttributeState |
PartitionIndex |
PartitionSize |
Test |
Miara |
Wartość |
---|---|---|---|---|---|---|---|
Poczta docelowej DT |
Kupujący Bike |
1 |
1 |
500 |
Klasyfikacja |
Dodatnia wartość PRAWDA |
144 |
Poczta docelowej DT |
Kupujący Bike |
1 |
1 |
500 |
Klasyfikacja |
Fałszywie pozytywna |
105 |
Poczta docelowej DT |
Kupujący Bike |
1 |
1 |
500 |
Klasyfikacja |
Ujemna wartość PRAWDA |
186 |
Poczta docelowej DT |
Kupujący Bike |
1 |
1 |
500 |
Klasyfikacja |
Fałszywe negatywne |
65 |
Poczta docelowej DT |
Kupujący Bike |
1 |
1 |
500 |
Prawdopodobieństwo |
Wynik dziennika |
-0.619042807138345 |
Poczta docelowej DT |
Kupujący Bike |
1 |
1 |
500 |
Prawdopodobieństwo |
Winda |
0.0740963734002671 |
Poczta docelowej DT |
Kupujący Bike |
1 |
1 |
500 |
Prawdopodobieństwo |
Błąd średnia kwadratowa |
0.346946279977653 |
Poczta docelowej DT |
Kupujący Bike |
1 |
2 |
500 |
Klasyfikacja |
Dodatnia wartość PRAWDA |
162 |
Poczta docelowej DT |
Kupujący Bike |
1 |
2 |
500 |
Klasyfikacja |
Fałszywie pozytywna |
86 |
Poczta docelowej DT |
Kupujący Bike |
1 |
2 |
500 |
Klasyfikacja |
Ujemna wartość PRAWDA |
165 |
Poczta docelowej DT |
Kupujący Bike |
1 |
2 |
500 |
Klasyfikacja |
Fałszywe negatywne |
87 |
Poczta docelowej DT |
Kupujący Bike |
1 |
2 |
500 |
Prawdopodobieństwo |
Wynik dziennika |
-0.654117781086519 |
Poczta docelowej DT |
Kupujący Bike |
1 |
2 |
500 |
Prawdopodobieństwo |
Winda |
0.038997399132084 |
Poczta docelowej DT |
Kupujący Bike |
1 |
2 |
500 |
Prawdopodobieństwo |
Błąd średnia kwadratowa |
0.342721344892651 |
Wymagania
Sprawdzanie poprawności krzyżowych jest dostępna tylko w SQL Server Enterprise począwszy od SQL Server 2008.
Zobacz także