Udostępnij za pośrednictwem


SystemGetCrossValidationResults (Analysis Services - wyszukiwania danych)

Partycje struktura wyszukiwania do określonej liczby przekrój poprzeczny pociągów modelu dla każdej partycji, a następnie zwraca dokładność pomiarów dla każdej partycji.

Ostrzeżenie

Ta procedura składowana nie można użyć do cross-sprawdzanie poprawności modeli klastrów lub modeli utworzonych za pomocą Microsoft algorytm szeregu czasowego lub Microsoft sekwencji klastrowanie algorytmu.Do sprawdzania granic klastrowanie modeli, można użyć oddzielnej procedura składowana, SystemGetClusterCrossValidationResults (Analysis Services - wyszukiwania danych).

Składnia

SystemGetCrossValidationResults(
<mining structure>
[, <mining model list>]
,<fold count>
,<max cases>
,<target attribute>
[,<target state>]
[,<target threshold>]
[,<test list>])

Argumenty

  • mining structure
    Nazwa struktura wyszukiwania w bieżącej bazie danych.

    (wymagane)

  • mining model list
    Rozdzielana przecinkami lista modeli wyszukiwania do sprawdzania poprawności.

    Jeśli nazwa modelu zawiera znaki, które nie są prawidłowe w imieniu identyfikator, nazwę muszą być ujęte w nawiasy.

    Jeżeli nie określono listę modeli górnictwa, krzyżowe sprawdzanie poprawności jest przeprowadzana na podstawie wszystkich modeli skojarzone z określonej struktury, które zawierają przewidywalne atrybut.

    Ostrzeżenie

    Do sprawdzania granic klastrowanie modeli, należy użyć oddzielnej procedura składowana, SystemGetClusterCrossValidationResults (Analysis Services - wyszukiwania danych).

    (opcjonalnie)

  • fold count
    Liczba całkowita, która określa numer partycji, w którym do rozdzielenia zestaw danych.Wartość minimalna to 2.Maksymalna liczba zgięcia jest maximum integer lub liczba przypadków dolnym.

    Każda partycja będzie zawierać około to liczba przypadków: max cases/fold count.

    Nie ma wartości domyślnej.

    Ostrzeżenie

    Liczba zgięcia znacznie wpływa na czas wymagany do wykonania krzyżowe sprawdzanie poprawności.Jeśli wybierasz numer, który jest zbyt wysoka, kwerenda może działać bardzo długi czas, a w niektórych przypadkach serwer może przestać odpowiadać lub limit czasu.

    (wymagane)

  • max cases
    Liczba całkowita, która określa maksymalną liczbę przypadków, które mogą być badane przez wszystkie zgięcia.

    Wartość 0 wskazuje, że wszystkie przypadki dane źródło będą używane.

    Jeżeli określono wartość większą niż rzeczywista liczba przypadków zestaw danych wszystkich przypadkach danych źródło będą używane.

    Nie ma wartości domyślnej.

    (wymagane)

  • target attribute
    Ciąg zawierający nazwę atrybut przewidywalne.Przewidywalne atrybut może być kolumna, kolumna tabela zagnieżdżonej lub kolumnie klucz tabela zagnieżdżonej model wyszukiwania.

    Ostrzeżenie

    Istnienie atrybut miejsce docelowe jest sprawdzana tylko przy uruchomieniu czas.

    (wymagane)

  • target state
    Formułę, która określa wartość do przewidywania.Jeśli miejsce docelowe jest określona, metryki są zbierane tylko określoną wartość.

    Jeśli wartość nie została określona lub jest null, metryki są obliczane dla najbardziej prawdopodobnego stanu dla każdej przewidywanie.

    Wartością domyślną jest null.

    Określona wartość nie jest prawidłowa dla określonego atrybut lub formuła nie jest poprawny typ dla określonego atrybut, błąd jest wywoływane podczas sprawdzania poprawności.

    (opcjonalnie)

  • target threshold
    Double większa niż 0 i mniejsza niż 1.Wskazuje wynik minimalne prawdopodobieństwo uzyskanej przewidywanie Państwo określone miejsce docelowe jest liczone jako poprawne.

    Funkcja przewidywanie ma prawdopodobieństwa mniejsza niż wartość ta jest uważana za nieprawidłowe.

    Jeśli wartość nie została określona lub jest null, najbardziej prawdopodobnego stanu jest używany, niezależnie od jego wynik prawdopodobieństwo.

    Wartością domyślną jest null.

    Ostrzeżenie

    Usługi Analysis Servicesnie podniesie błąd, jeśli użytkownik zestaw state threshold do 0,0, ale nigdy nie należy używać wartości.W rezultacie próg 0.0 oznacza prognoz z 0% prawdopodobieństwa są liczone jako poprawne.

    (opcjonalnie)

  • test list
    Ciąg, który określa opcje badania.

    Uwaga tego parametru jest zarezerwowana do użytku w przyszłości.

    (opcjonalnie)

Zwracany typ

Zestaw wierszy, który jest zwracany zawiera wyniki dla każdej partycji w każdym modelu.

W poniższej tabela opisano kolumny w zestawie zestaw wierszy.

Nazwa kolumny

Opis

ModelName

Nazwa modelu, która została zbadana.

Nazwa_atrybutu

Nazwa przewidywalna kolumna.

AttributeState

Wartość miejsce docelowe określonego przewidywalna kolumna.Jeśli wartość ta jest null, najbardziej prawdopodobne przewidywanie użyto.

Jeśli kolumna zawiera wartości, dokładności modelu jest oceniane przeciwko tylko tę wartość.

PartitionIndex

1 Na podstawie indeksu identyfikującego partycji, które dotyczą wyniki.

PartitionSize

Liczba całkowita wskazująca liczbę przypadków zostały uwzględnione w każdej partycji.

Test

Kategoria test, który został wykonany.Opis kategorii i testów, które są zawarte w każdej kategorii, zobacz Raport sprawdzania poprawności krzyżowych (Analysis Services - wyszukiwania danych).

Miara

Nazwa miara zwracane przez badania.Środki dla każdego modelu zależą od typu wartości przewidywalne.Definicję każdego miara Sprawdzanie poprawności krzyżowych (Analysis Services - wyszukiwania danych).

Listę środków zwracane dla każdego typu przewidywalny, zobacz Raport sprawdzania poprawności krzyżowych (Analysis Services - wyszukiwania danych).

Wartość

Wartość miara badania.

Uwagi

Zwrócić dokładności metryki dla kompletny zestaw danych, SystemGetAccuracyResults (Analysis Services - wyszukiwania danych).

Jeśli model wyszukiwania ma już zostały podzielone na zgięcia, można pominąć przetwarzania i zwracają tylko wyniki krzyżowe sprawdzanie poprawności za pomocą SystemGetAccuracyResults (Analysis Services - wyszukiwania danych).

Przykłady

Poniższy przykład ilustruje sposób partycji struktura wyszukiwania do sprawdzania poprawności krzyżowe do dwóch zgięciach i badanie dwóch modeli wyszukiwania, skojarzonych z struktura wyszukiwania, [v Target Mail].

Trzech linii kodu wyświetla listę modeli wyszukiwania, które chcesz przetestować.Jeśli lista nie jest określony, wszystkie modele klastrowanie związane ze strukturą są używane.Czterech linii kodu określa liczbę partycji.Ponieważ nie określono wartości dla max cases, wszystkie przypadki, w struktura wyszukiwania są używane i równomiernie rozłożone na partycje.

Wiersz pięciu Określa atrybut przewidywalny, kupujący rowerów i sześciu linii określa wartość przewidywanie 1 (co oznacza "tak, zostanie Kup").

Wartość NULL w wierszu siedmiu wskazuje, że brak jest paska minimalne prawdopodobieństwo, muszą być spełnione.Dlatego pierwszym przewidywanie, zawierający prawdopodobieństwa zera będą używane oceny dokładności.

CALL SystemGetCrossValidationResults(
[v Target Mail],
[Target Mail DT], [Target Mail NB],
2,
'Bike Buyer',
1,
NULL
)

Przykładowe wyniki:

ModelName

Nazwa_atrybutu

AttributeState

PartitionIndex

PartitionSize

Test

Miara

Wartość

Poczta docelowej DT

Kupujący Bike

1

1

500

Klasyfikacja

Dodatnia wartość PRAWDA

144

Poczta docelowej DT

Kupujący Bike

1

1

500

Klasyfikacja

Fałszywie pozytywna

105

Poczta docelowej DT

Kupujący Bike

1

1

500

Klasyfikacja

Ujemna wartość PRAWDA

186

Poczta docelowej DT

Kupujący Bike

1

1

500

Klasyfikacja

Fałszywe negatywne

65

Poczta docelowej DT

Kupujący Bike

1

1

500

Prawdopodobieństwo

Wynik dziennika

-0.619042807138345

Poczta docelowej DT

Kupujący Bike

1

1

500

Prawdopodobieństwo

Winda

0.0740963734002671

Poczta docelowej DT

Kupujący Bike

1

1

500

Prawdopodobieństwo

Błąd średnia kwadratowa

0.346946279977653

Poczta docelowej DT

Kupujący Bike

1

2

500

Klasyfikacja

Dodatnia wartość PRAWDA

162

Poczta docelowej DT

Kupujący Bike

1

2

500

Klasyfikacja

Fałszywie pozytywna

86

Poczta docelowej DT

Kupujący Bike

1

2

500

Klasyfikacja

Ujemna wartość PRAWDA

165

Poczta docelowej DT

Kupujący Bike

1

2

500

Klasyfikacja

Fałszywe negatywne

87

Poczta docelowej DT

Kupujący Bike

1

2

500

Prawdopodobieństwo

Wynik dziennika

-0.654117781086519

Poczta docelowej DT

Kupujący Bike

1

2

500

Prawdopodobieństwo

Winda

0.038997399132084

Poczta docelowej DT

Kupujący Bike

1

2

500

Prawdopodobieństwo

Błąd średnia kwadratowa

0.342721344892651

Wymagania

Sprawdzanie poprawności krzyżowych jest dostępna tylko w SQL Server Enterprise począwszy od SQL Server 2008.