Udostępnij za pośrednictwem


SystemGetCrossValidationResults (Analysis Services — wyszukiwanie danych)

Partycje struktura wyszukiwania do określonej liczby przekrój poprzeczny, przygotowuje modelu dla każdej partycji, a następnie zwraca dokładności metryki dla każdej partycji.

Uwaga

Nie można użyć tej procedura przechowywana krzyżyk poprawności modeli klastrów lub modele, które są wbudowane przy użyciu Microsoft Algorytm seria czas lub Microsoft Algorytm klastrowanie sekwencji. Aby krzyżyk poprawność modeli klastrów, można użyć oddzielnej procedura przechowywana SystemGetClusterCrossValidationResults (Analysis Services — wyszukiwanie danych).

SystemGetCrossValidationResults(
<mining structure>
[, <mining model list>]
,<fold count>
,<max cases>
,<target attribute>
[,<target state>]
[,<target threshold>]
[,<test list>])

Argumenty

  • mining structure
    Nazwa struktura wyszukiwania w bieżącej bazie danych.

    (wymagane)

  • mining model list
    Rozdzielana przecinkami lista modeli wyszukiwania do sprawdzania poprawności.

    Jeśli nazwa modelu zawiera znaki, których nie są prawidłowe w imieniu identyfikator, nazwę muszą być ujęte w nawiasy.

    Jeśli lista modeli wyszukiwania nie zostanie określona, krzyżyk-sprawdzanie poprawności jest wykonywane dla wszystkich modeli, które są skojarzone z określoną strukturą, które zawierają przewidywalne atrybut.

    Uwaga

    Aby krzyżyk poprawność modeli klastrów, należy użyć oddzielnej procedura przechowywana SystemGetClusterCrossValidationResults (Analysis Services — wyszukiwanie danych).

    (opcjonalnie)

  • fold count
    Liczba całkowita, która określa numer partycji, w którym do rozdzielenia zestaw danych.Wartość minimalna to 2.Maksymalna liczba zgięcia wynosi maximum integer lub liczba przypadków, zależnie od tego, który jest niższa.

    Każda partycja będzie zawierał mniej więcej fizycznemu to liczbę przypadków: max cases/fold count.

    Brak wartości domyślnej.

    Uwaga

    Liczba zgięcia znacznie wpływa na czas wymagany do sprawdzenia krzyżowe sprawdzanie poprawności.Jeśli wybierasz numer, który jest zbyt wysoka, kwerenda może być uruchamiana przez bardzo długi czas, a w niektórych przypadkach serwer może przestać odpowiadać lub limitu czasu.

    (wymagane)

  • max cases
    Liczba całkowita, która określa maksymalną liczbę przypadków, które mogą być badane przez wszystkie zgięcia.

    Wartość 0 wskazuje, że wszystkie przypadki, w danych urządzenie źródłowe będą używane.

    Jeżeli określono wartość, która jest większa niż rzeczywista liczba przypadków zestaw danych, wszystkie przypadki, w danych urządzenie źródłowe będą używane.

    Brak wartości domyślnej.

    (wymagane)

  • target attribute
    Ciąg, który zawiera nazwę atrybut przewidywalne.Atrybut przewidywalne może być kolumny, kolumna w tabela zagnieżdżonej lub kolumnę klucz w tabela zagnieżdżonej model wyszukiwania.

    Uwaga

    Istnienie atrybut docelowego jest sprawdzana tylko przy uruchomieniu czas.

    (wymagane)

  • target state
    Formuły, która określa wartość do przewidywania.Jeżeli określono wartość docelową, metryki są zbierane tylko określonej wartości.

    Jeśli wartość nie została określona lub jest null, metryki są obliczane dla najbardziej prawdopodobne stanu dla każdego przewidywanie.

    Wartość domyślna to null.

    Błąd jest wywoływane podczas sprawdzania poprawności, jeśli podana wartość nie jest prawidłowy dla określonego atrybut, lub jeśli formuła nie jest poprawnego typu dla określonego atrybut.

    (opcjonalnie)

  • target threshold
    Double większa niż 0 i mniejsza niż 1.Wskazuje wynik prawdopodobieństwo minimalne, które muszą być pobrane do przewidywanie stanu określony obiekt miejsce docelowe do zliczania jako poprawne.

    przewidywanie zawierający prawdopodobieństwo mniejsza lub równa tej wartości jest uważany za nieprawidłowe.

    Jeśli wartość nie została określona lub jest null, używany jest najbardziej prawdopodobne stanu, niezależnie od jej wynik prawdopodobieństwa.

    Wartość domyślna to null.

    Uwaga

    Analysis Services nie będzie podnieść błąd, jeśli ustawisz state threshold Aby 0.0 ale nigdy nie należy używać tej wartości. W efekcie próg 0.0 oznacza, że prognoz z prawdopodobieństwem 0 procent są liczone jako poprawne.

    (opcjonalnie)

  • test list
    Ciąg, który określa opcje testowania.

    Uwaga   Ten parametr jest zarezerwowana do wykorzystania w przyszłości.

    (opcjonalnie)

Zwracany typ

Zestaw wierszy, która jest zwracana zawiera wyniki dla każdej partycji w każdym modelu.

W poniższej tabela opisano kolumny w zestawie zestaw wierszy.

Nazwa kolumna

Description

ModelName

Nazwa modelu, który został przetestowany.

Nazwa_atrybutu

Nazwa przewidywalna kolumna.

AttributeState

Wartość określone miejsce docelowe kolumna przewidywalne.Jeśli ta wartość jest null, użyto w najbardziej prawdopodobnym przewidywanie.

Jeśli ta kolumna zawiera wartość, dokładność modelu jest oceniane przed tylko tę wartość.

PartitionIndex

Zastosowanie indeksu opartego na 1, identyfikujący, do której partycji wyniki.

PartitionSize

Liczba całkowita, która wskazuje liczbę przypadków zostały uwzględnione w każdej partycji.

Test

Kategoria test, która została wykonana.Aby uzyskać opis kategorii i testy, które znajdują się w każdej kategorii Zobacz Raport sprawdzania poprawności między (Analysis Services — wyszukiwanie danych).

Miara

Nazwa miara, zwracane przez test.Środki, dla każdego modelu, zależą od typu wartości przewidywalne.Aby uzyskać definicję każdej miara zobacz krzyżowe sprawdzanie poprawności (Analysis Services — wyszukiwanie danych).

Aby uzyskać listę zwrócone dla każdego typu przewidywalne działania Zobacz Raport sprawdzania poprawności między (Analysis Services — wyszukiwanie danych).

Wartość

Wartość miara określonego testu.

Remarks

Aby zwrócić dokładności metryki dla kompletny zestaw danych, należy użyć SystemGetAccuracyResults (Analysis Services — wyszukiwanie danych).

Jeśli już model wyszukiwania jest podzielony na partycje w zgięcia, można pominąć przetwarzania i zwracają tylko wyniki krzyżowe sprawdzanie poprawności przy użyciu SystemGetAccuracyResults (Analysis Services — wyszukiwanie danych).

Przykłady

Poniższy przykład ilustruje sposób partycji struktura wyszukiwania do sprawdzania krzyżowe sprawdzanie poprawności w dwóch zgięciach, a następnie przetestować dwóch modeli wyszukiwania związanych ze strukturą wyszukiwania [v Target Mail].

Wiersz z listy Kod trzy modele wyszukiwania, które chcesz przetestować.Jeśli na liście nie zostanie określony, używane są skojarzone ze strukturą wszystkich modeli bez klastrowanie.Czterech linii kodu określa liczbę partycji.Ponieważ nie określono wartości dla max cases, wszystkich przypadkach w strukturze wyszukiwania są używane i równomiernie rozłożone na partycje.

Wiersz pięciu Określa atrybut przewidywalny, nabywca Bike i wiersz sześciu określa wartość do przewidywania, 1 (co oznacza, "tak, będzie kupić „).

Wartość NULL w wierszu siedmiu wskazuje, że brak jest paska minimalne prawdopodobieństwo muszą być spełnione.W związku z tym pierwsze przewidywanie, zawierający prawdopodobieństwo zera będą używane przy ocenie dokładności.

CALL SystemGetCrossValidationResults(
[v Target Mail],
[Target Mail DT], [Target Mail NB],
2,
'Bike Buyer',
1,
NULL
)

Przykładowe wyniki:

ModelName

Nazwa_atrybutu

AttributeState

PartitionIndex

PartitionSize

Test

Miara

Wartość

Poczta miejsce docelowe DT

Rower kupujących

1

1

500

Klasyfikacja

Dodatnia wartość true

144

Poczta miejsce docelowe DT

Rower kupujących

1

1

500

Klasyfikacja

Fałszywie dodatnie.

105

Poczta miejsce docelowe DT

Rower kupujących

1

1

500

Klasyfikacja

Ujemna wartość true

186

Poczta miejsce docelowe DT

Rower kupujących

1

1

500

Klasyfikacja

Ujemna wartość false

65

Poczta miejsce docelowe DT

Rower kupujących

1

1

500

Prawdopodobieństwo

Wynik dziennika

-0.619042807138345

Poczta miejsce docelowe DT

Rower kupujących

1

1

500

Prawdopodobieństwo

Podnieś

0.0740963734002671

Poczta miejsce docelowe DT

Rower kupujących

1

1

500

Prawdopodobieństwo

Błąd główny średniej kwadrat

0.346946279977653

Poczta miejsce docelowe DT

Rower kupujących

1

2

500

Klasyfikacja

Dodatnia wartość true

162

Poczta miejsce docelowe DT

Rower kupujących

1

2

500

Klasyfikacja

Fałszywie dodatnie.

86

Poczta miejsce docelowe DT

Rower kupujących

1

2

500

Klasyfikacja

Ujemna wartość true

165

Poczta miejsce docelowe DT

Rower kupujących

1

2

500

Klasyfikacja

Ujemna wartość false

87

Poczta miejsce docelowe DT

Rower kupujących

1

2

500

Prawdopodobieństwo

Wynik dziennika

-0.654117781086519

Poczta miejsce docelowe DT

Rower kupujących

1

2

500

Prawdopodobieństwo

Podnieś

0.038997399132084

Poczta miejsce docelowe DT

Rower kupujących

1

2

500

Prawdopodobieństwo

Błąd główny średniej kwadrat

0.342721344892651

Requirements

Sprawdzanie poprawności między jest dostępna tylko w SQL Server 2008 Enterprise.