Udostępnij za pośrednictwem


Utwórz zestaw testowania (Kreator wyszukiwanie danych)

Użycie Utwórz zestaw testowania strona, aby określić, jaka część danych ma być używany do szkolenia i jaka ma być zarezerwowane do użytku jako zestaw testów.Oddzielanie danych na szkolenia i testowanie zestaw podczas tworzenia struktura wyszukiwania ułatwia znacznie oceny dokładność wyszukiwania modeli, które można tworzyć w przyszłości.

Można określić ilość danych, testowania, jako procent lub można określić numer, aby ograniczyć liczbę przypadków służą do testowania.Jeśli określony zostanie zarówno wartość procentową, jak i maksymalną liczbę przypadków, aby używać do testowania, oba ustawienia są używane i testowania zestaw danych zawiera mniejszą liczbę przypadków.Domyślnie 30 procent danych służy do testowania, 70 procent na szkolenia z zakresu, a istnieje maksymalna liczba przypadków testu.

Domyślnie Analysis Services generuje siewnego numeryczne, służące do rozpoczęcia partycjonowanie. To siewnego opiera się na nazwę struktura wyszukiwania.Chcąc upewnić się, że partycja pozostaje taki sam, nawet po zmianie nazwy struktura wyszukiwania, można określić wartość dla siewny, ustawiając właściwość HoldoutSeed struktura wyszukiwania.Jeśli zmienisz siewnego wstrzymanie ponownie przetworzyć struktury.

Jeśli chcesz później zmienić ilość danych szkolenia lub testowania, możesz zmodyfikować HoldoutMaxCases i HoldoutMaxPercent właściwości danych struktura wyszukiwania przy użyciu Właściwości okna.Ponownie, po dokonaniu zmiany użytkownik musi przetworzyć struktura wyszukiwania i wszystkie skojarzone wyszukiwania modeli.Również mają zastosowanie następujące ograniczenia:

  • Partycjonowanie danych struktura wyszukiwania jest obsługiwana tylko wtedy, gdy dane struktura wyszukiwania znajduje się w SQL Server 2008. Earlier versions of SQL Server Analysis Services do not support caching of partition information for mining structures.

  • Jeśli struktura wyszukiwania zawiera kolumna czas klucz, który jest wymagany w przypadku modeli wyszukiwania serii czas nie może podzielić struktura wyszukiwania.

  • Jeśli ma zostać dokonana prognoza wartości przechowywanych w tabela zagnieżdżonej nie partycji danych.

Aby uzyskać więcej informacji:Sprawdzanie poprawności modeli wyszukiwania danych (Analysis Services — wyszukiwanie danych), Tworzenie nowej struktura wyszukiwania, Podstawowe wyszukiwanie danych — samouczek

Opcje

  • Udział procentowy danych do testowania
    Kliknij przycisk w górę i niedziałający do strzałki, aby zwiększyć lub zmniejszyć wartość procentową dane mają być używane jako zestaw szkoleniowy lub w polu tekstowym wpisz wartość z przedziału od 0 do 100.

  • Maksymalna liczba przypadków przy testowaniu zestaw danych
    Wpisz liczbę, aby ograniczyć liczbę przypadków, w których można używać do testowania.

    Jeśli zostanie określony numer, który jest większy niż liczba przypadków rzeczywistych danych, będzie używana w przypadkach.

    Wartość domyślna jest równa NULL.Oznacza to brak limitu.