Udostępnij za pośrednictwem


TWORZENIE struktura wyszukiwania (DMX)

Tworzy nową struktura wyszukiwania w bazie danych i opcjonalnie określa szkolenia i testowanie partycji.Po utworzeniu struktura wyszukiwania, można użyć ZMIENIA struktura wyszukiwania (DMX) Instrukcja dodawać modele do struktura wyszukiwania.

CREATE [SESSION] MINING STRUCTURE <structure>
(
    [(<column definition list>)]
)
[WITH HOLDOUT (<holdout-specifier> [OR <holdout-specifier>])]
[REPEATABLE(<holdout seed>)]
<holdout-specifier>::=  <holdout-maxpercent> PERCENT | <holdout-maxcases> CASES

Argumenty

  • structure
    Unikatowa nazwa struktury.

  • column definition list
    Rozdzielana przecinkami lista kolumna definicje.

  • holdout-maxpercent
    Liczba całkowita z przedziału od 1 do 100, który wskazuje procent danych do zestaw przeznaczonych do testowania.

  • holdout-maxcases
    Liczba całkowita, która wskazuje maksymalną liczbę przypadków, aby używać do testowania.

    Jeśli wartość określona w przypadkach, maksymalna liczba jest większa niż liczba przypadków wejściowego, wszystkich przypadkach wejściowe są używane do testowania, a zwiększony ostrzeżenie.

    Uwaga

    Jeżeli określono wartość procentową i maksymalna liczba przypadków, jest używane mniejsze z dwiema granicami.

  • holdout seed
    Liczba całkowita, używane jako siewnego uruchomić partycjonowanie danych.

    Jeśli zestaw na 0, mieszanie IDENTYFIKATORA struktura wyszukiwania jest używana jako siewnego.

    Uwaga

    Należy określić siewnego, jeśli należy upewnić się, bez partycji.

    Wartość domyślna: REPEATABLE(0)

Remarks

Aby zdefiniować struktura wyszukiwania określanie listy kolumn, opcjonalnie określić relacje hierarchiczne między kolumnami, a następnie opcjonalnie dzielony struktura wyszukiwania na szkolenie i testów zestawów danych.

Opcjonalne słowa kluczowego sesja oznacza, że struktura tymczasowej struktury, których można używać tylko na czas bieżącej sesja.Gdy sesja zostanie zakończona, struktury i żadnych modeli, oparty na strukturze, zostaną usunięte.Aby utworzyć tymczasowy górnictwo struktur i modeli, musisz najpierw zestaw właściwość bazy danych AllowSessionMiningModels. Aby uzyskać więcej informacji zobaczData Mining Properties.

Lista definicji kolumna

Można zdefiniować struktura wyszukiwania dołączając następujące informacje dla każdej kolumna na liście Definicja kolumn:

  • Nazwa (obowiązkowe)

  • Typ danych (obowiązkowe)

  • Rozkład

  • Lista modelowania flag

  • Typ zawartości (obowiązkowe)

  • Relacje z kolumną atrybut (obowiązkowe tylko wtedy, gdy dotyczy), wskazywany przez klauzulę powiązane

Określenie jednej kolumnie, należy użyć następującej składni dla listy definicji kolumna:

<column name>    <data type>    [<Distribution>]    [<Modeling Flags>]    <Content Type>    [<column relationship>]

Aby zdefiniować kolumna zagnieżdżonej tabela, należy użyć następującej składni dla listy definicji kolumna:

<column name>    TABLE    ( <column definition list> )

Aby wyświetlić listę typów danych typów zawartości, podział kolumna, a flagi modelowania, które można użyć do zdefiniowania kolumna struktury, zobacz następujące tematy:

Istnieje możliwość zdefiniowania wielu modelowania flagi wartości kolumna.Jednakże może istnieć tylko jeden typ zawartości i jednego typu danych dla kolumna.

Relacje kolumna

You can add a clause to any column definition statement to describe the relationship between two columns.Analysis Services supports the use of the following <column relationship> clause.

  • RELATED TO
    Wskazuje wartość hierarchii.miejsce docelowe kolumna powiązane z może być kolumna klucz w tabela zagnieżdżonej, indywidualnie wartości kolumna przypadek wiersza lub innej kolumna z powiązanych z klauzula, co oznacza więcej hierarchii.

Parametry wstrzymanie

Po określeniu parametrów wstrzymanie tworzenia struktury danych partycji.Kwota jaką można określić dla wstrzymanie jest zarezerwowana do testowania, a pozostałe dane są używane na szkolenia z zakresu.Domyślnie, jeśli utworzono struktura wyszukiwania przy użyciu Business Intelligence Development Studio, partycja wstrzymanie tworzony jest zawierający 30 procent, testowanie i 70 procent szkolenia danych. Aby uzyskać więcej informacji zobaczPartycjonowanie danych do szkolenia i testowanie zestawy (Analysis Services — wyszukiwanie danych).

Tworząc struktura wyszukiwania przy użyciu rozszerzenia wyszukiwanie danych (DMX), należy ręcznie określić, że można utworzyć partycji wstrzymanie.

Uwaga

The ALTER MINING STRUCTURE instrukcja does not support wstrzymanie.

Można określić do trzech wstrzymanie parametrów.Jeżeli określono wartość procentową wstrzymanie i maksymalną liczbę przypadków wstrzymanie procent przypadków są zarezerwowane do momentu osiągnięcia limitu maksymalnego przypadkach.Określ wartość procentową wstrzymanie jako liczba całkowita następuje PERCENT słowo kluczowe i określić maksymalną liczbę przypadków, jako liczba całkowita następuje CASES słowo kluczowe. Można łączyć warunki określone w dowolnej kolejności, jak pokazano w poniższych przykładach:

WITH HOLDOUT (20 PERCENT) 
WITH HOLDOUT (2000 CASES) 
WITH HOLDOUT (20 PERCENT OR 2000 CASES) 
WITH HOLDOUT (2000 CASES OR 20 PERCENT)

Siewnego wstrzymanie określa rozpoczęcie procesu, który losowo przypisuje przypadkach albo szkolenia lub testów zestawów danych.Ustawiając siewnego wstrzymanie, można zapewnić partycja może być powtarzane.Jeśli nie określisz siewnego wstrzymanie, Analysis Services używa nazwy struktura wyszukiwania do utworzenia siewnego. Jeśli zmienisz struktury zmieni się wartość początkową.Parametr siewnego wstrzymanie można używać z jedną lub obie z innymi parametrami wstrzymanie.

Uwaga

Ponieważ informacje o partycjach pamięci podręcznej z danymi, szkolenia, aby użyć wstrzymanie, należy się upewnić, że CacheMode Właściwość struktura wyszukiwania jest ustawiona na KeepTrainingData. Jest to ustawienie domyślne w Analysis Services dla nowych struktur wyszukiwania. Zmiana CacheMode Właściwość ClearTrainingCases na strukturze wyszukiwania, który zawiera wstrzymanie partycji nie ma wpływu na żadnych modeli wyszukiwania, które zostały przetworzone. Jednak jeśli MiningStructureCacheMode nie jest zestaw do KeepTrainingData, parametry wstrzymanie nie będzie miało żadnego efektu. Oznacza to, że wszystkie dane źródłowe, które będą używane dla szkolenia i zestaw testów nie będzie dostępny.Definicja partycji jest buforowany ze strukturą; wyczyszczenie pamięci podręcznej przypadków szkolenia, można także wyczyścić pamięć podręczną dane testowe i definicji zestaw wstrzymanie.

Przykłady

W poniższych przykładach pokazano sposób tworzenia struktura wyszukiwania z wstrzymanie przy użyciu DMX.

Przykład 1: Dodawanie struktury z nie szkolenia zestaw

Poniższy przykład tworzy nową struktura wyszukiwania o nazwie New Mailing bez tworzenia żadnych modeli skojarzone wyszukiwania i bez użycia wstrzymanie. Aby dowiedzieć się, jak dodawać do struktury model wyszukiwania, zobacz ZMIENIA struktura wyszukiwania (DMX).

CREATE MINING STRUCTURE [New Mailing]
(
    CustomerKey LONG KEY, 
    Gender TEXT DISCRETE,
    [Number Cars Owned] LONG DISCRETE,
    [Bike Buyer] LONG DISCRETE 
)

Przykład 2: Określając procent wstrzymanie i początkowy

Następująca klauzula mogą być dodawane po listy definicji kolumna, aby zdefiniować zestaw danych, które mogą być używane do testowania wszystkich modeli wyszukiwania skojarzonych z struktura wyszukiwania.Instrukcja spowoduje utworzenie zestaw testów, który wynosi 25 procent całkowitej przypadkach wejściowy bez limitu maksymalnej liczby przypadków.5000 jest używany jako siewnego do tworzenia partycji.Po określeniu siewnego przypadkach te same zostanie wybrany na badania każdego czas struktura wyszukiwania są przetwarzane, dopóki nie powoduje zmian w danych źródłowych.

CREATE MINING STRUCTURE [New Mailing]
(
    CustomerKey LONG KEY, 
    Gender TEXT DISCRETE,
    [Number Cars Owned] LONG DISCRETE,
    [Bike Buyer] LONG DISCRETE 
) 
WITH HOLDOUT(25 PERCENT) REPEATABLE(5000)

Przykład 3: Określając procent wstrzymanie i maksymalna liczba spraw

Następująca klauzula spowoduje utworzenie zestaw test, który zawiera 25 procent całkowitej przypadkach wejściowy lub 2000 przypadkach, w zależności od tego, która jest mniejsza.Ponieważ 0 jest określony jako siewnego, nazwa struktura wyszukiwania służy do tworzenia siewnego służące do rozpoczęcia próbkowanie wejściowy spraw.

CREATE MINING STRUCTURE [New Mailing]
(
    CustomerKey LONG KEY, 
    Gender TEXT DISCRETE,
    [Number Cars Owned] LONG DISCRETE,
    [Bike Buyer] LONG DISCRETE 
) 
WITH HOLDOUT(25 PERCENT OR 2000 CASES) REPEATABLE(0)

Historia zmian

Microsoft Learning

Zaktualizowane BNF wyjaśnienie składni.

Zaktualizowane w przykładach.