Udostępnij za pośrednictwem


Kreator wyszukiwania danych (Analysis Services — wyszukiwanie danych)

The Data Mining Wizard in Microsoft SQL Server Analysis Services starts every time that you add a new mining structure to a data mining project.Kreator pomaga definiować nowe struktury wyszukiwania i wybiera źródeł danych, które będą używane do wyszukiwanie danych.Kreator również można podzielić dane w struktura wyszukiwania do zestawów szkolenia i testowania i pomocy dodać model początkowym wyszukiwania dla każdej struktury.

Zawartość struktura wyszukiwania jest określany na podstawie istniejącego widok urządzenie źródłowe danych lub moduł.Można wybrać kolumny, które mają zostać uwzględnione w struktura wyszukiwania.Wszystkie modele, które są oparte na tej struktury, można użyć tych kolumn.Można umożliwić użytkownikom modelu wyszukiwanie danych do drążenia w wynikach model wyszukiwania w celu wyświetlenia dodatkowych struktura wyszukiwania kolumn, które nie zostały uwzględnione w modelu górnictwo samego siebie.

Które należy wykonać następujące decyzje podczas tworzenia danych struktura wyszukiwania i modelu przy użyciu Kreatora wyszukiwanie danych:

  • Czy chcesz utworzyć dane struktura wyszukiwania i modeli z relacyjnej bazy danych lub z istniejącego moduł w bazie danych OLAP.

  • Jak dużo danych do użycia w szkolenia i ile zestaw przeznaczonych do testowania.Struktura wyszukiwania jest partycja na szkolenie i testów zestawów danych, może używać ten zestaw testów wszystkie modele, które są oparte na tej struktury.

  • Które kolumny lub atrybuty, które mają być używane do przewidywanie i które kolumny lub atrybuty, które chcesz użyć jako dane wejściowe dla analizy.Każda struktura musi także zawierać klucz, który unikatowo identyfikuje rekordu przypadek.

  • Algorytm, który ma być używany.The algorithms provided in SQL Server Analysis Services have different characteristics and produce different results.Można utworzyć wiele modeli przy użyciu różnych algorytmów lub zmienić parametry algorytmów do tworzenia różnych modeli..

Kreator wyszukiwanie danych zawiera funkcje ułatwiające tych decyzji:

  • Strony kreatora, w których definiuje się przypadek zestaw.Można wybrać tabele przypadek i zagnieżdżonych tabel ze urządzenie źródłowe danych relacyjnych, lub wybierz urządzenie źródłowe danych OLAP i zaznacz klucz przypadek i liter kolumn poziom i następnie opcjonalnie zdefiniować filtry w odniesieniu do moduł.

  • Okna dialogowe, które analizuje dane w kolumnach i zaleca się użycie w kolumnach.

  • Automatyczne wykrywanie typów zawartości i danych kolumna.

  • Automatyczne Cięcie moduł, jeśli model wyszukiwania zależy od urządzenie źródłowe danych OLAP.

Po zakończeniu pracy Kreatora wyszukiwanie danych, modyfikowanie struktura wyszukiwania za pomocą projektanta wyszukiwanie danych i modeli, aby wyświetlić dokładności w modelu wyświetlać właściwości struktury i modeli lub tworzenie prognoz przy użyciu modeli.

Aby uzyskać więcej informacji:Projektant wyszukiwanie danych

Przy użyciu Kreatora wyszukiwanie danych

Aby uruchomić Kreatora wyszukiwanie danych, należy dodać nowy struktura wyszukiwania do Analysis Services projekt za pomocą eksplorator rozwiązań lub Projekt menu in Business Intelligence Development Studio.

Kreator wyszukiwanie danych ma dwie gałęzie, zależy, czy urządzenie źródłowe danych jest relacyjna w moduł:

  • Relacyjne modele wyszukiwania

  • Modele wyszukiwania OLAP

Uwaga

Nie trzeba mieć moduł lub z baza danych OLAP, aby wykonać wyszukiwanie danych.Chyba że dane są już przechowywane w module lub chcesz Moje wymiary OLAP lub wyniki agregacji OLAP i obliczeń, zaleca się używać relacyjnej tabela lub urządzenie źródłowe danych do wyszukiwanie danych.

Relacyjne modele wyszukiwania

Podczas tworzenia model wyszukiwania ze urządzenie źródłowe danych relacyjnych w Analysis Services, należy najpierw określić w Kreatorze wyszukiwanie danych chcesz użyć istniejącej relacyjnej bazy danych do definiowania struktury modelu. Istnieje również możliwość tworzenie tylko struktura wyszukiwania lub tworzenie struktura wyszukiwania i jeden model wyszukiwanie danych.Jeśli zostanie wybrana opcja utworzenia model wyszukiwania, należy określić techniką wyszukiwanie danych do używania przez wybór algorytmu, który jest najbardziej odpowiednia dla typu analizy wyszukiwanie danych, które mają.

Aby uzyskać więcej informacji:Algorytmy wyszukiwania danych (Analysis Services — wyszukiwanie danych)

Określanie widok urządzenie źródłowe danych i typy tabel

Wybierz Widok urządzenie źródłowe danych, którego chcesz używać do definiowania struktura wyszukiwania i określenie tabela przypadek są następne kroki w kreatorze.przypadek tabela będą używane do szkolenia z modeli wyszukiwanie danych i opcjonalnie do testowania ją również.Można również określić w tabela zagnieżdżonej.

Wybór przypadek tabela jest podjęcia ważnych decyzji.przypadek tabela powinien zawierać obiekty, które chcesz analizować: na przykład klienci i ich informacji demograficznych firmie. Tabela zagnieżdżona zazwyczaj zawiera dodatkowe informacje dotyczące obiektów przypadek tabeli, takich jak transakcje przeprowadzone przez klienta lub atrybuty, które są powiązane relacją wiele do jednego z jednostką.Na przykład, tabele zagnieżdżone przyłączony do Klienci przypadek tabela może zawierać listę wyrobów zakupionych od poszczególnych klientów lub listy hobby.Aby uzyskać więcej informacji:Zagnieżdżone tabele (Analysis Services — wyszukiwanie danych)

Określanie sposobu użycia kolumn

Po określeniu, że przypadek tabela i tabel zagnieżdżonych, aby określić typ użycia dla każdej kolumna w tabelach, które zostaną uwzględnione w struktura wyszukiwania.Jeśli nie zostanie określony typ użycia dla kolumna, kolumna nie zostaną uwzględnione w strukturze wyszukiwania.

Może to być jeden z czterech typów kolumn wyszukiwanie danych: klucz, wejście przewidywalny lub kombinację wejściowych i przewidywalny. Kolumny klucz zawierają identyfikator unikatowy dla każdego wiersza w tabela.Niektóre modele wyszukiwania, takie jak te, na podstawie sekwencji klastrowanie lub czas algorytmy serii, może zawierać wiele kolumn klucz.Jednak wiele klucze nie są kluczami złożonego w tym sensie, relacyjnej, ale zamiast tego należy wybrać w celu zapewnienia obsługi szeregu czasowego i klastrowanie analizy sekwencji.Aby uzyskać więcej informacji zobacz Microsoft Time Series Algorithm lub Algorytm klastrowanie Microsoft sekwencji.

Wejściowy kolumny zawierają informacje, z którego dokonano prognoz.Przewidywalne kolumny zawierają informacje, które spróbować przewidzieć w model wyszukiwania.

Na przykład serii tabel może zawierać nazwy klienta, informacji demograficznych firmie i kwotę każdego klienta przez pracowników w określonym sklepie.Identyfikator klienta jednoznacznie identyfikuje klienta i dotyczy również przypadek tabela zagnieżdżone tabele; dlatego identyfikator klienta mogą używać jako kolumna klucz.Wybór kolumny z informacji demograficznych firmie może być używany jako wejściowy kolumny i kolumny, która opisuje kwotę jako przewidywalna kolumna przez pracowników każdego klienta.Następnie można zbudować model wyszukiwania, który dotyczy kryteria demograficzne ile pieniędzy klienta przez pracowników w magazynie.Ten model może być używany jako podstawa dla przeznaczone do sprzedaży.

Kreator wyszukiwanie danych umożliwia Sugerowanie funkcji, która jest włączona, jeśli zostanie wybrana przewidywalna kolumna.Zestawów danych często zawierają więcej kolumn niż potrzebne do utworzenia model wyszukiwania.The Suggest feature calculates a numeric score, from 0 to 1, that describes the relationship between each column in the dataset and the przewidywalna kolumna.W oparciu o ten wynik, funkcja sugeruje kolumny, aby używać jako danych wejściowych dla model wyszukiwania.Jeśli używasz Sugerowanie funkcji, można użyć sugerowanej kolumn, modyfikować ustawienia do własnych potrzeb lub zignorować sugestie.

Określanie zawartości i typy danych

Po zaznaczeniu jednego lub kilku przewidywalne kolumn i kolumn danych wejściowych, można określić typy zawartości i danych dla każdej kolumna.

Aby uzyskać więcej informacji:Typy danych (Data wyszukiwania), Typy zawartości (wyszukiwanie danych)

Dzielenie danych na testowanie zestawów i szkolenia

Ostatnim krokiem przed zakończeniem pracy kreatora jest partycji danych do szkolenia i testowania zestawów.Możliwość przechowywania się część do testowania danych jest nowe w SQL Server 2008 i udostępnia mechanizm łatwego w użyciu dla zapewnienia, że spójny zestaw testów jest dostępny do użytku z wszystkich modeli wyszukiwania skojarzone z nowym struktura wyszukiwania.

Można określić, że pewien procent dane będą stosowane do testowania, a wszystkie pozostałe będą używane do szkolenia.Można również określić liczbę przypadków, aby używać do testowania.Definicja partycji przechowywana jest ze struktura wyszukiwania tak, że za każdym razem, gdy tworzysz nowy model oparty na strukturze testowania zestaw danych będą dostępne dla oceny dokładności modelu.

Aby uzyskać więcej informacji:Sprawdzanie poprawności modeli wyszukiwania danych (Analysis Services — wyszukiwanie danych), Partycjonowanie danych do szkolenia i testowanie zestawy (Analysis Services — wyszukiwanie danych)

Kończenie pracy Kreatora

Ostatnim etapem w kreatorze jest nazwy struktura wyszukiwania i skojarzonym model wyszukiwania.W przypadku wybrania Zezwalaj na drążenie wskroś, za pomocą funkcji drążenia jest włączona w modelu.Dzięki temu użytkownicy, którzy mają odpowiednie uprawnienia, Poznaj urządzenie źródłowe dane używane do tworzenia modelu.

Aby uzyskać więcej informacji:Za pomocą przeglądanie szczegółowe modele wyszukiwania i struktury wyszukiwania (Analysis Services — wyszukiwanie danych)

Powrót do początku

Modele wyszukiwania OLAP

Podczas tworzenia wielowymiarowych model wyszukiwania ze urządzenie źródłowe danych OLAP w Analysis Services, należy najpierw określić w Kreatorze wyszukiwanie danych chcesz użyć istniejącego moduł do definiowania struktury modelu. Istnieje możliwość tworzenie tylko struktura wyszukiwania lub tworzenia struktury górnictwo plus jeden model wyszukiwanie danych.Jeśli zostanie wybrana opcja utworzenia model wyszukiwania, należy określić techniką wyszukiwanie danych do używania przez wybór algorytmu, który jest najbardziej odpowiedni dla danego problemu biznesowego.

Aby uzyskać więcej informacji:Algorytmy wyszukiwania danych (Analysis Services — wyszukiwanie danych)

Określanie urządzenie źródłowe danych i klucz przypadku

Następnie wybierz wymiar moduł do użytku jako urządzenie źródłowe danych do definiowania struktura wyszukiwania.A następnie wybierz atrybut jako klucza podstawowego, lub klucz przypadku, model wyszukiwania.

Uwaga

Model wyszukiwania OLAP jest konstruowany oraz urządzenie źródłowe moduł, który służy do tworzenia modelu muszą być zawarte w tym samym Analysis Services Baza danych.

Określanie przypadek z poziom kolumna i obciążenie kolumna

Po zaznaczeniu klucz przypadek, atrybuty i środków, które są skojarzone z tym kluczem są wyświetlane w widoku drzewa na następnej strona kreatora.Z tej listy wybierz atrybuty i środków, które mają być używane jako kolumny struktury.Kolumny te są znane jako kolumny poziom przypadek.Podobnie jak w przypadku relacyjnych modelu, należy także określić, jak każda kolumna powinien być używany w strukturze, co można zrobić na następnej stronie kreatora.Kolumny może być klucz, wprowadzania, przewidywalny, wprowadzania i przewidywalny lub niezaznaczone.

Dodawanie zagnieżdżone tabele

Gałąź OLAP Kreatora wyszukiwanie danych zawiera opcję, aby dodać tabele zagnieżdżone w strukturze model wyszukiwania.Na Określ sposób użycia modelu wyszukiwanie kolumna strona kreatora, kliknij przycisk Dodaj tabele zagnieżdżone , aby otworzyć okno dialogowe oddzielnych, które prowadzi użytkownika przez kroki, aby dodać tabele zagnieżdżone.Wyświetlane są tylko grupy miara stosowane do wymiaru.Wybierz grupa miar zawierającą klucz obcy przypadek wymiaru.Następnie należy określić sposób użycia dla każdej kolumna w grupie miar, wprowadzania lub w dający się przewidzieć.Następnie, Kreator dodaje tabela zagnieżdżona przypadek tabeli.Domyślna nazwa tabela zagnieżdżonej jest nazwa wymiaru zagnieżdżone, ale można zmienić nazwy tabela zagnieżdżonej i jej kolumn.Aby uzyskać więcej informacji:Zagnieżdżone tabele (Analysis Services — wyszukiwanie danych)

Określanie zawartości i typy danych

Po zaznaczeniu jednego lub kilku przewidywalne kolumn i kolumn danych wejściowych, można określić typy zawartości i danych dla każdej kolumna.

Aby uzyskać więcej informacji:Typy danych (Data wyszukiwania), Typy zawartości (wyszukiwanie danych)

Moduł urządzenie źródłowe Cięcie

W gałęzi OLAP w kreatorze można ograniczyć zakres model wyszukiwania Cięcie urządzenie źródłowe moduł przed przeszkolić model wyszukiwania.Cięcie moduł jest podobna do dodawania WHERE Klauzula instrukcję SQL. Na przykład jeśli moduł zawiera informacje dotyczące zakupu produktów, które może ograniczyć atrybut wiek na więcej niż 30, kolumna płci, która ma być tylko Kobieta i Data zakupu, aby nie wcześniej niż marca 2000.W taki sposób, można ograniczyć model, aby obejmować zakres kobieta, starsze niż 30 lat, którzy zakupione od marca 2000 produktu.

Dzielenie danych na testowanie zestawów i szkolenia

Ostatnim krokiem przed zakończeniem pracy kreatora jest dane, które są dostępne z moduł do szkolenia i testowania zestawy partycji.Definicja partycji przechowywana jest ze struktura wyszukiwania tak, że za każdym razem, gdy tworzysz nowy model oparty na strukturze testowania zestaw danych będą dostępne dla oceny dokładności modelu.

Aby uzyskać więcej informacji:Sprawdzanie poprawności modeli wyszukiwania danych (Analysis Services — wyszukiwanie danych), Partycjonowanie danych do szkolenia i testowanie zestawy (Analysis Services — wyszukiwanie danych)

Kończenie pracy Kreatora

Ostatnim etapem w kreatorze jest nazwy struktura wyszukiwania i skojarzonym model wyszukiwania.W przypadku wybrania Zezwalaj na drążenie wskroś, za pomocą funkcji drążenia jest włączona w modelu.Dzięki temu użytkownicy, którzy mają odpowiednie uprawnienia, Poznaj urządzenie źródłowe dane używane do tworzenia modelu.Można również określić, czy chcesz dodać nowy wymiar do moduł źródłowy, który jest oparty na model wyszukiwania lub utworzyć nowy moduł z model wyszukiwania.

Aby uzyskać więcej informacji:Za pomocą przeglądanie szczegółowe modele wyszukiwania i struktury wyszukiwania (Analysis Services — wyszukiwanie danych)

Powrót do początku