Pomiar dokładność model wyszukiwania (Analysis Services — wyszukiwanie danych)
SQL Server Analysis Services oferuje szereg sposobów określenia, czy do modeli wyszukiwania są dokładne.
Wykresy służą do wizualnego reprezentowania dokładności model wyszukiwanie danych: A wykres wzrostu porównuje dokładność prognoz każdego modelu.A wykres zysków Wyświetla teoretyczne wzrostu zysku, który jest skojarzony z za pomocą każdego modelu.A Wykres punktowy porównuje wartości rzeczywiste przed przewidywane wartości i jest używany dla modeli regresja lub innych modeli, które przewidywania ciągłego atrybuty przy użyciu stałego danych wejściowych.
Można użyć Klasyfikacja macierzy tabulate dokładne i niedokładne prognoz.
Można użyć krzyżowe sprawdzanie poprawności statystycznie sprawdzania wiarygodności model wyszukiwania.
Aby uzyskać więcej informacji zobaczNarzędzia do wykresy dokładność modelu (Analysis Services — wyszukiwanie danych).Wszystkie typy wykresów, opisane w tej sekcji można też utworzyć programowo przy użyciu XML/A lub AMO.Aby uzyskać więcej informacji na temat programowania Analysis Services rozwiązania, zobacz Przewodnik dla deweloperów (Analysis Services — wyszukiwanie danych).
Uwaga
Po określeniu, że model jest rozsądnie dokładne, należy ocenić wyniki modelu w odniesieniu do problemu biznesowego modelu został zaprojektowany do odpowiedzi.
W tym temacie omówiono ogólne przepływu pracy w Business Intelligence Development Studio lub SQL Server Management Studio do pomiaru dokładności model wyszukiwania. W zależności od typu model wyszukiwania, który jest używany i wykresów, zostanie wybrana opcja niektóre opcje mogą być nieco inny, niedostępne lub skonfigurowanych domyślnie, ale proces jest następująca:
Wybierz model lub struktury, aby przetestować.
Wybierz dane z testów.
Opcjonalnie można filtrować dane testowe.
Wybierz typ wykresu, a następnie otwórz je w odpowiedniej przeglądarce.
Opcjonalnie można dostosować na wykresie.
Aby procedurę krok po kroku zobacz Jak Utworzyć wykres dokładność dla model wyszukiwania.
Wybieranie modelu lub struktura
It is common practice to build several data mining models for each data mining structure, and for each model to use a different algorithm or set of parameters.Analysis Services makes it easy to test multiple related mining models in the same chart.Jednak można również wybrać tylko jednego wyszukiwania wzór dane wyjściowe na wykresie dokładności.
W Business Intelligence Development Studio, struktura wyszukiwania, a następnie kliknij przycisk Wykres dokładność wyszukiwania kartę, aby otworzyć obszar projektowania wykresów dokładności.W SQL Server Management Studio, kliknij prawym przyciskiem myszy struktura wyszukiwania, a następnie wybierz polecenie Widok wykresu winda , aby otworzyć ten sam obszar projektu i utworzyć dowolny rodzaj wykresu dokładności.
Jeśli wiele modeli wyszukiwania zostanie dodany do wykresu, należy wybrać modeli wyszukiwania, które mają ten sam atrybut przewidywalne.Jeśli tworzysz wykres wzrostu, zysku wykresu, wykres punktowy lub klasyfikacji macierzy, można wybrać modeli do wykresu za pomocą Wybór wejścia tab.Niemniej jednak, jeśli tworzysz raport sprawdzania krzyżowe sprawdzanie poprawności, Analysis Services będzie analizować wszystkich modeli, które mają ten sam atrybut przewidywalne.
Wybieranie Test Data
Przed przystąpieniem do tworzenia wykresu dźwigu, wykres zysków lub wykres punktowy, należy określić dane, które będą używane za dokonanie oceny oprogramowania w modelu.Because the data that you use for evaluation greatly affects the results of evaluation, SQL Server 2008 Analysis Services provides the following options for specifying test data:
Przy użyciu partycji wstrzymanie, który został zdefiniowany jako test zestaw podczas tworzenia danych struktura wyszukiwania.Za pomocą część danych struktura wyszukiwania jako dane testowe, można miara wszystkie modele w strukturze konsekwentnie.
Określanie zewnętrznego urządzenie źródłowe danych jako dane testowe.
Określanie zewnętrznego urządzenie źródłowe danych oraz stosowanie filtrów w celu ograniczenia danych do odpowiedniego podzbiór przypadkach.Definiując filtr, można wybrać dane testowe, które spełnia warunki szczegółowe lub zawiera sprawy, które są szczególnie interesujące.
Za pomocą filtr zastosowany do spraw szkoleniowe używane przez model.Definiując filtr modelu ograniczyć przypadkach do podzbiór danych i upewnij się że określonego modelu zawsze jest oceniana przy użyciu podobnych danych.
Jeśli tworzysz raport sprawdzania krzyżowe sprawdzanie poprawności w Business Intelligence Development Studio lub SQL Server Management Studio, domyślnie Analysis Services używa partycji wstrzymanie zdefiniowane dla modelu, jeśli taki istnieje. Jeśli partycja nie wstrzymanie został zdefiniowany, Analysis Services używa całego zestaw przypadków szkolenia.
Jeśli tworzysz wykres wzrostu, wykres zysków, wykres punktowy kreślenia lub klasyfikacji macierzy w Business Intelligence Development Studio lub SQL Server Management Studio, należy użyć Karta Wybór wejścia w widoku Wykres dokładność wyszukiwania z projektantem wyszukiwanie danych, aby określić dane, które mają być używane do testowania modeli wyszukiwania.Dostępne są następujące opcje:
model wyszukiwania test przypadkami użycia
model wyszukiwania test przypadkach są pobierane z tych samych danych, który znajduje się w strukturze wyszukiwania, ale filtr został zastosowany do modelu w celu ograniczenia w przypadkach, używanych do testowania.Filtr modelu to zestaw warunków, które można utworzyć, a następnie przechowywać razem z modeli wyszukiwania.Ponieważ warunek filtra jest zapisywany z model wyszukiwania, jest stosowany domyślnie, kiedy szkolić w modelu.Podczas testowania modelu, można użyć filtru jest lub można użyć innego zestaw danych do testowania i pozwala ominąć filtr modelu.Jeśli chcesz zmienić filtr, który zostanie zastosowany do model wyszukiwania, można zmodyfikować filtr modelu i następnie ponownie przetworzyć modelu.Alternatywnie można utworzyć kopię modelu i następnie utworzyć inny filtr na kopii.
Aby uzyskać więcej informacji o filtrach modelu zobacz Tworzenie filtrów dla modeli wyszukiwania (Analysis Services — wyszukiwanie danych).
Aby uzyskać opis sposobów tworzenia filtru na model wyszukiwania zobacz Jak Zastosować filtr do model wyszukiwania.
Użycie struktura wyszukiwania przypadkach testu
Za pomocą tej opcji do pomiaru dokładności, jeśli została zdefiniowana, testowania zestaw danych podczas tworzenia struktura wyszukiwania, definiując wstrzymanie procent lub maksymalna liczba przypadków dla wstrzymanie.Definicja zestaw testów jest przechowywana ze strukturą.Dlatego też testowania zestaw można używać z każdego modelu, który jest oparty na strukturze.
Uwaga
Nie można utworzyć filtr bezpośrednio na strukturę górnictwo dane wstrzymania.Jednak chcąc filtrować dane, aby uniknąć tego problemu, można ponowne używanie oryginalnego widoku urządzenie źródłowe danych w zewnętrznym źródłem danych i zastosować filtr do zewnętrznego urządzenie źródłowe danych.
Aby uzyskać więcej informacji zobacz Partycjonowanie danych do szkolenia i testowanie zestawy (Analysis Services — wyszukiwanie danych).
Określić inny zestaw danych
W SQL Server 2005, jedynym sposobem sprawdzenia dokładności model wyszukiwania było za pomocą zestaw danych zewnętrznych. Ta opcja jest nadal dostępna w SQL Server 2008, ale teraz można także zdefiniować filtr na danych zewnętrznych.
Aby korzystać z zewnętrznego urządzenie źródłowe danych, wszystkie kolumny z danych zewnętrznych, który ma być używany dla danych wejściowych musi być mapowany do kolumn w model wyszukiwania.Można również pominąć niektóre kolumny, ale zewnętrznych zestaw danych musi zawierać co najmniej jedną kolumnę, które mogą być mapowane do przewidywalna kolumna w model wyszukiwania.W zależności od modelu konieczne może również mapować kolumna lub kolumna, danych zewnętrznych, które mają atrybuty wymagane do przewidywanie.
W Konstruktorze wyszukiwanie danych, można użyć Wybór wejścia Karta a Określ mapowanie kolumn okno dialogowe, aby zaznaczyć tabela danych wejściowych, modele mają być sprawdzany.Po zaznaczeniu tabela programu wprowadzania kolumn w tabelach Struktura wyszukiwania and Wybierz wprowadzania tabel są automatycznie mapowane na siebie.Można zmodyfikować mapowania, w razie potrzeby klikając kolumna w Struktura wyszukiwania tabela i przeciągając go do Wybierz wprowadzania tabel tabela.Jeśli dane wejściowe zawiera zagnieżdżoną tabela, w tej tabela można również dołączyć za pomocą Wybierz tabela zagnieżdżoną łącze.
Uwaga
Zawsze musi być mapowany przewidywalna kolumna.Kolumny, które nie są przypisane są podawane jako wartości NULL do model wyszukiwania.
Po mapowania odpowiednich kolumn można opcjonalnie określić stanu docelowego dla kolumna przewidywalne.Jeśli stan przewidywalne kolumna pozostanie puste, wykres wzrostu prognozuje jak model wykonuje niezależnie od stanu przewidywalna kolumna.Aby uzyskać więcej informacji na temat różnic między wykresów dźwigu, z lub bez określonego stanu przewidywalna kolumna Zobacz wykres wzrostu (Analysis Services — wyszukiwanie danych).
Istnieje również możliwość utworzenia filtru na danych zewnętrznych.Aby uzyskać opis sposobów tworzenia filtru zobacz Jak Filtrowanie wierszy wprowadzania organizacyjny dokładność.
The Synchronize przewidywanie Columns and Values option coordinates the predictable attributes in the external data urządzenie źródłowe and in the model wyszukiwania so that, even if they have a different name, they are derived from the same przewidywalna kolumna during model training.Jest to użyteczne, gdy masz dwie kolumny struktura wyszukiwania, które wskazują na tych samych danych źródłowych, ale prawdopodobnie kolumny są oznaczane etykietami inaczej.
Jeśli wyczyścisz Synchronizowanie prognozowania kolumny i wartości pole wyboru, można wybrać dowolnego prawidłowego przewidywalna kolumna i wartości, a wyniki są wykreślane ze sobą, nawet jeśli wyniki nie należy wprowadzać znaczeniu.Jeśli chcesz porównać dwie przewidywalne atrybutów, które nie jawnie mapować do tego samego zestaw wartości, może wyczyścić tę opcję.Jednak należy pamiętać, że dwa atrybuty może nie być porównywalna pod względem dokładności.Na przykład modelu, który discretizes dochód w pakiety, jak wysoki, drugie i niski może być porównywalna z modelu, który grupuje dochodu w zakresach, 150 000 + 100 000 50 000 i 10 000-50 000.Jednak zanim wyczyścisz pole wyboru, należy sprawdzić czy atrybuty są porównywalne.
Aby uzyskać więcej informacji:Jak kolumna uzyskania przewidywalnej dla wykresu dokładność, Za pomocą narzędzi do wyszukiwanie danych
Filtrowanie danych
Można filtrować dane, które jest używane do szkolenia i testowania model wyszukiwanie danych w następujący sposób:
Utworzyć filtr, który jest przechowywany w modelu.
Zastosować filtr do zewnętrznego urządzenie źródłowe danych.
Podczas definiowania filtru klauzulę zasadniczo tworzenia dla przychodzących danych.Jeśli filtrowanie wejściowy zestaw danych, używany do oceny modelu wyrażenie filtru jest tłumaczony Transact-SQL Instrukcja i stosowane do wprowadzania tabela podczas tworzenia wykresu. W wyniku liczbę przypadków, test można znacznie zmniejszyć.
Z drugiej strony po zastosowaniu filtru do model wyszukiwania, utworzone wyrażenie filtru jest tłumaczone na instrukcja rozszerzenia wyszukiwanie danych (DMX) i stosować do pojedynczego modelu.Po zastosowaniu filtru do modelu, tylko podzbiór oryginalnych danych jest używany na szkolić w modelu.Jeśli zdefiniowano zestaw testowania danych podczas tworzenia struktury, przypadkach model używany do szkolenia obejmują jedynie przypadki w zestawie szkolenia struktura wyszukiwania, które spełniają warunki filtru.Ponadto, jeśli zostanie wybrana opcja model wyszukiwania test przypadkami użycia, testowania przypadkach obejmują jedynie przypadki zestaw testów struktura wyszukiwania, które spełniają warunki filtru.Warunki filtrowania mają również zastosowanie do kwerend przeglądanie szczegółowe w przypadku modelu.
Jeśli nie zdefiniowano zestaw danych wstrzymanie, przypadkach modelu używanych do testowania obejmuje jednak wszystkie przypadki zestawu danych, które spełniają warunki filtru.
Dlatego wiele modeli, nawet wtedy, gdy na podstawie tej samej struktura wyszukiwania, może mieć różne filtry, a dzięki temu mogą używać różnych danych szkolenia i testowania.Jeśli zostanie wybrana opcja model wyszukiwania test przypadkami użycia podczas tworzenia wykresu dokładności powinny okazuje że całkowita liczba przypadków w zestawach szkolenia i testowania można w dużym stopniu między modelami testowanego.
Uwaga
Dodawanie filtru do istniejącego model wyszukiwania lub zmienić warunki filtrowania ponownie przetworzyć model wyszukiwania, aby zobaczyć efekty filtru.
Aby przejrzeć przypadkach szkolenia rzeczywiste, które były używane, można utworzyć DMX kwerendy zawartości, takich jak:
SELECT * from <model>.CASES WHERE IsTrainingCase()
lub:
SELECT * from <model>.CASES WHERE IsTestCase()
Aby porównać tych przypadkach, w przypadkach w strukturze, należy utworzyć następującą kwerendę zawartości DMX:
SELECT * FROM <structure>.CASES WHERE IsTestCase()
Uwaga
Aby uruchomić kwerendę zawartości w przypadku modelu, należy włączyć Drillthough w modelu.
Aby uzyskać informacje na temat rodzajów można zastosować filtry i w jaki sposób są oceniane wyrażenia filtru zobacz Wzór filtr składnia i przykłady (Analysis Services — wyszukiwanie danych).
Wybieranie typu wykresu i ich wyświetlanie na wykresie
W zależności od wybranego typu wykresu mogą dalej konfigurować opcje, aby przeglądać na wykresie lub skopiować do Schowka i pracy z danymi w programie Excel na wykresie.
Uwaga Wykresy i ich definicje nie zostały zapisane.Po zamknięciu okna zawierającego wykres, należy ponownie utworzyć wykres.
wykres wzrostu
Po skonfigurowaniu opcji dla modeli i testowania danych, kliknij przycisk wykres wzrostu kartę, aby wyświetlić wyniki.Można również skopiować do Schowka na wykresie lub wyświetlić szczegóły poszczególnych trend linii lub punktów danych w legendzie wyszukiwania.
Aby uzyskać więcej informacji zobacz wykres wzrostu (Analysis Services — wyszukiwanie danych) i Podnieś karta wykresu (widok Wykres dokładność wyszukiwania).
wykres zysków
Po skonfigurowaniu opcji dla modeli i testowania danych, kliknij przycisk wykres wzrostu Wybierz opcję karciewykres zysków from the Typ wykresu listy zestaw zysk Opcje wykresu, a następnie kliknij przycisk OK , aby wyświetlić wyniki.Można użyć Ustawienia wykres zysków okno dialogowe tyle razy, ile chcesz spróbować koszt różnych opcji i ponownie wyświetlić na wykresie. Legenda wyszukiwania zawiera szczegółowe informacje na temat szacunkowej zysku dla każdego modelu.Wykres i treść legendy wyszukiwania można także skopiować do Schowka, aby pracować z nim w programie Excel.
Aby uzyskać więcej informacji zobacz wykres zysków (Analysis Services — wyszukiwanie danych) i Okno dialogowe Ustawienia wykres zysków (widok Wykres dokładność wyszukiwania).
Wykres punktowy rysowania
Jeżeli wybrano odpowiedni typ modelu, po kliknięciu przycisku wykres wzrostu karcie Typ wykresu jest automatycznie zestaw do Wykres punktowy rysowania i wykres punktowy jest wyświetlany.Dalsze konfiguracja nie jest możliwe.Można również skopiować do Schowka wykresu i wkleić wykres jako grafikę do programu Excel lub innej aplikacji.
Aby uzyskać więcej informacji, zobacz Wykres punktowy rysowania (Analysis Services — wyszukiwanie danych).
Klasyfikacja macierzy
Dla macierzy klasyfikacji, należy użyć Wybór wejścia kartę, aby wybrać modeli i testowania danych, a następnie kliknij przycisk Klasyfikacja macierzy kartę, aby wyświetlić wyniki.Zawartość macierzy klasyfikacji są takie same dla wszystkich typów modeli i nie może zostać skonfigurowany.Można również skopiować do Schowka danych na wykresie i następnie pracować z nim w programie Excel.
Aby uzyskać więcej informacji zobacz Macierz klasyfikacji (Analysis Services — wyszukiwanie danych) lub Karta macierzy klasyfikacji (widok Wykres dokładność wyszukiwania).
Raport sprawdzania krzyżowe sprawdzanie poprawności
W przypadku raportu sprawdzania krzyżowe sprawdzanie poprawności, kliknij po zaznaczeniu struktura wyszukiwania lub model wyszukiwania w programie eksplorator rozwiązań Sprawdzanie poprawności krzyżowe karcie skonfigurować wszystkie odpowiednie opcje, a następnie kliknij przycisk Uzyskiwanie wyniki , aby wygenerować raport.Dalsze konfiguracja nie jest możliwe.Format Raport krzyżowe sprawdzanie poprawności jest taka sama dla wszystkich typów modeli i nie może zostać skonfigurowany.Jednak zawartość raportu różni się w zależności od tego, typ modelu, analizowania i przewidywalny atrybut typu danych.Można także skopiować wyniki raportu do Schowka i pracować z danymi w programie Excel.
Aby uzyskać więcej informacji zobacz krzyżowe sprawdzanie poprawności (Analysis Services — wyszukiwanie danych) lub Raport sprawdzania poprawności między (Analysis Services — wyszukiwanie danych).