Badanie modelu regresją (Analysis Services - wyszukiwania danych)
Podczas tworzenia kwerendy danych model wyszukiwania, można utworzyć kwerendę zawartości, która zawiera szczegółowe informacje dotyczące wzorców wykryte w analizie, lub można utworzyć kwerendę przewidywanie używa desenie w modelu, aby prognoz przy użyciu nowych danych.
W tej sekcji wyjaśniono, jak tworzyć kwerendy dla modeli, które są oparte na algorytmie regresją Microsoft.
Kwerendy zawartości
Pobieranie parametrów modelu przy użyciu zestawu wierszy schematu wyszukiwania danych
Znajdowanie dodatkowych szczegółów dotyczących modelu przy użyciu DMX
Przewidywania kwerend
Tworzenie prognoz dla wartości stałe
Dokonywania przewidywań dyskretnych wartości
Pobieranie informacji o modelu regresją
Logistyczne regresja modele są tworzone przy użyciu algorytmu sieci neuronowe Microsoft specjalnego zestaw parametrów; Dlatego logistyczne regresja modelu niektóre takie same informacje jak model sieci neuronowe, ale jest mniej skomplikowana.Aby zrozumieć strukturę zawartości modelu i typy węzłów, które przechowują rodzaj informacji, zobacz Model zawartości dla modeli regresją górnictwo (Analysis Services - wyszukiwania danych).
Do śledzenia w scenariuszach kwerendy, można utworzyć logistyczne regresja modelu opisane w poniższej sekcji pośrednie samouczek wyszukiwania danych: Lekcja 5: Tworzenie sieci neuronowe i modele regresją (pośrednie samouczek wyszukiwania danych).
Można również użyć struktura wyszukiwania, Targeted Mailing, z Samouczek wyszukiwania danych podstawowych.
ALTER MINING STRUCTURE [Targeted Mailing]
ADD MINING MODEL [TM_Logistic Regression]
([Customer Key],
[Age],
[Bike Buyer] PREDICT,
[Yearly Income] PREDICT,
[Commute Distance],
[English Education],
Gender,
[House Owner Flag],
[Marital Status],
[Number Cars Owned],
[Number Children At Home],
[Region],
[Total Children]
)
USING Microsoft_Logistic_Regression
Przykładowa kwerenda 1: Pobieranie parametrów modelu przy użyciu zestawu wierszy schematu wyszukiwania danych
Przez badanie zestaw wierszy schematu wyszukiwanie danych, można znaleźć metadane dotyczące modelu, takie jak utworzenia go, gdy model ostatnio został przetworzony, nazwa struktura wyszukiwania że zależy od modelu i nazwę kolumna używane jako atrybut przewidywalne.Poniższy przykład zwraca parametry, które były używane podczas modelu została utworzona, wraz z nazwa i typ modelu, i data, która została utworzona.
SELECT MODEL_NAME, SERVICE_NAME, DATE_CREATED, MINING_PARAMETERS
FROM $system.DMSCHEMA_MINING_MODELS
WHERE MODEL_NAME = 'Call Center_LR'
Przykładowe wyniki:
NAZWA_MODELU |
SERVICE_NAME |
DATE_CREATED |
MINING_PARAMETERS |
---|---|---|---|
Wywołanie Center_LR |
Microsoft_Logistic_Regression |
04/07/2009 20:38:33 |
HOLDOUT_PERCENTAGE = 30, HOLDOUT_SEED = 1, MAXIMUM_INPUT_ATTRIBUTES = 255, MAXIMUM_OUTPUT_ATTRIBUTES = 255, MAXIMUM_STATES = 100 SAMPLE_SIZE = 10000 |
Powrót do początku
Przykładowa kwerenda 2: Znajdowanie dodatkowych szczegółów dotyczących modelu przy użyciu DMX
Następująca kwerenda zwraca niektóre podstawowe informacje o logistyczne regresja modelu.Logistyczne regresja modelu przypomina model sieci neuronowe na wiele sposobów, w tym obecność węzeł Statystyka kredytu marginalnego (NODE_TYPE = 24), który opisuje wartości wykorzystanych jako nakłady.Ta przykładowa kwerenda używa modelu ukierunkowanych korespondencji i pobiera wartości nakładów, pobierając je z tabela zagnieżdżonej NODE_DISTRIBUTION.
SELECT FLATTENED NODE_DISTRIBUTION AS t
FROM [TM_Logistic Regression].CONTENT
Wyniki częściowe:
t.ATTRIBUTE_NAME |
t.ATTRIBUTE_VALUE |
t.support |
t.PROBABILITY |
t.VARIANCE |
t.VALUETYPE |
---|---|---|---|---|---|
Wiek |
Brak |
0 |
0 |
0 |
1 |
Wiek |
45.43491192 |
17484 |
1 |
126.9544114 |
3 |
Kupujący Bike |
Brak |
0 |
0 |
0 |
1 |
Kupujący Bike |
0 |
8869 |
0.507263784 |
0 |
4 |
Kupujący Bike |
1 |
8615 |
0.492736216 |
0 |
4 |
Wrócić odległość |
Brak |
0 |
0 |
0 |
1 |
Wrócić odległość |
5-10 Mil |
3033 |
0.173472889 |
0 |
4 |
Rzeczywiste kwerenda zwraca wiele więcej wierszy; Jednak ten ilustruje rodzaj dostarczonych informacji dotyczących nakładów.Dyskretne produkcji każda możliwa wartość znajduje się w tabela.Ciągłe wartości takich jak wejść Age, pełna lista jest niemożliwe, więc dane wejściowe jest discretized jako średnia.Aby uzyskać więcej informacji dotyczących sposobów korzystania z informacji w węźle marginalny statystyki, zobacz Model zawartości dla modeli regresją górnictwo (Analysis Services - wyszukiwania danych).
Ostrzeżenie
Wyniki została spłaszczona dla ich łatwiejszego oglądania, ale tabela zagnieżdżonej można powrócić w jednym kolumna Jeśli dostawca obsługuje hierarchicznych zestawów wierszy.Aby uzyskać więcej informacji, zobacz Hierarchicznych zestawów wierszy w OLE DB Programmer's Guide.
Powrót do początku
Kwerendy przewidywania dotyczące modelu regresją
Można użyć Przewidywanie (DMX) funkcja z każdego rodzaju z model wyszukiwania do nowych danych do modelu udostępniają i prognoz w oparciu o nowe wartości.Za pomocą funkcji zwraca dodatkowe informacje dotyczące przewidywanie, takie jak prawdopodobieństwo, że przewidywanie jest poprawny.Ta sekcja zawiera niektóre przykłady kwerend przewidywanie logistyczne regresja modelu.
Przykładowa kwerenda 3: Tworzenie prognoz dla wartości stałe
Ponieważ logistyczne regresja obsługuje ciągły atrybutów dla obu wejściowe i przewidywania, łatwo jest tworzyć modele skorelować różnych czynników w danych.przewidywanie kwerendy można eksplorować relację między tymi czynnikami.
Następujące przykładowe kwerendy jest oparty na modelu Centrum rozmowy z samouczka pośrednie i tworzy kwerendę singleton, która przewiduje klasy usługa shift piątek AM.predicthistogram (dmx) funkcja zwraca zagnieżdżoną tabela, która zapewnia odpowiednie zrozumienie ważności prognozowanej wartości statystyki.
SELECT
Predict([Call Center_LR].[Service Grade]) as Predicted ServiceGrade,
PredictHistogram([Call Center_LR].[Service Grade]) as [Results],
FROM
[Call Center_LR]
NATURAL PREDICTION JOIN
(SELECT 'Friday' AS [Day Of Week],
'AM' AS [Shift]) AS t
Przykładowe wyniki:
Przewidywane jakości usługi |
Wyniki |
---|---|
0.102601830123659 |
Klasa usługOBSŁUGA $PRAWDOPODOBIEŃSTWO $$ADJUSTEDPROBABILITYODCHYLENIE $FUNKCJA ODCH.STANDARDOWE $
0.10260183012365983.02325581395350.98837209302325600.001205526606000870.034720694203902
0.9767441860465120.01162790697674420.011627906976744200
|
Aby uzyskać więcej informacji na temat prawdopodobieństwa, obsługę i odchylenie standardowe wartości w tabela zagnieżdżonej NODE_DISTRIBUTION, zobacz Model zawartości dla modeli regresją górnictwo (Analysis Services - wyszukiwania danych).
Powrót do początku
Przykładowa kwerenda 4: Dokonywania przewidywań dyskretnych wartości
Logistyczne regresja jest zazwyczaj używany w scenariuszach miejsce analizowanie czynników, które przyczyniają się do wyniku binarny.Chociaż model używany w samouczku Prognozuje wartości ciągłego, ServiceGrade, w rzeczywistym scenariuszu warto zestaw model przewidzieć, czy klasa usługa spełnione niektóre discretized wartości miejsce docelowe.Alternatywnie można wyjściowe prognoz używanie ciągłej wartości, ale później pogrupować przewidywanych wyników w dobrej, targów lub niska.
Poniższy przykład ilustruje sposób zmienić sposób zgrupowaniem przewidywalne atrybut.W tym celu utworzyć kopię struktury górnictwa i następnie zmienić metoda discretization miejsce docelowe kolumny tak, aby wartości są zgrupowane zamiast ciągłe.
W poniższej procedurze opisano, jak zmienić grupowanie Service Grade wartości wywołania centrum danych.
Aby utworzyć discretized wersja struktura wyszukiwania Centrum obsługi telefonicznej i modeli
W Business Intelligence Development Studio w oknie Solution Explorer rozwiń Górnictwa struktur.
Kliknij prawym przyciskiem myszy Call Center.dmm i wybierz kopię.
Kliknij prawym przyciskiem myszy Górnictwa struktur i wybierz Wklej.Nowy struktura wyszukiwania dodane iss, o nazwie Call Center 1.
Kliknij prawym przyciskiem myszy nowy struktura wyszukiwania i wybierz nazwy.Wpisz nową nazwę wywołania Discretized Center.
Kliknij dwukrotnie nowy struktura wyszukiwania , aby go otworzyć projektanta.Należy zauważyć, że modeli wyszukiwania wszystkich zostały skopiowane także i wszystkie mają rozszerzenie 1.Pozostaw nazw jest teraz.
W Struktury górnictwa kartę, kliknij prawym przyciskiem myszy kolumna dla Service Gradei wybierz Właściwości.
Zmień Content właściwość z ciągłe do Discretized.Zmień DiscretizationMethod Właściwość klastrów.BucketCount Discretization wpisz 3.
Ostrzeżenie
Parametry te właśnie są używane do ilustrowania procesu i nie wytwarzają niekoniecznie prawidłowy model
Z Górnictwa modelu menu wybierz struktury proces i wszystkie modele.
W następującej kwerendzie przykładowej jest oparty na modelu discretized i prognozuje klasy usługa na określony dzień tygodnia, prawdopodobieństwa dla każdego przewidywanego wyniku.
SELECT
(PredictHistogram([Call Center_LR 1].[Service Grade])) as [Predictions]
FROM
[Call Center_LR 1]
NATURAL PREDICTION JOIN
(SELECT 'Saturday' AS [Day Of Week]) AS t
Oczekiwane wyniki:
Prognoz |
---|
Klasa usługOBSŁUGA $PRAWDOPODOBIEŃSTWO $$ADJUSTEDPROBABILITYODCHYLENIE $FUNKCJA ODCH.STANDARDOWE $
0.1087271838312535.72465047706410.4252934580602870.017016836003029300
0.0585576923062531.70988808007030.3774986676198850.02088202006045400
0.17016949152515.61091598832020.1858442379561920.066138657138604900
0.9545454545454550.01136363636363640.011363636363636400
|
Należy zauważyć, że przewidywane wyniki zostały zgrupowane w trzech kategoriach określone; Jednakże te grupy są oparte na klastrowanie wartości rzeczywistych danych nie dowolne wartości, które zestaw jako cele biznesowe.
Powrót do początku
Lista funkcje prognozowania
Wszystkie Microsoft obsługę algorytmów wspólny zestaw funkcji.Jednakże Microsoft algorytm regresją obsługuje dodatkowe funkcje wymienione w poniższej tabela.
|
Aby uzyskać listę funkcji, które są wspólne dla wszystkich Microsoft algorytmy, zobacz Mapowanie funkcji kwerendy typów (DMX).Aby składni określonych funkcji, zobacz Odwołanie do funkcji rozszerzenia górnictwa (DMX) danych.
Ostrzeżenie
Dla sieci neuronowe i modeli regresją PredictSupport (DMX) funkcja zwraca pojedynczą wartość, która reprezentuje rozmiar szkolenia zestaw dla całego modelu.
Zobacz także