Udostępnij za pośrednictwem


Microsoft algorytm regresja liniowa

The Microsoft Linear regresja algorithm is a variation of the Microsoft Decision Trees algorithm that helps you calculate a linear relationship between a dependent and independent variable, and then use that relationship for przewidywanie.

Relacja ma postać równania dla wiersza, który najlepiej reprezentuje jedną serię danych.Na przykład wiersz na poniższym diagramie jest najlepsze możliwe liniowej reprezentację danych.

A line that models a set of data

Każdy punkt danych na diagramie, zawiera błąd skojarzony z jego odległości od linii regresja.The coefficients a and b in the regresja equation adjust the angle and location of the regresja line.You can obtain the regresja equation by adjusting a and b until the sum of the errors that are associated with all the points reaches its minimum.

Istnieją inne rodzaje regresja, które używają wielu zmiennych i nieliniowe metody regresja.Jednak regresja liniowej jest to użyteczne i dobrze znanych metoda modelowania odpowiedzi na zmianę niektórych podstawowych współczynnik.

Przykład

Za pomocą regresja liniowej można określić relację między dwoma kolumnami ciągłego.Na przykład regresja liniowej można użyć do obliczenia linii trend na podstawie danych wytwarzania lub sprzedaży.Można także użyć regresja liniowej jako prekursorów tworzeniu bardziej złożonych modeli wyszukiwanie danych, dokonanie oceny relacje między kolumnami danych.

Chociaż istnieje wiele sposobów obliczanie regresja liniowej, które nie wymagają narzędzia do wyszukiwanie danych, zaletą używania Microsoft Liniowy algorytm regresja dla tego zadania jest czy wszystkich możliwych relacji pomiędzy zmiennymi są automatycznie obliczane i przetestowane. Nie trzeba wybrać metoda obliczeń, takich jak rozwiązywanie najmniejszych kwadratów.Jednak regresja liniowej może oversimplify relacje w scenariuszach, gdy wiele czynników wpływają na wyniki.

Jak działa algorytmu

The Microsoft Linear regresja algorithm is a variation of the Microsoft Decision Trees algorithm. Po wybraniu Microsoft Algorytm regresja liniowej, szczególny przypadek Microsoft Algorytm drzewa decyzji jest wywoływana z parametrami, które ograniczyć zachowanie algorytmu i wymagają określonych typów danych wejściowych. Ponadto w modelu regresja liniowej, cały zestaw danych jest używany dla przetwarzania relacje w przebiegu początkowy, natomiast model drzewa decyzji standardowych dzieli dane wielokrotnie na mniejsze podzbiory lub drzew.

Dane wymagane dla modeli regresja liniowa

Podczas przygotowywania danych do użycia w modelu regresja liniowej, należy zapoznać się wymagania dotyczące określonego algorytmu.Dotyczy to także potrzebny jest ilości danych i sposobu używania danych.Wymagania dla tego typu modelu są następujące:

  • Pojedyncze key kolumna   Każdy model musi zawierać jedną kolumna numerycznym lub tekstowym, które jednoznacznie identyfikują każdy rekord.Złożone klucze nie są dozwolone.

  • przewidywalna kolumna   Wymaga co najmniej jedną przewidywalna kolumna.W modelu może zawierać wiele atrybutów przewidywalny, ale przewidywalne atrybuty muszą być stałe liczbowych typów danych.Typ danych Data/Godzina można używać jako atrybut przewidywalne nawet wtedy, gdy macierzysta przechowywania danych jest liczbą.

  • Kolumny danych wejściowych   Kolumny danych wejściowych musi zawierać dane liczbowe ciągłe i można przypisać odpowiedni typ danych.

Aby uzyskać więcej informacji zobacz sekcję Wymagania dotyczące Microsoft Technical Reference algorytm regresja liniowa.

Wyświetlanie modelu regresja liniowa

Aby poznać modelu, należy użyć Przeglądarka Microsoft drzewa.Struktury drzewa dla modelu regresja liniowej jest bardzo proste, wszystkie informacje o równanie regresja w jednym węźle.Aby uzyskać więcej informacji zobaczWyświetlanie model wyszukiwania z podglądem drzewa firmy Microsoft.

Jeśli chcesz wiedzieć więcej szczegółowych informacji dotyczących równania można również wyświetlać współczynniki i inne szczegóły, za pomocą Podgląd zawartości drzewa rodzajowa firmy Microsoft.

W przypadku modelu regresja liniowej zawartość modelu obejmuje metadane, formuła regresja oraz statystyki dotyczące występowania wartości wejściowych.Aby uzyskać więcej informacji zobaczmodel wyszukiwania Zawartości dla modeli regresji liniowej (Analysis Services — wyszukiwanie danych).

Tworzenie prognoz

Po przetworzeniu modelu, wyniki są przechowywane jako zbiór statystyki wraz z formuły regresja liniowej, która może być używana do obliczania przyszłych trendów.Przykłady kwerend do korzystania z modelu regresja liniowej można znaleźć w temacie Podczas badania modelu regresja liniowej (Analysis Services — wyszukiwanie danych).

Aby uzyskać ogólne informacje dotyczące tworzenia kwerend względem modeli wyszukiwania zobacz Podczas badania modeli wyszukiwania danych (Analysis Services — wyszukiwanie danych).

Oprócz tworzenia modelu regresja liniowej, wybierając Microsoft Algorytm regresja liniowej, gdy atrybut przewidywalne typ danych numerycznych ciągłe, można utworzyć modelu drzewo decyzyjne, który zawiera strat zauważyć. W takim przypadek algorytmu podzielić dane znajdzie separacji odpowiednich punktów, ale w niektórych regionach danych spowoduje utworzenie formuły regresja zamiast.Aby uzyskać więcej informacji na temat drzew regresja w modelu drzewa decyzji zobacz model wyszukiwania Zawartości dla modeli drzewo decyzyjne (Analysis Services — wyszukiwanie danych).

Uwagi

  • Nie obsługuje korzystania z przewidywanego modelu Markup Language (PMML) do tworzenia modeli wyszukiwania.

  • Nie obsługuje tworzenia wymiary wyszukiwanie danych.

  • Obsługuje przeglądanie szczegółowe.

  • Obsługuje korzystanie z modeli wyszukiwania OLAP.