Udostępnij za pośrednictwem


Kolumna dystrybucyjnego (wyszukiwanie danych)

In Microsoft SQL Server Analysis Services, you can define column distributions in a mining structure, to affect how algorithms process the data in those columns when you create mining models.Aby niektóre algorytmy warto zdefiniować dystrybucję ciągłego kolumn przetwarzania modelu, jeśli wiadomo, że kolumny zawierają wspólne dystrybucje wartości.Jeśli nie zostanie zdefiniowana dystrybucji, wynikowy modeli wyszukiwania może powodować mniej dokładne prognoz niż Jeśli zdefiniowane zostały dystrybucji, ponieważ algorytmów będzie miał mniej informacji, z których można interpretować dane.

Algorytmy, które są dostępne w Analysis Services obsługuje następujące typy dystrybucji:

  • Normal
    Wartości ciągłego kolumna tworzą histogramu z rozkładem normalnym.

    Histogram with normal distribution

  • Log Normal
    Wartości dla ciągłej kolumnie formularza histogramu, gdzie krzywa jest podłużne w górnej części i pochylony w kierunku dolnego końca.

    Histogram with log normal distribution

  • Uniform
    Wartości dla ciągłej kolumnie formularza płaskiego krzywej, w którym wszystkie wartości są równie prawdopodobne.

    Histogram with uniform distribution

Aby uzyskać więcej informacji na temat algorytmów, Analysis Services zapewnia, zobacz Algorytmy wyszukiwania danych (Analysis Services — wyszukiwanie danych).