Funkcje statystyczne
Ważne
Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.
Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).
- Zobacz informacje na temat przenoszenia projektów uczenia maszynowego z programu ML Studio (wersja klasyczna) do Azure Machine Learning.
- Dowiedz się więcej o Azure Machine Learning.
Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.
W tym artykule opisano moduły w programie Machine Learning Studio (klasyczne), które obsługują operacje matematyczne i statystyczne krytyczne dla uczenia maszynowego. Jeśli musisz wykonać w eksperymencie zadania, takie jak następujące, sprawdź kategorię Funkcje statystyczne :
- Wykonywanie obliczeń ad hoc na wartościach kolumn, takich jak zaokrąglanie lub używanie wartości bezwzględnej.
- Środki obliczeniowe, logarytmy i inne statystyki często używane w uczeniu maszynowym.
- Obliczanie korelacji i ocen prawdopodobieństwa.
- Obliczanie ocen Z.
- Obliczanie powszechnie używanych rozkładów statystycznych, takich jak Weibull, gamma i beta.
- Generowanie raportów statystycznych dla zestawu kolumn lub zestawu danych.
Uwaga
Dotyczy: Machine Learning Studio (wersja klasyczna)
Podobne moduły przeciągania i upuszczania są dostępne w Azure Machine Learning projektanta.
Jeśli na przykład masz nowy zestaw danych, możesz najpierw użyć modułu Summarize Data (Podsumuj dane). Generuje raport dla całego zestawu danych, który zawiera standardowe miary statystyczne, takie jak średnia i odchylenie standardowe.
Jeśli potrzebujesz bardziej zaawansowanych statystyk, takich jak nieschylność próbki lub odległość międzykwartościowa, użyj modułu Obliczanie statystyk podstawowych, aby wygenerować dodatkowe statystyki opisowe.
Ponieważ moduły generują wyniki przy każdym uruchomieniu eksperymentu, wyniki są aktualizowane w przypadku zmiany danych.
Lista modułów
Kategoria Funkcje statystyczne obejmuje następujące moduły:
- Zastosuj operację matematyczną: stosuje operację matematyczną do wartości kolumn.
- Obliczanie statystyk podstawowych: oblicza określone statystyki podsumowujące dla wybranych kolumn zestawu danych.
- Obliczanie korelacji liniowej: oblicza korelację liniową między wartościami kolumn w zestawie danych.
- Funkcja Evaluate Probability: Dopasowuje określoną funkcję rozkładu prawdopodobieństwa do zestawu danych.
- Zastąp wartości dyskretne: zastępuje wartości dyskretne z jednej kolumny wartościami liczbymi opartymi na innej kolumnie.
- Podsumuj dane: generuje podstawowy raport statystyk opisowych dla kolumn w zestawie danych.
- Hipoteza testowa przy użyciu testu t: porównuje środki z dwóch zestawów danych przy użyciu testu t.