Cvičení – volba algoritmu strojového učení pro předpovídání úspěšného startu rakety

Dokončeno

Zvolili jste sloupce, které chcete použít k předpovídání toho, jestli dojde ke startu rakety za určitých povětrnostních podmínek. Teď budete muset zvolit, který algoritmus se má použít k vytvoření našeho modelu. Vzpomeňte si, že jste se seznámili s tahákem k algoritmům Azure Machine Learning.

Flowchart-style diagram of the Machine Learning Algorithm Cheat Sheet.

Pamatujete si na svou otázku: Můžete předpovědět, jestli se start pravděpodobně stane za určitých povětrnostních podmínek? Tato otázka má dvě možnosti. Raketa odstartuje, buď ano nebo ne. Tato otázka se považuje za problém klasifikace se dvěma třídami.

V rámci této kategorie algoritmu existuje mnoho specifických algoritmů, ze kterých si můžete vybrat. V tomto případě prozkoumáte rozhodovací strom se dvěma třídami. Vizualizace výsledků rozhodovacího stromu vám poskytne přehledy, které vám pomůžou iterovat shromažďování, čištění a manipulaci s daty v budoucnu.

Vytvoření modelu strojového učení v Pythonu

Pomocí nástroje scikit-learn se snadno vytvoří model strojového učení, který pro toto cvičení potřebujete. Vložte tento kód do další buňky v nástroji Visual Studio Code:

# Create decision tree classifier 
tree_model = DecisionTreeClassifier(random_state=0,max_depth=5)

Podívejme se na dokumentaci k klasifikátoru rozhodovacího stromu. Porozumíte důležitosti těchto dvou parametrů: random_state a max_depth.

Parametr random_state se používá pro většinu algoritmů strojového učení. Řídí náhodnost algoritmu. Když použijete tento estimátor k rozdělení dat na data k trénování s daty a k testování, počáteční hodnota, která je zde uvedena, určuje náhodnost tohoto rozdělení. Další lekce obsahuje další informace o rozdělení dat.

Parametr max_depth je parametr specifický pro strom, který umožňuje určit rozsah výstupu modelu. V tomto případě není to tak informativní, že byste znali každou možnou pravděpodobnost konkrétního počasí a to, jak může ovlivnit pravděpodobnost startu rakety. Hloubka je omezena na pět, aby se omezily znalosti získané na to, co je nejvíce prakticky související s výsledkem.

Další průzkum

Pokud vás to zajímá, můžete zkusit tento modul dokončit tak, jak je. Pak se můžete vrátit zpátky a změnit hodnoty parametrů, abyste zjistili, jaký druh nových poznatků můžete získat.