Cvičení – trénování a testování modelu strojového učení pro předpovídání úspěšného startu rakety
Po oddělení dat do sekcí trénování a testování můžeme náš model strojového učení trénovat. Jedním z důvodů, proč je Python oblíbeným jazykem pro datové vědy a strojové učení, je z důvodu všech těch knihoven, které existují pro podporu studování dat. Jak jsme viděli, vytvoření modelu strojového učení a rozdělení dat bylo jednoduché. Přizpůsobení a testování modelu bude také jednoduché.
Přizpůsobení modelu
Dalším krokem v životním cyklu datových věd je přizpůsobení modelu trénovacím datům. "Fitování" je v podstatě způsob, jakým se model učí. Tento proces byl popsán pomocí příkladu s bobulemi. Člověk byl „přizpůsobován“, když přinesl bobuli a bylo mu sděleno, o jaký druh jde. Pokud chcete přizpůsobit model, zavolejte fit()
v klasifikátoru strojového učení a předejte data X_train
a y_train
.
Přizpůsobení modelu je jako skládání praktické zkoušky, kde máte přístup k odpovědím, abyste měli jistotu, že rozumíte konceptům.
# Fitting the model to the training data
tree_model.fit(X_train,y_train)
Test modelu
Testování modelu je také snadné díky knihovnám, které jsme naimportovali. Testování modelu je jako skládání zkoušky. Poskytnete X_test
(20 % vstupních dat rezervovaných pro testování) funkci predict()
klasifikátoru. Tato funkce vrátí seznam Y
a N
, který představuje, co si model myslí, že se stane, kdyby došlo k pokusu o vypuštění rakety s ohledem na konkrétní sadu povětrnostních podmínek.
Vložte následující kód do nástroje Visual Studio Code, který vytvoří předpovědi a potom předpovědi vytiskne.
# Do prediction on test Data
y_pred = tree_model.predict(X_test)
print(y_pred)
Kolik Y
jste získali? Vypadají předpovědi názorně vzhledem ke vstupním datům? Bez dalšího zkoumání to není zřejmé, ale zatím výstup obsahuje zhruba 9 odpovědí Y
z 60 vstupních hodnot. Přibližně 20 % celkových dat vrátilo Y
. Naše procento je přibližně 15 % z těchto předpovídaná dat, takže je relativně blízko.