Cvičení – trénování a testování modelu strojového učení pro předpovídání úspěšného startu rakety

Dokončeno

Po oddělení dat do sekcí trénování a testování můžeme náš model strojového učení trénovat. Jedním z důvodů, proč je Python oblíbeným jazykem pro datové vědy a strojové učení, je z důvodu všech těch knihoven, které existují pro podporu studování dat. Jak jsme viděli, vytvoření modelu strojového učení a rozdělení dat bylo jednoduché. Přizpůsobení a testování modelu bude také jednoduché.

Přizpůsobení modelu

Dalším krokem v životním cyklu datových věd je přizpůsobení modelu trénovacím datům. "Fitování" je v podstatě způsob, jakým se model učí. Tento proces byl popsán pomocí příkladu s bobulemi. Člověk byl „přizpůsobován“, když přinesl bobuli a bylo mu sděleno, o jaký druh jde. Pokud chcete přizpůsobit model, zavolejte fit() v klasifikátoru strojového učení a předejte data X_train a y_train.

Přizpůsobení modelu je jako skládání praktické zkoušky, kde máte přístup k odpovědím, abyste měli jistotu, že rozumíte konceptům.

# Fitting the model to the training data
tree_model.fit(X_train,y_train)

Test modelu

Testování modelu je také snadné díky knihovnám, které jsme naimportovali. Testování modelu je jako skládání zkoušky. Poskytnete X_test (20 % vstupních dat rezervovaných pro testování) funkci predict() klasifikátoru. Tato funkce vrátí seznam Y a N, který představuje, co si model myslí, že se stane, kdyby došlo k pokusu o vypuštění rakety s ohledem na konkrétní sadu povětrnostních podmínek.

Vložte následující kód do nástroje Visual Studio Code, který vytvoří předpovědi a potom předpovědi vytiskne.

# Do prediction on test Data
y_pred = tree_model.predict(X_test)
print(y_pred)

Kolik Y jste získali? Vypadají předpovědi názorně vzhledem ke vstupním datům? Bez dalšího zkoumání to není zřejmé, ale zatím výstup obsahuje zhruba 9 odpovědí Y z 60 vstupních hodnot. Přibližně 20 % celkových dat vrátilo Y. Naše procento je přibližně 15 % z těchto předpovídaná dat, takže je relativně blízko.