Latihan - Melakukan Regresi Linier dengan Scikit Learn
Pustaka Python populer lain yang banyak digunakan di komunitas penelitian adalah scikit-learn, yang unggul dalam membangun model pembelajaran mesin untuk membantu mengekstrak informasi dari data. Dalam latihan ini, Anda akan menggunakan scikit-learn (yang sudah diimpor di Unit 2) untuk menghitung garis tren untuk data iklim NASA.
Tempatkan kursor di sel kosong di bagian bawah buku catatan. Ubah jenis sel menjadi Markdown dan masukkan "Lakukan regresi linier dengan scikit-learn" sebagai teks.
Tambahkan sel Kode dan tempelkan kode berikut.
# Pick the Linear Regression model and instantiate it model = LinearRegression(fit_intercept=True) # Fit/build the model model.fit(yearsBase[:, np.newaxis], meanBase) mean_predicted = model.predict(yearsBase[:, np.newaxis]) # Generate a plot like the one in the previous exercise plt.scatter(yearsBase, meanBase) plt.plot(yearsBase, mean_predicted) plt.title('scatter plot of mean temp difference vs year') plt.xlabel('years', fontsize=12) plt.ylabel('mean temp difference', fontsize=12) plt.show() print(' y = {0} * x + {1}'.format(model.coef_[0], model.intercept_))Sekarang jalankan sel untuk menampilkan plot sebar dengan garis regresi.
Plot sebar dengan garis regresi yang dihitung oleh sckikit-learn
Output hampir identik dengan output dalam latihan sebelumnya. Perbedaannya adalah bahwa scikit-learn melakukan lebih banyak pekerjaan untuk Anda. Khususnya, Anda tidak perlu membuat kode fungsi baris seperti yang Anda lakukan dengan NumPy; fungsi scikit-learn LinearRegression melakukannya untuk Anda. scikit-learn mendukung berbagai jenis regresi, yang berguna saat membangun model pembelajaran mesin yang canggih.