Latihan - Melakukan Regresi Linier dengan Scikit Learn

Selesai

Pustaka Python populer lain yang banyak digunakan di komunitas penelitian adalah scikit-learn, yang unggul dalam membangun model pembelajaran mesin untuk membantu mengekstrak informasi dari data. Dalam latihan ini, Anda akan menggunakan scikit-learn (yang sudah diimpor di Unit 2) untuk menghitung garis tren untuk data iklim NASA.

  1. Tempatkan kursor di sel kosong di bagian bawah buku catatan. Ubah jenis sel menjadi Markdown dan masukkan "Lakukan regresi linier dengan scikit-learn" sebagai teks.

  2. Tambahkan sel Kode dan tempelkan kode berikut.

    # Pick the Linear Regression model and instantiate it
    model = LinearRegression(fit_intercept=True)
    
    # Fit/build the model
    model.fit(yearsBase[:, np.newaxis], meanBase)
    mean_predicted = model.predict(yearsBase[:, np.newaxis])
    
    # Generate a plot like the one in the previous exercise
    plt.scatter(yearsBase, meanBase)
    plt.plot(yearsBase, mean_predicted)
    plt.title('scatter plot of mean temp difference vs year')
    plt.xlabel('years', fontsize=12)
    plt.ylabel('mean temp difference', fontsize=12)
    plt.show()
    
    print(' y = {0} * x + {1}'.format(model.coef_[0], model.intercept_))
    
  3. Sekarang jalankan sel untuk menampilkan plot sebar dengan garis regresi.

    Plot sebar dengan garis regresi yang dihitung dengan sckikit-learn.

    Plot sebar dengan garis regresi yang dihitung oleh sckikit-learn

Output hampir identik dengan output dalam latihan sebelumnya. Perbedaannya adalah bahwa scikit-learn melakukan lebih banyak pekerjaan untuk Anda. Khususnya, Anda tidak perlu membuat kode fungsi baris seperti yang Anda lakukan dengan NumPy; fungsi scikit-learn LinearRegression melakukannya untuk Anda. scikit-learn mendukung berbagai jenis regresi, yang berguna saat membangun model pembelajaran mesin yang canggih.