Memahami konsep pembelajaran mendalam
Di otak Anda, Anda memiliki sel-sel saraf yang disebut neuron, yang terhubung satu sama lain oleh ekstensi saraf yang melewati sinyal elektrokimia melalui jaringan.
Ketika neuron pertama dalam jaringan dirangsang, sinyal input diproses, dan jika melebihi ambang tertentu, neuron diaktifkan dan meneruskan sinyal ke neuron yang terhubung. Neuron ini pada gilirannya dapat diaktifkan dan meneruskan sinyal melalui sisa jaringan. Seiring waktu, koneksi antara neuron diperkuat oleh penggunaan yang sering saat Anda belajar cara merespons secara efektif. Misalnya, jika Anda ditampilkan gambar penguin, koneksi neuron Anda memungkinkan Anda untuk memproses informasi dalam gambar dan pengetahuan Anda tentang karakteristik penguin untuk mengidentifikasinya seperti itu. Seiring waktu, jika Anda ditampilkan beberapa gambar berbagai hewan, jaringan neuron yang terlibat dalam mengidentifikasi hewan berdasarkan karakteristik mereka tumbuh lebih kuat. Dengan kata lain, Anda menjadi lebih baik dalam mengidentifikasi hewan yang berbeda secara akurat.
Pembelajaran mendalam meniru proses biologis ini menggunakan jaringan saraf buatan yang memproses input numerik daripada rangsangan elektrokimia.
Koneksi saraf masuk digantikan oleh input numerik yang biasanya diidentifikasi sebagai x. Ketika ada lebih dari satu nilai input, x dianggap vektor dengan elemen bernama x1, x2, dan sebagainya.
Terkait dengan setiap nilai x adalah bobot (w), yang digunakan untuk memperkuat atau melemahkan efek nilai x untuk mensimulasikan pembelajaran. Selain itu, input bias (b) ditambahkan untuk mengaktifkan kontrol halus melalui jaringan. Selama proses pelatihan, nilai w dan b disesuaikan untuk menyetel jaringan sehingga "belajar" untuk menghasilkan output yang benar.
Neuron itu sendiri merangkum fungsi yang menghitung jumlah tertimbang x, w, dan b. Fungsi ini pada gilirannya diapit dalam fungsi aktivasi yang membatasi hasil (seringkali ke nilai antara 0 dan 1) untuk menentukan apakah neuron meneruskan output ke lapisan neuron berikutnya dalam jaringan atau tidak.
Melatih model pembelajaran mendalam
Model pembelajaran mendalam adalah jaringan saraf yang terdiri dari beberapa lapisan neuron buatan. Setiap lapisan mewakili serangkaian fungsi yang dilakukan pada nilai x dengan bobot w terkait dan bias b , dan hasil lapisan akhir pada output label y yang diprediksi model. Dalam kasus model klasifikasi (yang memprediksi kategori atau kelas yang paling mungkin untuk data input), output adalah vektor yang berisi probabilitas untuk setiap kelas yang mungkin.
Diagram berikut mewakili model pembelajaran mendalam yang memprediksi kelas entitas data berdasarkan empat fitur (nilai x ). Output model (nilai y ) adalah probabilitas untuk masing-masing dari tiga label kelas yang mungkin.
Untuk melatih model, kerangka kerja pembelajaran mendalam memberi umpan beberapa batch data input (yang nilai label aktualnya diketahui), menerapkan fungsi di semua lapisan jaringan, dan mengukur perbedaan antara probabilitas output dan label kelas aktual yang diketahui dari data pelatihan. Perbedaan agregat antara output prediksi dan label aktual dikenal sebagai kerugian.
Setelah menghitung kehilangan agregat untuk semua batch data, kerangka kerja pembelajaran mendalam menggunakan pengoptimal untuk menentukan bagaimana bobot dan bias dalam model harus disesuaikan untuk mengurangi kerugian keseluruhan. Penyesuaian ini kemudian dipropagasi kembali ke lapisan dalam model jaringan neural, dan kemudian data diteruskan melalui jaringan lagi dan kehilangan dihitung ulang. Proses ini berulang beberapa kali (setiap iterasi dikenal sebagai epoch) sampai kehilangan diminimalkan dan model telah "mempelajari" bobot dan bias yang tepat untuk dapat memprediksi secara akurat.
Selama setiap epoch, bobot dan bias disesuaikan untuk meminimalkan kerugian. Jumlah yang disesuaikan diatur oleh tingkat pembelajaran yang Anda tentukan pada pengoptimal. Jika tingkat pembelajaran terlalu rendah, proses pelatihan mungkin membutuhkan waktu lama untuk menentukan nilai optimal; tetapi jika terlalu tinggi, pengoptimal mungkin tidak pernah menemukan nilai optimal.