Cara menggunakan model

Selesai

Mari kita revisi bagaimana bagian-bagian ini cocok bersama-sama untuk melatih model.

Pelatihan versus menggunakan model

Penting untuk membedakan antara pelatihan dan penggunaan model.

Menggunakan model berarti memberikan input dan menerima estimasi atau prediksi. Kami melakukan proses ini baik ketika kami melatih model kami dan ketika kami atau pelanggan kami menggunakannya di dunia nyata. Menggunakan model biasanya membutuhkan waktu kurang dari beberapa detik.

Diagram showing a machine learning model with data going into the model, which then moves to an estimate.

Sebaliknya, melatih model adalah proses meningkatkan seberapa baik model bekerja. Pelatihan mengharuskan kita menggunakan model, fungsi tujuan, dan pengoptimal, dalam perulangan khusus. Pelatihan dapat memakan waktu beberapa menit atau hari untuk diselesaikan. Biasanya, kami hanya melatih model sekali. Setelah dilatih, kita dapat menggunakannya sebanyak yang kita suka tanpa membuat perubahan lebih lanjut.

Diagram of the final training, showing the machine learning model lifecycle.

Misalnya, dalam skenario penyimpanan anjing penyelamat longsoran salju, kami ingin melatih model, menggunakan himpunan data publik. Himpunan data mengubah model sehingga dapat memprediksi ukuran boot anjing berdasarkan ukuran harness-nya. Setelah model kami dilatih, kami menggunakan model sebagai bagian dari toko online kami untuk memastikan pelanggan membeli sepatu bot doggy yang sesuai dengan anjing mereka.

Data untuk digunakan, data untuk pelatihan

Ingat bahwa himpunan data adalah kumpulan informasi tentang objek atau benda. Misalnya, set data mungkin berisi informasi tentang anjing:

ID Anjing Ukuran Boot Ukuran Harness Warna Anjing Berkembang biak
0 27 12 Cokelat St Bernard
1 26 11 Hitam Labrador
2 25 10 Putih Labrador
3 29 14 Hitam Gembala Hitam

Ketika kita menggunakan model kita, kita hanya perlu kolom data yang diterima model sebagai input. Kolom ini disebut fitur. Dalam skenario kami, jika model kami menerima ukuran harness dan memperkirakan ukuran boot, maka fitur kami adalah ukuran harness.

Selama pelatihan, fungsi tujuan biasanya perlu mengetahui output model dan apa jawaban yang benar. Nilai-nilai ini disebut label. Dalam skenario kami, jika model kami memprediksi ukuran boot, ukuran boot adalah label kami.

Jadi, untuk menggunakan model, kita hanya perlu fitur, sementara selama pelatihan kita biasanya membutuhkan fitur dan label. Selama pelatihan dalam skenario kami, kami membutuhkan fitur ukuran tali anjing peliharaan dan label ukuran sepatu anjing peliharaan kami. Ketika kami menggunakan model kami di situs web kami, kami hanya perlu mengetahui fitur ukuran harness; model kami kemudian memperkirakan ukuran boot untuk kami gunakan.

Aku sudah selesai berlatih. Apa sekarang?

Setelah model menyelesaikan pelatihan, Anda dapat menyimpannya ke file dengan sendirinya. Kita tidak lagi memerlukan data asli, fungsi tujuan, atau pengoptimal model. Ketika kita ingin menggunakan model, kita dapat memuatnya dari disk, menyediakannya dengan data baru, dan mendapatkan kembali prediksi.

Dalam latihan berikutnya, kami berlatih menyimpan model, memuatnya dari disk, dan menggunakannya seperti yang kita lakukan di dunia nyata. Untuk menyelesaikan skenario toko online kami, kami juga berlatih menggunakan output model untuk memperingatkan pelanggan kami jika mereka tampaknya membeli sepatu bot doggy berukuran salah.