Meningkatkan performa model Klasifikasi kategori Anda
Jika performa model Anda tidak sesuai dengan yang Anda inginkan, ada beberapa hal yang dapat Anda coba. Kiat-kiat ini dapat membantu Anda mengubah model untuk meningkatkan daya prediksinya.
Semakin banyak data pelatihan yang Anda miliki dengan label yang benar, semakin baik kinerja model Anda. Misalnya, Anda memiliki label Ya/Tidak. Jika sebagian besar data Anda hanya memiliki Ya di kolom ini, model AI Anda mungkin tidak akan belajar banyak dari data ini. Jika data Anda tidak diberi label dengan benar, model mungkin tidak akan belajar dengan baik. Sangat ideal untuk memulai dengan sekumpulan kecil contoh yang diberi label dengan benar - mungkin 100 atau kurang. Dari sana, Anda dapat terus menggandakan jumlah contoh secara berulang dan melatih ulang setiap kali, mencatat perubahan kinerja. Secara umum, lebih banyak data lebih baik, tetapi ada pengembalian yang berkurang untuk menambahkan data semakin besar kumpulan data Anda.
- Pastikan penggunaan tag Anda seimbang dalam data pelatihan Anda. Misalnya: Anda memiliki empat tag untuk 100 item teks. Dua tag pertama (tag1 dan tag2) digunakan untuk 90 item teks, tetapi dua lainnya (tag3 dan tag4) hanya digunakan pada 10 item teks yang tersisa. Kurangnya keseimbangan dapat menyebabkan model Anda kesulitan memprediksi tag3 atau tag4 dengan benar .
- Pastikan Anda melatih model menggunakan data yang mirip dengan apa yang Anda harapkan untuk menggunakan model tersebut.