Mengumpulkan gambar

Artikel
24/07/2024

Untuk melatih model Deteksi objek agar mengenali objek Anda, Anda harus mengumpulkan gambar yang berisi objek tersebut. Patuhi pedoman kuantitas dan kualitas gambar untuk hasil yang lebih baik.

Format dan ukuran

Gambar yang akan Anda berikan ke model Deteksi objek Anda memerlukan karakteristik berikut:

Format:
- JPG
- PNG
- BMP
Ukuran:
- Maksimum 6 MB untuk pelatihan
- Lebar / tinggi minimum 256 piksel x 256 piksel

Kuantitas data dan keseimbangan data

Penting untuk mengunggah gambar yang cukup untuk melatih model AI Anda. Titik awal yang baik adalah memiliki setidaknya 15 gambar per objek untuk set pelatihan. Dengan gambar yang lebih sedikit, ada risiko kuat bahwa model Anda akan mempelajari konsep yang hanya noise, atau tidak relevan. Melatih model Anda dengan lebih banyak gambar akan meningkatkan akurasi.

Pertimbangan lainnya adalah memastikan data Anda seimbang. Jika Anda memiliki 500 gambar untuk satu objek dan hanya 50 gambar untuk objek lainnya, himpunan data pelatihan Anda tidak seimbang. Hal ini dapat menyebabkan model menjadi lebih baik dalam mengenali salah satu objek. Untuk hasil yang lebih konsisten, pertahankan setidaknya rasio 1:2 antara objek dengan gambar paling sedikit versus objek dengan gambar terbanyak. Misalnya, jika objek dengan jumlah gambar terbanyak memiliki 500 gambar, objek dengan gambar paling sedikit harus memiliki setidaknya 250 gambar untuk pelatihan.

Gunakan gambar yang lebih beragam

Berikan gambar yang mewakili apa yang akan dikirimkan ke model selama penggunaan normal. Misalnya, Anda melatih model untuk mengenali apel. Jika Anda hanya melatih gambar apel di piring, itu mungkin tidak secara konsisten mengenali apel di pohon. Menyertakan berbagai jenis gambar akan memastikan bahwa model Anda tidak bias dan dapat digeneralisasi dengan baik. Berikut ini adalah beberapa cara Anda dapat membuat set latihan Anda lebih beragam.

Latar belakang

Gunakan gambar objek Anda di depan latar belakang yang berbeda—misalnya, buah di piring, di tangan, dan di pohon. Foto dalam konteks lebih baik daripada foto di depan latar belakang netral karena memberikan lebih banyak informasi untuk pengklasifikasi.

Latar belakang gambar.

Pencahayaan

Gunakan gambar pelatihan yang memiliki pencahayaan berbeda, terutama jika gambar yang digunakan untuk deteksi mungkin memiliki pencahayaan yang berbeda. Misalnya, sertakan gambar yang diambil dengan lampu kilat, pencahayaan tinggi, dan sebagainya. Ini juga membantu untuk menyertakan gambar dengan saturasi, rona, dan kecerahan yang bervariasi. Kamera perangkat Anda mungkin memungkinkan Anda mengontrol pengaturan ini.

Pencahayaan gambar.

Ukuran objek

Berikan gambar di mana objek memiliki ukuran yang bervariasi, menangkap berbagai bagian objek—misalnya, foto tandan pisang dan closeup satu pisang. Ukuran yang berbeda membantu model menggeneralisasi dengan lebih baik.

Ukuran objek.

Sudut kamera

Cobalah untuk memberikan gambar yang diambil dari sudut yang berbeda. Jika semua foto Anda berasal dari satu set kamera tetap seperti kamera pengintai, tetapkan label yang berbeda untuk setiap kamera. Ini dapat membantu menghindari pemodelan objek yang tidak terkait seperti tiang lampu sebagai fitur utama. Tetapkan label kamera meskipun kamera menangkap objek yang sama.

Sudut kamera.

Hasil yang tidak terduga

Model AI dapat salah mempelajari karakteristik yang dimiliki gambar Anda. Katakanlah Anda ingin membuat model untuk membedakan apel dari jeruk. Jika Anda menggunakan gambar apel di tangan dan jeruk di piring putih, model mungkin melatih tangan versus piring putih, bukan apel versus jeruk.

Hasil yang tidak terduga.

Untuk memperbaikinya, gunakan panduan di atas tentang pelatihan dengan gambar yang lebih bervariasi: sediakan gambar dengan sudut, latar belakang, ukuran objek, grup, dan varian lainnya yang berbeda.

Mulai dengan Deteksi objek

Bagikan melalui

Mengumpulkan gambar

Format dan ukuran

Kuantitas data dan keseimbangan data