Mengumpul imej

Artikel
24/07/2024

Untuk melatih model Pengesanan objek untuk mengenali objek anda, anda perlu mengumpulkan imej yang mengandungi objek tersebut. Patuhi garis panduan untuk kuantiti dan kualiti imej untuk hasil yang lebih baik.

Format dan saiz

Imej yang akan anda berikan kepada model Pengesanan objek anda memerlukan ciri-ciri ini:

Format:
- JPG
- PNG
- BMP
Saiz:
- Maksimum 6 MB untuk latihan
- Lebar / tinggi minimum 256 piksel x 256 piksel

Kuantiti data dan keseimbangan data

Adalah penting untuk memuat naik imej yang mencukupi untuk melatih model AI anda. Titik permulaan yang baik ialah mempunyai sekurang-kurangnya 15 imej setiap objek untuk set latihan. Dengan imej yang lebih sedikit, terdapat risiko yang kuat bahawa model anda akan mempelajari konsep yang hanya bunyi bising, atau tidak relevan. Melatih model anda dengan lebih banyak imej harus meningkatkan ketepatan.

Pertimbangan lain ialah memastikan data anda seimbang. Jika anda mempunyai 500 imej untuk satu objek dan hanya 50 imej untuk objek lain, set data latihan anda tidak seimbang. Ini boleh menyebabkan model menjadi lebih baik dalam mengenali salah satu objek. Untuk hasil yang lebih konsisten, kekalkan sekurang-kurangnya nisbah 1:2 antara objek dengan imej paling sedikit berbanding objek yang paling banyak. Sebagai contoh, jika objek dengan bilangan imej terbanyak mempunyai 500 imej, objek dengan imej paling sedikit harus mempunyai sekurang-kurangnya 250 imej untuk latihan.

Gunakan imej yang lebih pelbagai

Sediakan imej yang mewakili apa yang akan diserahkan kepada model semasa penggunaan biasa. Sebagai contoh, katakan anda sedang melatih model untuk mengenali epal. Jika anda hanya melatih imej epal di atas pinggan, ia mungkin tidak mengenali epal di pokok secara konsisten. Memasukkan pelbagai jenis imej akan memastikan model anda tidak berat sebelah dan boleh menyamaratakan dengan baik. Berikut ialah beberapa cara anda boleh menjadikan set latihan anda lebih pelbagai.

Latar belakang

Gunakan imej objek anda di hadapan latar belakang yang berbeza—contohnya, buah di atas pinggan, di tangan dan di atas pokok. Foto dalam konteks adalah lebih baik daripada foto di hadapan latar belakang neutral kerana ia memberikan lebih banyak maklumat untuk pengelas.

Latar belakang imej.

Lampu

Gunakan imej latihan yang mempunyai pencahayaan yang berbeza, terutamanya jika imej yang digunakan untuk pengesanan mungkin mempunyai pencahayaan yang berbeza. Sebagai contoh, sertakan imej yang diambil dengan denyar, pendedahan tinggi dan sebagainya. Ia juga berguna untuk memasukkan imej dengan ketepuan, warna dan kecerahan yang berbeza-beza. Kamera peranti anda mungkin membolehkan anda mengawal tetapan ini.

Pencahayaan imej.

Saiz objek

Sediakan imej di mana objek mempunyai saiz yang berbeza-beza, menangkap bahagian objek yang berlainan—contohnya, foto tandan pisang dan jarak dekat satu pisang. Saiz yang berbeza membantu model menyamaratakan dengan lebih baik.

Saiz objek.

Sudut kamera

Cuba berikan imej yang diambil dari sudut yang berbeza. Jika semua foto anda adalah daripada satu set kamera tetap seperti kamera pengawasan, tetapkan label yang berbeza kepada setiap kamera. Ini boleh membantu mengelakkan pemodelan objek yang tidak berkaitan seperti tiang lampu sebagai ciri utama. Tetapkan label kamera walaupun kamera menangkap objek yang sama.

Sudut kamera.

Hasil yang tidak dijangka

Model AI boleh salah mempelajari ciri-ciri yang mempunyai persamaan imej anda. Katakan anda ingin membuat model untuk membezakan epal dari sitrus. Jika anda menggunakan imej epal di tangan dan sitrus pada pinggan putih, model mungkin melatih tangan berbanding pinggan putih dan bukannya epal berbanding sitrus.

Hasil yang tidak dijangka.

Untuk membetulkannya, gunakan panduan di atas tentang latihan dengan imej yang lebih pelbagai: sediakan imej dengan sudut, latar belakang, saiz objek, kumpulan dan varian lain yang berbeza.

Mulakan dengan Pengesanan objek

Kongsi melalui

Mengumpul imej

Format dan saiz

Kuantiti data dan keseimbangan data