Събиране на изображения
За да обучите модел за Откриване на обекти да разпознава вашите обекти, трябва да съберете изображения, които съдържат тези обекти. Придържайте се към указанията за количество и качество на изображението за по-добри резултати.
Формат и размер
Изображенията, които ще подавате на вашия модел за Откриване на обекти, се нуждаят от следните характеристики:
Формат:
- JPG
- PNG
- BMP
Размер:
- 6 MB максимум за тренировка
- минимална ширина/височина от 256 пиксела x 256 пиксела
Количество данни и баланс на данните
Важно е да качите достатъчно изображения, за да обучите вашия AI модел. Добра отправна точка е да имате поне 15 изображения на обект за тренировъчния набор. С по-малко изображения съществува голям риск вашият модел да научи концепции, които са просто шум или не са подходящи. Обучението на вашия модел с повече изображения трябва да увеличи точността.
Друго съображение е да се уверите, че данните ви са балансирани. Ако имате 500 изображения за един обект и само 50 изображения за друг, вашият набор от данни за обучение не е балансиран. Това може да доведе до по-добро разпознаване на един от обектите на модела. За по-последователни резултати поддържайте съотношение поне 1:2 между обекта с най-малко изображения и този с най-много. Например, ако обектът с най-голям брой изображения има 500 изображения, обектът с най-малко изображения трябва да има поне 250 изображения за обучение.
Използвайте по-разнообразни изображения
Осигурете изображения, които са представителни за това, което ще бъде изпратено на модела по време на нормална употреба. Например, да приемем, че обучавате модел да разпознава ябълки. Ако тренирате изображения на ябълки само върху чинии, той може да не разпознава постоянно ябълките по дърветата. Включването на различни видове изображения ще гарантира, че вашият модел не е пристрастен и може да обобщава добре. Следват няколко начина, по които можете да направите тренировъчния си комплект по-разнообразен.
Фон
Използвайте изображения на вашите обекти пред различни фонове – например плодове върху чинии, ръце и дървета. Снимките в контекст са по-добри от снимките пред неутрален фон, защото предоставят повече информация за класификатора.
Осветление
Използвайте обучителни изображения, които имат различно осветление, особено ако изображенията, използвани за откриване, може да имат различно осветление. Например включете изображения, направени със светкавица, висока експозиция и т.н. Също така е полезно да включите изображения с различна наситеност, нюанс и яркост. Камерата на вашето устройство вероятно ви позволява да контролирате тези настройки.
Размер на обекта
Осигурете изображения, в които обектите са с различни размери, улавяйки различни части от обекта – например снимка на гроздове банани и близък план на един банан. Различното оразмеряване помага на модела да се обобщи по-добре.
Ъгъл на камерата
Опитайте се да предоставите изображения, направени от различни ъгли. Ако всичките ви снимки са от набор от фиксирани камери, като например камери за наблюдение, задайте различен етикет на всяка камера. Това може да помогне да се избегне моделирането на несвързани обекти като стълбове като ключова характеристика. Задайте етикети на камерата, дори ако камерите заснемат едни и същи обекти.
Неочаквани резултати
Моделите с изкуствен интелект могат неправилно да научат характеристиките, които вашите изображения имат общо. Да приемем, че искате да създадете модел за разграничаване на ябълките от цитрусовите плодове. Ако използвате изображения на ябълки в ръце и на цитрусови плодове върху бели чинии, моделът може да тренира за ръце срещу бели чинии вместо ябълки срещу цитрусови плодове.
За да коригирате това, използвайте горните насоки за обучение с по-разнообразни изображения: осигурете изображения с различни ъгли, фон, размер на обекта, групи и други варианти.