Colectarea imaginilor
Pentru a antrena un model Detectare obiecte pentru a vă recunoaște obiectele, trebuie să adunați imagini care conțin acele obiecte. Respectați instrucțiunile privind cantitatea și calitatea imaginii pentru rezultate mai bune.
Imaginile pe care le vei alimenta modelul Detectare obiecte au nevoie de aceste caracteristici:
Format:
- JPG
- PNG
- BMP
Dimensiune:
- Maxim 6 MB pentru antrenament
- lățime/înălțime minimă de 256 pixeli x 256 pixeli
Este important să încărcați suficiente imagini pentru a vă antrena modelul AI. Un bun punct de plecare este să aveți cel puțin 15 imagini per obiect pentru setul de antrenament. Cu mai puține imagini, există un risc mare ca modelul dvs. să învețe concepte care sunt doar zgomote sau nu sunt relevante. Antrenarea modelului cu mai multe imagini ar trebui să mărească precizia.
Un alt aspect este să vă asigurați că datele dvs. sunt echilibrate. Dacă aveți 500 de imagini pentru un obiect și doar 50 de imagini pentru altul, setul de date de antrenament nu este echilibrat. Acest lucru poate face ca modelul să recunoască mai bine unul dintre obiecte. Pentru rezultate mai consistente, mențineți un raport de cel puțin 1:2 între obiectul cu cele mai puține imagini față de cel cu cele mai multe. De exemplu, dacă obiectul cu cel mai mare număr de imagini are 500 de imagini, obiectul cu cele mai puține imagini ar trebui să aibă cel puțin 250 de imagini pentru antrenament.
Furnizați imagini reprezentative pentru ceea ce va fi transmis modelului în timpul utilizării normale. De exemplu, să presupunem că antrenezi un model să recunoască merele. Dacă antrenați doar imagini cu mere pe farfurii, este posibil să nu recunoască în mod constant merele din copaci. Includerea diferitelor tipuri de imagini vă va asigura că modelul dvs. nu este părtinitor și se poate generaliza bine. Următoarele sunt câteva modalități prin care vă puteți diversifica setul de antrenament.
Folosiți imagini ale obiectelor dvs. în fața diferitelor fundaluri, de exemplu, fructe pe farfurii, în mâini și pe copaci. Fotografiile în context sunt mai bune decât fotografiile în fața fundalurilor neutre, deoarece oferă mai multe informații pentru clasificator.
Utilizați imagini de antrenament care au iluminare diferită, mai ales dacă imaginile utilizate pentru detectare ar putea avea o iluminare diferită. De exemplu, includeți imagini realizate cu bliț, expunere mare și așa mai departe. De asemenea, este util să includeți imagini cu saturație, nuanță și luminozitate variate. Camera dispozitivului vă permite probabil să controlați aceste setări.
Furnizați imagini în care obiectele sunt de dimensiuni variate, surprinzând diferite părți ale obiectului, de exemplu, o fotografie cu ciorchini de banane și un prim-plan al unei singure banane. Dimensiunile diferite ajută modelul să se generalizeze mai bine.
Încercați să oferiți imagini luate din unghiuri diferite. Dacă toate fotografiile dvs. provin dintr-un set de camere fixe, cum ar fi camerele de supraveghere, atribuiți o etichetă diferită fiecărei camere. Acest lucru poate ajuta la evitarea modelării obiectelor care nu au legătură, cum ar fi stâlpii de iluminat, ca caracteristică cheie. Atribuiți etichete camerei chiar dacă camerele captează aceleași obiecte.
Modelele AI pot învăța incorect caracteristicile pe care imaginile dvs. le au în comun. Să presupunem că doriți să creați un model pentru a distinge merele de citrice. Dacă utilizați imagini cu mere în mâini și cu citrice pe farfurii albe, modelul s-ar putea antrena pentru mâini versus farfurii albe în loc de mere versus citrice.
Pentru a corecta acest lucru, utilizați îndrumările de mai sus privind antrenamentul cu imagini mai variate: furnizați imagini cu diferite unghiuri, fundaluri, dimensiunea obiectului, grupuri și alte variante.