Notă
Accesul la această pagină necesită autorizare. Puteți încerca să vă conectați sau să modificați directoarele.
Accesul la această pagină necesită autorizare. Puteți încerca să modificați directoarele.
Pentru a antrena un model de detectare a obiectelor să recunoască obiectele dvs., trebuie să adunați imagini care conțin acele obiecte. Respectați instrucțiunile privind cantitatea și calitatea imaginilor pentru rezultate mai bune.
Format și dimensiune
Imaginile cu care veți alimenta modelul de detectare a obiectelor au nevoie de aceste caracteristici:
Format:
- JPG
- PNG
- BMP
Dimensiune:
- Maxim 6 MB pentru antrenament
- lățime/înălțime minimă de 256 pixeli x 256 pixeli
Cantitatea de date și soldul datelor
Este important să încărcați suficiente imagini pentru a antrena modelul de inteligență artificială. Un bun punct de plecare este să aveți cel puțin 15 imagini per obiect pentru setul de antrenament. Cu mai puține imagini, există un risc mare ca modelul tău să învețe concepte care sunt doar zgomot sau nu sunt relevante. Antrenarea modelului cu mai multe imagini ar trebui să crească precizia.
O altă considerație este să vă asigurați că datele dvs. sunt echilibrate. Dacă aveți 500 de imagini pentru un obiect și doar 50 de imagini pentru altul, setul de date de antrenament nu este echilibrat. Acest lucru poate face ca modelul să recunoască mai bine unul dintre obiecte. Pentru rezultate mai consistente, mențineți un raport de cel puțin 1:2 între obiectul cu cele mai puține imagini și cel cu cele mai multe. De exemplu, dacă obiectul cu cel mai mare număr de imagini are 500 de imagini, obiectul cu cele mai puține imagini ar trebui să aibă cel puțin 250 de imagini pentru antrenament.
Folosește imagini mai diverse
Furnizați imagini reprezentative pentru ceea ce va fi trimis modelului în timpul utilizării normale. De exemplu, să presupunem că antrenezi un model să recunoască merele. Dacă antrenezi doar imagini cu mere pe farfurii, este posibil ca sistemul să nu recunoască în mod constant merele din copaci. Includerea diferitelor tipuri de imagini va asigura că modelul tău nu este părtinitor și poate generaliza bine. Următoarele sunt câteva modalități prin care vă puteți diversifica setul de antrenament.
Fundal
Folosește imagini cu obiectele tale în fața unor fundaluri diferite - de exemplu, fructe pe farfurii, în mâini și pe copaci. Fotografiile în context sunt mai bune decât fotografiile pe fundaluri neutre, deoarece oferă mai multe informații clasificatorului.
Iluminat
Folosește imagini de antrenament care au iluminare diferită, mai ales dacă imaginile folosite pentru detectare ar putea avea iluminare diferită. De exemplu, includeți imagini realizate cu bliț, cu expunere mare și așa mai departe. De asemenea, este util să includeți imagini cu saturație, nuanță și luminozitate variate. Probabil că este posibil ca camera dispozitivului să vă permită să controlați aceste setări.
Dimensiunea obiectului
Furnizați imagini în care obiectele au dimensiuni variate, surprinzând diferite părți ale obiectului - de exemplu, o fotografie cu ciorchini de banane și un prim-plan al unei singure banane. Dimensionarea diferită ajută modelul să generalizeze mai bine.
Unghiul camerei
Încercați să oferiți imagini realizate din unghiuri diferite. Dacă toate fotografiile provin de la un set de camere fixe, cum ar fi camerele de supraveghere, atribuiți o etichetă diferită fiecărei camere. Acest lucru poate ajuta la evitarea modelării obiectelor fără legătură, cum ar fi stâlpii de iluminat, ca element cheie. Atribuiți etichete camerelor chiar dacă camerele capturează aceleași obiecte.
Rezultate neașteptate
Modelele de inteligență artificială pot învăța incorect caracteristici pe care imaginile tale le au în comun. Să presupunem că vrei să creezi un model pentru a distinge merele de citrice. Dacă folosiți imagini cu mere în mâini și citrice pe farfurii albe, modelul s-ar putea antrena pentru mâini versus farfurii albe în loc de mere versus citrice.
Pentru a corecta acest lucru, utilizați îndrumările de mai sus privind antrenamentul cu imagini mai variate: furnizați imagini cu unghiuri, fundaluri, dimensiuni ale obiectelor, grupuri și alte variante diferite.