Instruirea unui detector de obiecte

Finalizat

Detectarea obiectelor este o formă de vedere a computerului în care un model este instruit să detecteze prezența și locația unuia sau a mai multor clase de obiecte dintr-o imagine.

Fotografie cu locația și tipul de fructe detectate.

Există două componente pentru predicția detectării obiectelor:

  • Eticheta de clasă a fiecărui obiect detectat în imagine. De exemplu, este posibil să constatați că o imagine conține un măr, o portocalie și o banană.
  • Locația fiecărui obiect din imagine, indicată ca coordonate ale unei casete de încadrare care încadrează obiectul.

Pentru a instrui un model de detectare a obiectelor, puteți utiliza portalul Azure AI Custom Vision pentru a încărca și a eticheta imagini înainte de instruire, evaluarea, testarea și publicarea modelului; sau puteți utiliza API-ul REST sau un SDK specific limbii pentru a scrie cod care efectuează activitățile de instruire.

Etichetarea imaginilor

Puteți utiliza Azure AI Custom Vision pentru a crea proiecte pentru clasificarea imaginilor sau detectarea obiectelor. Cea mai semnificativă diferență între instruirea unui model de clasificare a imaginilor și instruirea unui model de detectare a obiectelor este etichetarea imaginilor cu etichete. Deși clasificarea imaginilor necesită una sau mai multe etichete care se aplică la întreaga imagine, detectarea obiectelor necesită ca fiecare etichetă să fie formată dintr-o etichetă și o regiune care definește caseta de încadrare pentru fiecare obiect dintr-o imagine.

Etichetarea imaginilor în portalul Vizualizare particularizată Azure AI

Portalul Azure AI Custom Vision oferă o interfață grafică pe care o puteți utiliza pentru a eticheta imaginile de instruire.

Captură de ecran a imaginilor etichetate în portalul Azure AI Custom Vision.

Cea mai simplă opțiune pentru etichetarea imaginilor pentru detectarea obiectelor este să utilizați interfața interactivă în portalul Azure AI Custom Vision. Această interfață sugerează automat regiunile care conțin obiecte, cărora le puteți atribui etichete sau ajusta glisând caseta de încadrare pentru a încadra obiectul pe care doriți să-l etichetați.

În plus, după etichetarea unui set inițial de imagini, puteți instrui modelul. Etichetarea ulterioară a noilor imagini poate beneficia de instrumentul de etichetare inteligentă din portal, care poate sugera nu numai regiunile, ci și clasele de obiecte pe care le conțin.

Abordări alternative de etichetare

Ca alternativă, puteți utiliza un instrument de etichetare particularizat sau terț sau puteți alege să etichetați manual imaginile, pentru a profita de alte caracteristici, cum ar fi atribuirea de activități de etichetare a imaginilor mai multor membri ai echipei.

Dacă alegeți să utilizați un alt instrument de etichetare decât portalul Azure AI Custom Vision, poate fi necesar să ajustați rezultatul pentru a corespunde unităților de măsură așteptate de API-ul Vizualizare particularizată Azure AI. Casetele de încadrare sunt definite de patru valori care reprezintă coordonatele din stânga (X) și de sus (Y) ale colțului din stânga sus al casetei de încadrare și lățimea și înălțimea casetei de încadrare. Aceste valori sunt exprimate ca valori proporționale față de dimensiunea imaginii sursă. De exemplu, luați în considerare această casetă de încadrare:

  • Stânga: 0,1
  • Top: 0,5
  • Lățime: 0,5
  • Înălțime: 0,25

Aceasta definește o casetă în care partea stângă se află 0,1 (o zecime) de marginea din stânga a imaginii, iar partea de sus este de 0,5 (jumătate din înălțimea imaginii) de sus. Caseta este la jumătate din lățime și un sfert din înălțimea imaginii generale.

Următoarea imagine afișează etichetarea informațiilor în format JSON pentru obiectele dintr-o imagine.

Fotografie cu etichete JSON pentru obiectele pe care le conține.