Les på engelsk

Del via


Samle avbildninger

Hvis du vil kalibrere en objektgjenkjenningsmodell til å gjenkjenne objektene dine, må du samle bilder som inneholder de objektene. Overhold retningslinjene for bildeantallet og -kvaliteten for å få bedre resultater.

Format og størrelse

Bildene du mater inn i objektgjenkjenningsmodellen, må ha disse egenskapene:

  • Format:

    • JPG
    • PNG
    • BMP
  • Størrelse:

    • 6 MB maksimum for opplæring
    • minimumsbredde/-høyde på 256 x 256 piksler

Datamengde og -balanse

Det er viktig er å laste opp nok bilder til å kalibrere AI-modellen. Et godt utgangspunkt er å ha minst 15 bilder per objekt for kalibrerignssettet. Med færre bilder er det en sterk risiko for at modellen vil lære konsepter som bare er støy, eller som ikke er relevante. Ved å kalibrere modellen med flere bilder bør du kunne øke nøyaktigheten.

En annen vurdering er å sørge for at dataene er balanserte. Hvis du har 500 bilder for ett objekt og bare 50 bilder for et annet, blir ikke kalibreringsdatasettet balansert. Dette kan føre til at modellen blir bedre til å gjenkjenne ett av objektene. Hvis du vil ha mer konsekvente resultater, kan du opprettholde minst et 1:2-forhold mellom objektet med færrest bilder og det med flest. Hvis for eksempel objektet med det største bildeantallet har 500 bilder, bør objektet med de færreste bildene ha minst 250 bilder for kalibreringsprosessen.

Bruk flere bilder som skiller seg ut

Bruk bilder som er representative for det som blir innsendt til modellen i løpet av normal bruk. La oss for eksempel si at du kalibrerer en modell til å gjenkjenne epler. Hvis du bare kalibrerer bilder av epler på tallerkener, kan det hende at den ikke konsekvent gjenkjenner epler i trær. Hvis du inkluderer ulike typer bilder, sørger du for at modellen ikke er ensidig, og at den er god til å generalisere. Nedenfor finner du noen måter du kan gjøre kalibreringssettet mer mangfoldig.

Bakgrunn

Bruk bilder av objektene foran forskjellige bakgrunner, for eksempel frukt på tallerkener, i hender og på trær. Bilder i kontekst er bedre enn bilder foran nøytrale bakgrunner, fordi de gir mer informasjon om klassifisereren.

Bildebakgrunner.

Belysning

Bruk kalibreringsbilder som har ulik belysning, spesielt hvis bildene som brukes til gjenkjenning, kan ha ulik belysning. For eksempel kan du inkludere bilder som er tatt med blits, høy eksponering og så videre. Det er også nyttig å bruke bilder med variert metning, nyanse og lysstyrke. Med enhetskameraet kan du trolig styre disse innstillingene.

Bildebelysning.

Objektstørrelse

Viser bilder der objektene har ulike størrelser, slik at ulike deler av objektet blir tatt bilde av, for eksempel et bilde av en klase bananer og et nærbilde av én banan. Forskjellige størrelser bidrar til at modellen generaliserer bedre.

Objektstørrelser.

Kameravinkel

Prøv å bruke bilder som er tatt fra ulike vinkler. Hvis alle bildene dine er fra et sett med faste kameraer, for eksempel overvåkningskameraer, kan du tilordne en ulik etikett til hvert kamera. Dette kan bidra til å unngå modellering av urelaterte objekter, for eksempel lampeposter, som nøkkelfunksjon. Tilordne kameraetiketter selv om kameraene lagrer de samme objektene.

Kameravinkler.

Uventede resultater

AI-modeller kan lære feil informasjon som er felles for bildene. La oss si at du ønsker å opprette en modell for å skille epler fra sitrusfrukt. Hvis du bruker bilder av epler i hender og sitrusfrukter på hvite tallerkener, kan modellen lære å skille hender fra hvite tallerkener i stedet for å skille epler fra sitrusfrukter.

Uventede resultater.

Du løser dette problemet ved å bruke veiledningen ovenfor på kalibreringsprosessen med mer varierte bilder: bruk bilder med ulike vinkler, bakgrunner, objektstørrelse, grupper og andre varianter.

Kom i gang med objektregistrering