Indsaml billeder
Hvis du vil træne en objektregistreringsmodel til at genkende dine objekter, skal du indsamle billeder, der indeholder de pågældende objekter. Overhold retningslinjerne for billedmængde og -kvalitet for at få bedre resultater.
De billeder, der indføres i din model til objektregistrering, skal have disse karakteristika:
Format:
- JPG
- PNG
- BMP
Størrelse:
- Maks. 6 MB for træning
- minimum bredde/højde på 256 pixel x 256 pixel
Det er vigtigt at uploade nok billeder for at oplære din AI-model. Et godt udgangspunkt er at have mindst 15 billeder pr. objekt i træningssættet. Med færre billeder er der høj risiko for, at din model kan lære begreber, der bare er støj eller ikke relevante. Hvis du oplærer din model med flere billeder, øges nøjagtigheden.
En anden vigtig overvejelse er at sikre, at dataene er balanceret. Hvis du har 500 billeder til ét objekt og kun 50 billeder til et andet, er der ikke balance i dit træningssæt. Det kan medføre, at modellen bliver bedre til at genkende et af objekterne. Hvis du vil have mere ensartede resultater, skal du opretholde et forhold på mindst 1:2 mellem objektet med færrest billeder set i forhold til det, der har flest. Hvis objektet med flest antal billeder f.eks. har 500 billeder, skal objektet med færrest billeder have mindst 250 billeder til træning.
Angiv billeder, der er repræsentative for, hvad der sendes til modellen under normal brug. Lad os f.eks. sige, at du oplærer en model til at genkende æbler. Hvis du kun oplærer den til at genkende billeder af æbler på et fad, kan den muligvis ikke genkende æbler i træer på samme måde. Hvis du inkluderer forskellige slags billeder, skal du sikre, at din model ikke er forudindtaget, og at den er god til at generalisere. Følgende eksempler viser nogle af de måder, hvorpå du kan gøre dit træningssæt mere alsidigt.
Brug billeder af objekterne foran forskellige baggrunde – f.eks. frugt på tallerkener, i hænder og på træer. Fotos i kontekst er bedre end fotos foran neutrale baggrunde, da de indeholder flere oplysninger om klassificeringen.
Brug træningsbilleder med forskellig belysning, især hvis de billeder, der bruges til registrering, kan have forskellig belysning. F.eks. indeholder dine billeder, der er taget med blitz, høj eksponering osv. Det er også nyttigt at inkludere billeder med forskellig mætningsgrad, nuance og lysstyrke. Du kan sandsynligvis styre disse indstillinger fra enhedens kamera.
Leverer billeder, hvor objekterne er af varierende størrelse, og som indfanger forskellige dele af objektet – f.eks. et foto af bananer og et close-up af en enkelt banan. Forskellige størrelser hjælper modellen med at generalisere bedre.
Prøv at levere billeder, der er taget fra forskellige vinkler. Hvis alle dine billeder er fra en række bestemte kameraer, f.eks. overvågningskameraer, skal du tildele et separat navn til de enkelte kameraer. Det kan hjælpe med at undgå modellering af ikke-relaterede objekter, f.eks. lygtepæle, som nøgleegenskab. Tildel kameranavne, også selvom kameraerne optager de samme objekter.
AI-modeller kan fejlagtigt lære at genkende egenskaber, som dine billeder har til fælles. Lad os sige, at du vil oprette en model, som kan skelne mellem æbler og citrusfrugter. Hvis du bruger billeder af æbler i hænder og citrusfrugter på hvide fade, oplæres modellen muligvis i at genkende hænder i stedet hvide fade og ikke æbler i stedet for citrusfrugter.
Du kan løse dette problem ved at bruge ovenstående vejledning i træning med mere forskelligartede billeder: Angiv billeder med forskellige vinkler, baggrunde, objektstørrelser, grupper og andre varianter.