Afbeeldingen verzamelen
Als u een objectdetectiemodel wilt trainen om uw objecten te herkennen, moet u afbeeldingen met deze objecten verzamelen. Houd u aan de richtlijnen voor de kwantiteit en kwaliteit van afbeeldingen, voor betere resultaten.
De afbeeldingen die u gaat invoeren in het objectdetectiemodel moeten de volgende eigenschappen hebben:
Indeling:
- JPG
- PNG
- BMP
Grootte:
- Maximaal 6 MB voor training
- minimale breedte/hoogte van 256 pixels x 256 pixels
Het is belangrijk dat u voldoende afbeeldingen uploadt om het AI-model te trainen. Een goed startpunt voor de trainingsset is minimaal 15 afbeeldingen per object. Met minder afbeeldingen loopt u het risico dat het model concepten leert die in feite slechts ruis of niet relevant zijn. Als u het model traint met meer afbeeldingen vergroot dit de nauwkeurigheid.
Een andere overweging is ervoor te zorgen dat uw gegevens evenwichtig zijn. Als u 500 afbeeldingen voor één object hebt, maar slechts 50 afbeeldingen voor een ander object, is de gegevensset voor de training niet in balans. Dit kan ervoor zorgen dat het model beter in staat is om een van de objecten te herkennen. Voor meer consistente resultaten houdt u een verhouding aan van ten minste 1:2 tussen het object met de minste afbeeldingen en het object met de meeste afbeeldingen. Als het object met het grootste aantal afbeeldingen er bijvoorbeeld 500 heeft, moet het object met de minste afbeeldingen er minimaal 250 hebben voor de training.
Bied afbeeldingen aan die representatief zijn voor wat bij normaal gebruik aan het model wordt aangeboden. Stel, bijvoorbeeld, dat u een model wilt trainen om appels te herkennen. Als u alleen traint met afbeeldingen van een appel op een bord, worden appels in bomen mogelijk consistent niet herkend. Door verschillende soorten afbeeldingen op te nemen zorgt u ervoor dat het model niet bevooroordeeld is en goed kan generaliseren. Hieronder vindt u enkele manieren om uw trainingsset diverser te maken.
Gebruik afbeeldingen van uw objecten vóór verschillende achtergronden, bijvoorbeeld fruit op borden, in handen en aan bomen. Foto's in context zijn beter dan foto's met een neutrale achtergrond, omdat die meer informatie bieden voor de classificatie.
Gebruik trainingsafbeeldingen met verschillende soorten belichting, met name als de afbeeldingen die worden gebruikt voor detectie, mogelijk verschillende belichtingen hebben. Gebruik bijvoorbeeld afbeeldingen die zijn genomen met een flitser, die zijn blootgesteld aan een hoge belichting, enzovoort. Het is ook nuttig om afbeeldingen met gevarieerde verzadiging, tinten en helderheid op te nemen. U kunt deze instellingen hoogstwaarschijnlijk beheren met de camera van het apparaat.
Bied afbeeldingen met objecten van verschillende afmetingen en leg verschillende delen van het object vast, bijvoorbeeld een foto van trossen bananen en een close-up van één banaan. Met verschillende afmetingen kan het model betere generaliseren.
Kies afbeeldingen die zijn gemaakt vanuit verschillende hoeken. Als alle foto's afkomstig zijn van een set gefixeerde camera's, zoals surveillancecamera´s, wijst u aan elke camera een ander label toe. Dit kan helpen voorkomen dat niet-gerelateerde objecten, zoals lantaarnpalen, worden geregistreerd als het belangrijkste kenmerk. Wijs ook cameralabels toe als de camera's dezelfde objecten vastleggen.
AI-modellen kunnen onterecht kenmerken leren die uw afbeeldingen gemeenschappelijk hebben. Stel dat u een model wilt maken om appels te onderscheiden van citrusvruchten. Als u gebruikmaakt van afbeeldingen van appels in handen en citrusvruchten op witte borden, wordt het model mogelijk getraind op handen versus witte borden in plaats van op appels versus citrusvruchten.
U kunt dit corrigeren door de bovenstaande richtlijnen voor training met gevarieerdere afbeeldingen te volgen: bied afbeeldingen aan vanuit verschillende hoeken en met verschillende achtergronden, objectafmetingen, groepen en andere varianten.