Shromáždění snímků

Článek
10. 01. 2024

Pokud chcete vytrénovat model rozpoznávání objektů, aby dokázal rozpoznat vaše objekty, potřebujete shromáždit obrázky, které obsahují tyto objekty. V zájmu lepších výsledků dodržujte pokyny k množství a kvalitě obrázků.

Formát a velikost

Obrázky, které dodáte modelu rozpoznávání objektů, musí mít tyto vlastnosti:

Formát:
- JPG
- PNG
- BMP
Velikost:
- Maximum 6 MB pro trénink
- minimální šířka / výška 256 pixelů x 256 pixelů

Množství a vyváženost dat

Je důležité nahrát dostatečné množství obrázků pro vytrénování modelu AI. Pro začátek můžete použít trénovací sadu s alespoň 15 obrázky na každý objekt. Při menším počtu obrázků hrozí značné riziko, že se váš model naučí koncepty, které jsou jenom šumem nebo nejsou relevantní. Při trénování modelu s větším počtem obrázků by se měla zvýšit přesnost.

Dále musíte zajistit, aby data byla vyvážená. Pokud máte 500 obrázků pro jeden objekt a jenom 50 obrázků pro druhý, vaše trénovací sada dat není vyvážená. To může způsobit, že model bude lepší při rozpoznávání jednoho z objektů. V zájmu dosažení větší konzistence výsledků udržujte mezi objekty s nejmenším a největším počtem obrázků maximálně poměr 1:2. Pokud má například objekt s nejvíce obrázky 500 obrázků, měl by objekt s nejméně obrázky mít pro trénování alespoň 250 obrázků.

Použití různorodějších obrázků

Dodejte obrázky představující to, co se bude do modelu při normálním používání odesílat. Řekněme například, že budete trénovat model, aby rozpoznával jablka. Pokud k trénování použijete jenom obrázky jablek na talířích, nemusí model konzistentně rozpoznávat jablka na stromech. Zahrnutím různých typů obrázků zajistíte, že model nebude zkreslený a dokáže dobře zobecňovat. Níže najdete několik způsobů, jakými získáte různorodější trénovací sadu.

Na pozadí

Používejte obrázky svých objektů před různým pozadím – například ovoce na talířích, v rukou a na stromech. Fotky v kontextu jsou lepší než fotky před neutrálním pozadím, protože klasifikátoru poskytují více informací.

Pozadí obrázku.

Osvětlení

Použijte trénovací obrázky, které mají různá osvětlení, zejména v případě, že obrázky, které budete používat při rozpoznávání, můžou mít také různá osvětlení. Zahrňte například snímky pořízené s bleskem, přeexponované fotky a tak dále. Je také užitečné zahrnout obrázky s různými úrovněmi sytosti, odstínů a jasu. Tato nastavení pravděpodobně budete moct ovládat ve fotoaparátu svého zařízení.

Osvětlení obrázku.

Velikost objektu

Poskytněte obrázky, ve kterých jsou objekty různých velikostí a zachycujte různé části objektu – například fotografie trsů banánů a detailní záběr na jeden banán. Různé velikosti pomáhají modelu lépe zobecňovat.

Velikosti objektů.

Úhel záběru

Zkuste si zajistit obrázky pořízené z různých úhlů. Pokud jsou všechny fotografie ze sady pevných fotoaparátů, jako jsou například bezpečnostní kamery, přiřaďte každému fotoaparátu jiný popisek. To může pomoct k tomu, abyste se vyhnuli modelování nesouvisejících objektů (například pouličních lamp) jako klíčové funkce. Přiřaďte fotoaparátům popisky i v případě, že zachycují stejné objekty.

Úhly záběru.

Neočekávané výsledky

Modely AI se můžou nesprávně naučit charakteristiky, které jsou pro vaše obrázky společné. Řekněme, že chcete vytvořit model pro rozlišování jablek od citrusových plodů. Pokud použijete obrázky jablek v ruce a citrusových plodů na bílých talířích, může se model vytrénovat tak, že bude namísto jablek od citrusových plodů rozpoznávat ruce od bílých talířů.

Neočekávané výsledky.

Napravíte to tak, že použijete výše uvedené pokyny pro trénování s různorodějšími obrázky: dodáte obrázky s různými úhly, pozadími, velikostmi objektu, skupinami a jinými variantami.

Začínáme s detekcí objektů

Sdílet prostřednictvím

Shromáždění snímků

Formát a velikost

Množství a vyváženost dat