Zdieľať cez


Zhromažďovanie obrázkov

Ak chcete trénovať model rozpoznávania objektov na rozpoznávanie vašich objektov, bude potrebné zhromaždiť obrázky obsahujúce dané objekty. Dodržiavajte pokyny týkajúce sa množstva a kvality obrázka, dosiahnete lepšie výsledky.

Formát a veľkosť

Obrázky, ktoré odovzdáte modelu rozpoznávania objektov, musia mať tieto vlastnosti:

  • Formát:

    • JPG
    • PNG
    • BMP
  • Veľkosť:

    • Maximálne 6 MB na výcvik
    • Minimálna šírka/výška 256 pixlov x 256 pixelov

Množstvo údajov a vyváženie údajov

Dôležité je nahrať dostatok obrázkov na trénovanie modelu AI. Dobrým východiskovým bodom pre množinu trénovania je aspoň 15 obrázkov na jeden produkt. Pri menšom počte obrázkov existuje veľké riziko, že váš model sa bude učiť pojmy, ktoré sú len šum alebo nie sú relevantné. Trénovanie modelu s väčším počtom obrázkov by malo zvýšiť presnosť.

Ďalším hľadiskom je zabezpečiť, aby boli vaše údaje vyvážené. Ak máte 500 obrázkov na jeden objekt a iba 50 obrázkov na iný, vaša tréningová množina údajov nie je vyvážená. To môže spôsobiť, že model bude jeden z týchto objektov rozpoznávať lepšie. Ak chcete mať konzistentnejšie výsledky, medzi objektom s najmenším počtom obrázkov a objektom s najväčším počtom obrázkov udržiavajte pomer aspoň 1:2. Ak má napríklad objekt s najväčším počtom obrázkov 500 obrázkov, objekt s najmenším počtom obrázkov musí mať aspoň 250 obrázkov na trénovanie.

Používanie rozmanitejších obrázkov

Poskytnite obrázky, ktoré sú reprezentatívne preto, čo sa odovzdá modelu pri bežnom používaní. Povedzme napríklad, že trénujete model na rozpoznávanie jabĺk. Ak ste trénovali len obrázky jabĺk na tanieroch, nemusia sa konzistentne rozpoznávať jablká na stromoch. Zahrnutím rôznych druhov obrázkov zaistíte, že váš model nebude zaujatý a dokáže dobre zovšeobecňovať. Ďalej uvádzame niekoľko spôsobov, ako zabezpečiť rozmanitejšiu tréningovú množinu.

Pozadie

Použite obrázky svojich predmetov pred rôznymi pozadiami – napríklad ovocie na tanieroch, v rukách a na stromoch. Fotografie v kontexte sú lepšie ako fotografie pred neutrálnym pozadím, pretože poskytujú viac informácií na klasifikáciu.

Pozadia obrázkov.

Osvetlenie

Používajte tréningové obrázky, ktoré majú rôzne osvetlenie, najmä ak obrázky používané na rozpoznávanie môžu mať rôzne osvetlenie. Zahrňte napríklad aj obrázky zhotovené pomocou blesku, vysokej expozície a podobne. Je tiež užitočné použiť aj obrázky s variabilnou sýtosťou, odtieňom a jasom. Fotoaparát zariadenia vám pravdepodobne umožní ovládať tieto nastavenia.

Osvetlenie obrazu.

Veľkosť objektu

Poskytnite obrázky, na ktorých majú objekty rôzne veľkosti, zachytávajúce rôzne časti objektu – napríklad fotografiu trsov banánov a detailný záber jedného banánu. Rôzna veľkosť pomáha modelu lepšie zovšeobecňovať.

Veľkosti objektov.

Uhol fotoaparátu

Skúste zadať obrázky zhotovené z rôznych uhlov. Ak máte všetky fotografie zhotovené pomocou súpravy statických fotoaparátov, napríklad sledovacích kamier, priraďte každému fotoaparátu iné označenie. To môže pomôcť predchádzať modelovaniu nesúvisiacich objektov, napríklad lámp, ako kľúčovej funkcie. Označenia fotoaparátu priraďte aj v prípade, že fotoaparát zachytí rovnaké objekty.

Uhly kamery.

Neočakávané výsledky

Modely AI sa môžu nesprávne naučiť vlastnosti, ktoré majú vaše obrázky spoločné. Povedzme, že chcete vytvoriť model na odlišovanie jabĺk od citrusových plodov. Ak použijete obrázky jabĺk v rukách a citrusov na bielych tanieroch, model by namiesto jabĺk verzus citrusov mohol trénovať ruky verzus biele taniere.

Neočakávané výsledky.

Ak to chcete opraviť, použite vyššie uvedené pokyny na trénovanie s rôznorodejšími obrázkami: poskytnite obrázky v rôznych uhloch, s rôznymi pozadiami, veľkosťou objektu, skupinami a ďalšími variantmi.

Začnite s Zisťovanie objektov