Jak se lidé a modely strojového učení učí

Dokončeno

Model strojového učení se trénuje podobně jako u lidí. Jak se tedy člověk učí?

Co když přejdete do oblasti, ve které pět různých druhů plodů, které jste předtím neviděli, roste? Představte si, že jste požádáni, abyste si vybrali 100 náhodných plodů, včetně jednéberry z každého z pěti různých druhů bobuřových rostlin. Říká se vám názvy pěti plodů, které jste vybrali, jeden z každého typu bobuřové rostliny. Máte malinu, borůvku, ostružinu, jahodu a huckleberry. Další 95 plodů, které jste vybrali, jsou jedním z těchto typů plodů.

Schopnost pojmenovat pět různých typů bobulí, máte pocit, že můžete identifikovat typy zbývajících náhodně vybraných 95 plodů. Možná některé borůvky nejsou tak zralé, takže jsou menší a vypadají trochu jako maliny, a některé borůvky nejsou tak zralé a můžou vypadat spíše jako huckleberries. Ale i tak, pro 100 plodů byste měli slušný nápad, kterýberry je typ, a vy byste byli schopni seřadit všechny 100 plodů podle typu.

V dalším kroku budete požádáni, abyste shromáždili pouze maliny v novém sousedním poli. Jste si jistí, že víte, jak maliny vypadají:

Photo of a raspberry.

Dokončíte tento úkol a úspěšně nasbíráte 10 malin.

Pro rekapitulace se počátečních 100 plodů nacházelo ve vaší počáteční datové sadě. Dostali jste vstup (100 plodů) a výstup (typy plodů, které byly zahrnuty) a vytrénovali jste se, abyste mohli identifikovat vybrané plody.

Pak jste dostali test. V novém poli plodů, s ohledem na jakýkoli vstup, identifikujte typberry a vyberte pouze jeden výstup – maliny. Podívali jste se na jiné plody (vstup), když jste chodili mezi rostlinami na bobuše. Testovali jste svůj duševní model plodů a vybrali jste pouze maliny. V tomto okamžiku se domníváte, že váš duševní model plodů je 100% přesný.

Ale pak si všimnete rostlinky, která vypadá podobně jako malina, ale mírně odlišná. To, co jste nevěděli, je, že v novém poli berry-picking bylo skutečně šest druhů bobulí. Najdete další maliny, ale také shromažďujete některé z ostatních plodů, myslíte si, že by mohly být skutečně maliny, i když vypadají trochu jinak:

Photo of a hand holding a thimbleberry.

Novéberry i malinový vzhled se liší od ostatních čtyř druhů plodů, ale vypadají podobně jako u sebe. Nejedná se ale o stejný druh bobule. Nový typberry, které jste vybrali, byl thimbleberry.

V takovém případě vaše datová sada není dostatečně rozsáhlá. Bylo by nepřesné dát thimbleberry s malinami, jen proto, že si myslíte, že by se měly vejít do jednoho z typůberry, a nevíte, že existuje více než pět druhů plodů. Myslíte si, že jste přesnější při identifikaci plodů, než vlastně jste, protože nevíte, co potřebujete vědět, aby byly přesné.

Identifikace plodů se může zdát triviální, ale důsledky se vztahují na řešení strojového učení. Pokud tyto typy řešení ovlivňují životy lidí, jako je start rakety, musí se těmto druhům chyb analýzy dat vyhnout.