Co jsou modely strojového učení?
Model je základní součástí strojového učení a nakonec to, co se snažíme sestavit. Model může odhadnout, jak stará osoba pochází z fotky, předpovědět, co byste mohli chtít vidět na sociálních médiích, nebo rozhodnout, kam se má robotická ramena pohybovat. V našem scénáři chceme vytvořit model, který dokáže odhadnout nejlepší velikost boty pro psa na základě velikosti jejich svazku.
Modely je možné vytvářet mnoha způsoby. Například tradiční model, který simuluje, jak je letadlo letěto lidmi, pomocí znalostí fyziky a inženýrství. Modely strojového učení jsou speciální; a ne upravovat je uživatelé tak, aby dobře fungovaly, modely strojového učení jsou tvarovány daty. Učí se z zkušeností.
Jak přemýšlet o modelech
Model si můžete představit jako funkci, která přijímá data jako vstup a vytváří výstup. Konkrétněji model používá vstupní data k odhadu něčeho jiného. V našem scénáři chceme například vytvořit model, který má velikost svazku a odhaduje velikost spuštění:
Velikost a velikost psí boty jsou data; nejsou součástí modelu. Velikost postroje je náš vstup, velikost psí boty je výstup.
Modely jsou často jednoduchý kód.
Modely se často nedají smysluplně lišit od jednoduchých funkcí, které už znáte. Stejně jako jiný kód obsahují logiku a parametry. Logika může například vynásobit velikost svazku parameter_1:
Pokud by zde parameter_1 bylo 2,5, náš model by vynásobil velikost využití číslem 2,5 a vrátil výsledek:
Výběr modelu
Existuje mnoho typů modelů, některé jednoduché a některé složité.
Stejně jako všechny kódy jsou jednodušší modely často nejspolehlivější a snadno pochopitelné, zatímco složité modely mohou potenciálně provádět působivé výkony. Jaký druh modelu byste měli zvolit, závisí na vašem cíli. Lékaři například často pracují s modely, které jsou relativně jednoduché, protože jsou spolehlivé a intuitivní. Naproti tomu roboti založené na umělé inteligenci obvykle spoléhají na složité modely.
Prvním krokem ve strojovém učení je výběr typu modelu, který chcete použít. Proto vybíráme model založený na jeho interní logice. Můžeme například vybrat model se dvěma parametry pro odhad velikosti psí boty z velikosti svazku:
Všimněte si, jak jsme vybrali model na základě toho, jak funguje logicky, ale ne na základě hodnot jeho parametrů. V tomto okamžiku nebyly parametry nastaveny na žádnou konkrétní hodnotu.
Během trénování se zjistí parametry.
Lidský návrhář nevybírej hodnoty parametrů. Místo toho se hodnoty parametrů nastaví na počáteční odhad a pak se upraví během automatizovaného procesu učení označovaného jako trénování.
Vzhledem k výběru modelu se dvěma parametry začneme tím, že pro naše parametry poskytneme náhodné odhady:
Tyto náhodné parametry znamenají, že model není dobrý při odhadu velikosti spouštění, takže provádíme trénování. Během trénování se tyto parametry automaticky změní na dvě nové hodnoty, které poskytují lepší výsledky:
Přesně to, jak tento proces funguje, je něco, co postupně vysvětlujeme během vašeho studijního programu.