Introduktion
Sättet vi tränar modeller på är inte alls en helt automatiserad process. Träningens blinda beroende av data kan leda till att den lär sig saker som inte är användbara i slutändan eller att inte effektivt lära sig saker som faktiskt är användbara. Följande inlärningsmaterial går igenom några enkla orsaker till att underanpassning och överanpassning sker och vad du kan göra åt det.
Scenario: Träna lavinräddningshundar
I den här modulen använder vi följande exempelscenario för att förklara underanpassning och överanpassning. Det här scenariot är utformat för att ge ett exempel på hur du kan uppfylla dessa begrepp när du programmerar själv. Tänk på att dessa principer i allmänhet gäller för nästan alla typer av modeller, inte bara de som vi arbetar med här.
Det är dags för din välgörenhet att träna en ny generation hundar i hur man hittar vandrare som svepts upp av laviner. Det är debatt på kontoret om vilka hundar som är bäst; är en stor hund bättre än en mindre hund? Ska hundarna tränas när de är unga eller när de är mer mogna? Tack och lov har du statistik över räddningar som utförts under de senaste åren som du kan se till. Träningshundar är dock dyra, och du måste vara säker på att dina hundplockningskriterier är sunda.
Förutsättningar
- Kunskaper om maskininlärningsmodeller
Utbildningsmål
I den här modulen gör du följande:
- Definiera funktionsnormalisering.
- Skapa och arbeta med testdatauppsättningar.
- Formulera hur testmodeller både kan förbättra och skada träning.