Vad är maskininlärning?

Slutförd

Maskininlärning har sitt ursprung i statistik och matematisk modellering av data. Den grundläggande idén med maskininlärning är att använda data från tidigare observationer för att förutsäga okända resultat eller värden. Till exempel:

  • Innehavaren av en glassbutik kan använda en app som kombinerar historiska försäljnings- och väderrekord för att förutsäga hur många glassar de sannolikt kommer att sälja en viss dag, baserat på väderprognosen.
  • En läkare kan använda kliniska data från tidigare patienter för att köra automatiserade tester som förutsäger om en ny patient är i riskzonen för diabetes baserat på faktorer som vikt, blodsockernivå och andra mätningar.
  • En forskare i Antarktis kan använda tidigare observationer för att automatisera identifieringen av olika pingvinarter (till exempel Adelie, Gentoo eller Chinstrap) baserat på mätningar av en fågels flippers, bill och andra fysiska attribut.

Maskininlärning som en funktion

Eftersom maskininlärning baseras på matematik och statistik är det vanligt att tänka på maskininlärningsmodeller i matematiska termer. I grunden är en maskininlärningsmodell ett program som kapslar in en funktion för att beräkna ett utdatavärde baserat på ett eller flera indatavärden. Processen för att definiera den funktionen kallas utbildning. När funktionen har definierats kan du använda den för att förutsäga nya värden i en process som kallas slutsatsdragning.

Nu ska vi utforska de steg som ingår i utbildning och slutsatsdragning.

Diagram som visar utbildnings- och slutsatsdragningsfaserna i maskininlärning.

  1. Träningsdata består av tidigare observationer. I de flesta fall inkluderar observationerna de observerade attributen eller funktionerna i det som observeras och det kända värdet för det du vill träna en modell att förutsäga (kallas etiketten).

    I matematiska termer ser du ofta de funktioner som refereras till med hjälp av det korta variabelnamnet x och etiketten som kallas y. Vanligtvis består en observation av flera funktionsvärden, så x är faktiskt en vektor (en matris med flera värden), så här: [x1,x 2,x 3,...].

    För att göra detta tydligare ska vi överväga exemplen som beskrevs tidigare:

    • I scenariot med glassförsäljning är vårt mål att träna en modell som kan förutsäga antalet glassförsäljningar baserat på vädret. Vädermätningarna för dagen (temperatur, nederbörd, vindhastighet och så vidare) skulle vara funktionerna (x), och antalet glassar som säljs varje dag skulle vara etiketten (y).
    • I det medicinska scenariot är målet att förutsäga om en patient löper risk för diabetes baserat på deras kliniska mätningar. Patientens mätningar (vikt, blodsockernivå och så vidare) är funktionerna (x) och sannolikheten för diabetes (till exempel 1 för risk, 0 för att inte vara i riskzonen) är etiketten (y).
    • I forskningsscenariot i Antarktis vill vi förutsäga arten av en pingvin baserat på dess fysiska attribut. De viktigaste mätningarna av pingvinen (längden på dess flippers, bredden på dess räkning och så vidare) är funktionerna (x) och arten (till exempel 0 för Adelie, 1 för Gentoo eller 2 för Chinstrap) är etiketten (y).
  2. En algoritm tillämpas på data för att försöka fastställa en relation mellan funktionerna och etiketten och generalisera relationen som en beräkning som kan utföras på x för att beräkna y. Den specifika algoritm som används beror på vilken typ av förutsägande problem du försöker lösa (mer om detta senare), men den grundläggande principen är att försöka anpassa en funktion till data, där värdena för funktionerna kan användas för att beräkna etiketten.

  3. Resultatet av algoritmen är en modell som kapslar in beräkningen som härleds av algoritmen som en funktion – låt oss kalla den f. I matematisk notation:

    y = f(x)

  4. Nu när träningsfasen är klar kan den tränade modellen användas för slutsatsdragning. Modellen är i huvudsak ett program som kapslar in funktionen som skapas av träningsprocessen. Du kan ange en uppsättning funktionsvärden och som utdata ta emot en förutsägelse av motsvarande etikett. Eftersom utdata från modellen är en förutsägelse som beräknades av funktionen, och inte ett observerat värde, ser du ofta utdata från funktionen som visas som ŷ (som är ganska härligt verbaliserad som "y-hat").