Koneoppimisen periaatteiden ymmärtäminen

5 minuuttia

Koneoppiminen on ohjelmointitekniikka, jota käytetään ennakoivien mallien luomiseen. Toisin kuin tyypillisessä ohjelmoinnissa, jossa koodia käytetään kuvaamaan tiettyjä vaiheita tuloksen tuottamiseksi. koneoppiminen käyttää algoritmia , jonka avulla tutkitaan toistettavasti tietoentiteetin ominaisuuksien ja tuloksena saatavan mallin ennakoimien tunnisteiden välistä suhdetta. Koneoppimisen algoritmit perustuvat todennäköisyyden teoriaan ja tilastotietoihin, ja ne käyttävät suuria tietomääriä, joilla malli harjoitetaan.

Yksinkertaistetulla tasolla koneoppimismalli on funktio , joka ottaa havaitun entiteetin ominaisuudet (ominaisuudet) ja suorittaa niille laskutoimituksen ennustetun tunnisteen palauttamiseksi. Ominaisuuksiin viitataan yleensä x-muodossa ja ennustetussa selitteessä y:nä. niinpä koneoppimismalli on lausekkeen .

Toiminto, jonka funktio suorittaa ominaisuuksille selitteen arvon laskemiseksi, määräytyy mallin kouluttamiseen käytetyn algoritmin mukaan.

Koneoppimisen tyypit

Yleisesti ottaen on olemassa kahdenlaisia yleisiä koneoppimistyyppejä:

Valvottu koneoppiminen, jossa mallia harjoitetaan käyttämällä tietoja, jotka sisältävät tunnetut otsikkoarvot (algoritmi käyttää olemassa olevia tietoja muodostaakseen suhteen x :n ja y:n välille, jolloin tuloksena on funktio, jota voidaan soveltaa x :ään y:n laskemista varten).
Valvomaton koneoppiminen, jossa mallia harjoitetaan käyttämällä vain ominaisuuden (x) arvoja ja ryhmien (tai klustereiden) havaintoja, joilla on samankaltaisia ominaisuuksia.

Valvottu koneoppiminen

Tässä moduulissa keskitytään valvottuun koneoppimiseen yleisimpänä skenaariona. Valvotun koneoppimisen laajan määritelmän sisällä on kaksi yleistä koneoppimisen algoritmia:

Regressioalgoritmit , joissa selite on numeerinen arvo, kuten hinta, lämpötila, määrä tai muu arvo, joka voidaan mitata. Regressioalgoritmit tuottavat malleja, joissa funktio (f) toimii ominaisuuksissa (x) laskeakseen selitteen numeerisen arvon (y).

Esimerkiksi regressioalgoritmin avulla voidaan harjoittaa malli, joka ennustaa itsenäisen esityksen puistossa tiettynä päivänä myymien jäätelöiden odotetun määrän vuoden kuukauden, viikonpäivän, lämpötilan, kosteuden ja niin edelleen perusteella.
Luokitusalgoritmit , joissa selite on erillinen luokka (tai luokka). Luokitusalgoritmit tuottavat malleja, joissa funktio (f) toimii ominaisuuksiin (x) laskeakseen todennäköisyysarvon kullekin mahdolliselle luokalle, ja palauttaa suurimman todennäköisyyden sille luokalle otsikon (y).

Luokitusalgoritmin avulla voitaisiin esimerkiksi harjoittaa malli, joka ennustaa, onko potilaalla diabetes esimerkiksi veren insuliinitason, painon, korkeuden, iän ja niin edelleen. Luokitusmalli, joka tunnistaa toisen kahdesta mahdollisesta luokasta (kuten tosi tai epätosi), on esimerkki binaariluokituksesta . Moniluokkaisen luokituksen luokituksessa käytetään algoritmeja, jotka ennustavat todennäköisyyksiä yli kahdelle luokalle (esimerkiksi potilaiden välillä, joilla ei ole diabetesta, tyypin 1 diabetesta tai tyypin 2 diabetesta).

Valvomaton koneoppiminen

Valvomattoman oppimisen yleisin muoto on klusterointi, jossa tietotapausten ominaisuuksia pidetään moniulotteisen tilan pistevektorina. Klusterointialgoritmin tavoitteena on määrittää klustereita, jotka ryhmittelevät pisteet niin, että samankaltaisia ominaisuuksia sisältävät tapaukset ovat lähellä toisiaan, mutta klusterit on selvästi erotettu toisistaan.

Klusterointi on hyödyllistä, kun sinun on määritettävä eri tietoluokkia, mutta sinulla ei ole ennalta määritettyjä luokkia, joille aiemmin luodut tietohavainnot on jo määritetty. Voit esimerkiksi segmentoida asiakkaita heidän profiiliensa samankaltaisuuksien perusteella. Klusteroinnin avulla voidaan myös olla ensimmäinen vaihe luokitusratkaisun luokassa. Käytännössä klusteroinnin avulla voit määrittää tiedoillesi sopivat luokat.

Palaute

Onko tästä sivusta apua?