A gépi tanulás adattudományi alapjai

Kezdő
Haladó
AI Engineer
Data Scientist
Developer
Student
Azure

A Microsoft Learn számos interaktív módszert kínál a klasszikus gépi tanulás bemutatására. Ezek a képzési tervek önmagukban is hatékonyak lesznek, és kiváló alapot jelentenek a mélytanulási témakörökre való áttéréshez.

A legalapvetőbb klasszikus gépi tanulási modellektől a feltáró adatelemzésig és az architektúrák testreszabásához könnyen emészthető fogalmi tartalmak és interaktív Jupyter-jegyzetfüzetek vezetik, mindezt anélkül, hogy elhagyná a böngészőt.

Az oktatási háttértől és érdeklődési köröktől függően válassza ki a saját útját.

✔ 1. lehetőség: A teljes kurzus: Az adatelemzés alapjai a gépi tanuláshoz

Ez az ajánlott lehetőség a legtöbb ember számára. Ugyanazokkal a modulokkal rendelkezik, mint a másik két képzési terv, egy egyéni folyamattal, amely maximalizálja a fogalmak megerősítését. Ha szeretné megismerni a mögöttes fogalmakat, valamint azt is, hogyan hozhat létre modelleket a leggyakrabban használt gépi tanulási eszközökkel, ez az Út az Ön számára. Ez is a legjobb út, ha a klasszikus gépi tanuláson túl szeretne haladni, és mélytanulási és neurális hálózatokon tanul, amit csak itt mutatunk be.

✔ Jelenleg ezen az útvonalon van, görgessen lefelé a kezdéshez.

2. lehetőség: Az adatelemzés ismertetése a gépi tanulási képzési tervhez

Ha szeretné megérteni, hogyan működik a gépi tanulás, és nem rendelkezik sok matematikai háttérrel, akkor ez az út az Ön számára. Nem feltételezi a korábbi oktatást (kivéve a kódolási fogalmak világos ismeretét), és olyan kódokat, metaforákat és vizualizációkat tanít, amelyek az ah ha pillanatot adják. Ez gyakorlati, de inkább az alapok megértésére összpontosít, és kevésbé a rendelkezésre álló eszközök és kódtárak erejére.

3. lehetőség: Gépi tanulási modellek létrehozása képzési terv

Ha már van elképzelése arról, hogy miről szól a gépi tanulás, vagy erős matematikai háttérrel rendelkezik, akkor a legjobb, ha közvetlenül a Gépi tanulási modellek létrehozása képzési tervbe ugrik. Ezek a modulok gépi tanulási fogalmakat tanítanak, de gyorsan mozognak, hogy kihasználhassák az olyan eszközök használatát, mint a scikit-learn, a TensorFlow vagy a PyTorch. Ez a képzési terv akkor is a legjobb, ha elég jártasságot keres az olyan termékek gépi tanulási példáinak megértéséhez, mint az Azure ML vagy az Azure Databricks.

Előfeltételek

Egyik sem

A képzési terv moduljai

A gépi tanulás átfogó bemutatása azok számára, akik kevéssé, vagy egyáltalán nem járatosak a számítástudományban és a statisztikában. Megismerhet néhány alapvető fogalmat, megismerheti az adatokat, és interaktívan végighaladhat a gépi tanulási életcikluson, a Python használatával betaníthat, menthet és használhat gépi tanulási modellt, akárcsak a valós világban.

A felügyelt betanítás a gépi tanulásnak az a formája, amikor egy algoritmus példaadatokból tanul. Fokozatosan képet kapunk arról, ahogyan a felügyelt betanítás automatikusan generál egy, a valós világról előrejelzéseket tenni képes modellt. Azt is megvizsgáljuk, hogyan tesztelik ezeket a modelleket, és milyen nehézségek merülhetnek fel a betanításuk során.

A gépi tanulási modellek hatékonyságát a betanításukhoz használt adatok adják. Tartalommal és gyakorlatokkal bemutatjuk, hogyan értelmezheti az adatokat, hogyan kódolhatja őket úgy, hogy a számítógép megfelelően értelmezhesse azokat, hogyan tisztíthatja meg a hibákat, és hogyan hozhat létre nagy teljesítményű modelleket.

Az adatfeltárás és -elemzés az adatelemzés alapja. Az adattudósok olyan programozási nyelvekkel kapcsolatos ismereteket igényelnek, mint a Python az adatok feltárásához, megjelenítéséhez és kezeléséhez.

Meglehet, hogy a regresszió a leggyakrabban használt gépi tanulási technika, amely gyakran áll a tudományos felfedezések, az üzleti tervezés és a tőzsdei piacelemzések hátterében. Ez a képzési anyag néhány gyakori regressziós elemzést mutat be, egyszerűeket és összetettebbeket egyaránt, és betekintést nyújt a modellek teljesítményének felmérésébe is.

Ha a gépi tanulásra gondolunk, gyakran a betanítási eljárás van az előtérben. A folyamat előtt kis mennyiségű előkészület nem csak felgyorsíthatja és javíthatja a tanulást, hanem némi bizalmat is ad nekünk arról, hogy modelljeink milyen jól fognak működni, amikor olyan adatokkal szembesülnek, amelyeket még soha nem láttunk.

A regresszió a numerikus értékek előrejelzéséhez gyakran használt gépi tanulás.

A besorolás azt jelenti, hogy elemeket rendelünk kategóriákhoz, vagy akár automatizált döntéshozatalra is gondolhatunk. Itt logisztikai regresszión keresztül mutatjuk be a besorolási modelleket, az összetettebb és izgalmasabb besorolási módszerek megismerésének kiindulópontjaként.

Az összetettebb modellek hatékonysága gyakran fokozható manuális testre szabással. Gyakorlatokon és magyarázó tartalmon keresztül tudhatjuk meg, hogyan vezethet hatékonyabb eredményekhez az összetettebb modellek architektúrájának megváltoztatása.

Honnan tudhatjuk, hogy egy modell jól vagy rosszul sorolja be az adatainkat? Az, ahogyan a számítógépek értékelik ki a modell teljesítményét, számunkra sokszor nehezen érthető, vagy éppen túl egyszerűen képzeljük el a modell működését a valós világban. Megfelelően működő modellek készítéséhez intuitív módot kell találnunk azok értékelésére, és tisztában kell lennünk azzal, ahogyan ezek a metrikák eltorzíthatják az ítéletünket.

A vevő működési karakterisztika (ROC) görbék a betanított besorolási modellek kiértékelésének és finomhangolásának hatékony eszközei. Ezeknek a görbéknek a hasznosságát mutatjuk be és magyarázzuk el képzési anyagok és gyakorlatok segítségével.

A besorolás egyfajta gépi tanulás az elemek osztályokba való kategorizálására.

A fürtözés a gépi tanulás egy típusa, amely a hasonló elemek fürtökbe való csoportosítására szolgál.

A mély tanulás a gépi tanulás egy speciális formája, amely emulálja azt, ahogyan az emberi agy a csatlakoztatott neuronok hálózatain keresztül tanul.