Inzicht in gegevenswetenschap voor machine learning

Beginner
AI Engineer
Data Scientist
Developer
Student
Azure

Microsoft Learn biedt verschillende interactieve manieren om een inleiding te krijgen tot klassieke machine learning. Deze leertrajecten zorgen ervoor dat u op zichzelf productief bent en vormen ook een uitstekende basis om verder te gaan met deep learning-onderwerpen.

Van de meest eenvoudige klassieke machine learning-modellen tot verkennende gegevensanalyse en het aanpassen van architecturen, u wordt begeleid door eenvoudig te begrijpen conceptuele inhoud en interactieve Jupyter-notebooks, allemaal zonder uw browser te verlaten.

Kies uw eigen pad, afhankelijk van uw educatieve achtergrond en interesses.

Optie 1: De volledige cursus: Basisbeginselen van data science voor machine learning

Dit pad wordt aanbevolen voor de meeste mensen. Het heeft dezelfde modules als de andere twee leertrajecten met een aangepaste stroom die de versterking van concepten maximaliseert. Als u meer informatie wenst over de onderliggende concepten en tevens wilt ontdekken hoe u modellen bouwt met de meestgebruikte machine learning-hulpprogramma's. Dit is ook het beste pad als u van plan bent om verder te gaan dan klassieke machine learning en een opleiding te volgen in deep learning en neurale netwerken, die we hier alleen introduceren.

✔ Optie 2: Het leertraject Gegevenswetenschap voor machine learning begrijpen

Als u wilt weten hoe machine learning werkt en u niet veel wiskundige achtergrond hebt, is dit pad iets voor u. Het doet geen veronderstellingen over eerdere opleiding (behalve een lichte vertrouwdheid met coderingsconcepten) en leert met code, metafoor en visual die u het ah ha moment geven. Het is praktisch, maar richt zich meer op het begrijpen van de basisprincipes en minder op de kracht van de beschikbare hulpprogramma's en bibliotheken.

✔ U bevindt zich momenteel op dit traject. Schuif omlaag om te beginnen.

Optie 3: Het leertraject Machine Learning-modellen maken

Als u al een idee hebt waar machine learning over gaat of als u een sterke wiskundige achtergrond hebt, gaat u best meteen van start met het leertraject Machine Learning-modellen maken. In deze modules worden een aantal concepten behandeld van machine learning, maar dit gaat snel, zodat ze de kracht van het gebruik van hulpprogramma's zoals scikit-learn, TensorFlow en PyTorch kunnen benutten. Dit leertraject is ook het beste voor u als u op zoek bent naar voldoende kennis om machine learning-voorbeelden te begrijpen voor producten zoals Azure ML of Azure Databricks.

Vereisten

Geen

Modules in dit leertraject

Een algemeen overzicht van machine learning voor mensen met weinig of geen kennis van computerwetenschappen en statistieken. U maakt kennis met een aantal essentiële concepten, verkent gegevens en doorloopt interactief de levenscyclus van machine learning, met behulp van Python om een machine learning-model te trainen, op te slaan en te gebruiken, net zoals in de echte wereld.

Leren onder toezicht is een vorm van machine learning waarbij een algoritme leert van voorbeelden van gegevens. Stapsgewijs schetsen we een beeld van hoe met leren onder toezicht automatisch een model wordt gegenereerd dat voorspellingen kan doen over de echte wereld. We raken ook aan hoe deze modellen worden getest en problemen die zich kunnen voordoen bij het trainen ervan.

De kracht van Machine Learning-modellen hangt af van de gegevens die worden gebruikt om ze te trainen. Via inhoud en oefeningen verkennen we hoe u uw gegevens begrijpt, hoe u deze kunt coderen zodat de computer deze correct kan interpreteren, hoe u fouten kunt opschonen en tips die u helpen bij het maken van modellen met hoge prestaties.

Regressie is misschien wel de meestgebruikte machine learning-techniek en vormt de basis van wetenschappelijke ontdekkingen, bedrijfsplanning en analyses voor de aandelenmarkt. In dit lesmateriaal wordt dieper ingegaan op enkele veelvoorkomende regressieanalyses, zowel eenvoudige als complexere, en wordt enig inzicht geboden in het beoordelen van modelprestaties.

Als we aan machine learning denken, richten we ons vaak op het trainingsproces. Een kleine hoeveelheid voorbereiding voordat dit proces niet alleen het leren kan versnellen en verbeteren, maar geeft ons ook vertrouwen in hoe goed onze modellen werken wanneer we te maken hebben met gegevens die we nog nooit eerder hebben gezien.

Classificatie betekent het toewijzen van items aan categorieën of kan ook worden beschouwd als geautomatiseerde besluitvorming. Hier introduceren we classificatiemodellen door middel van logistieke regressie, zodat u een springplank krijgt naar complexere en interessantere classificatiemethoden.

Complexere modellen kunnen vaak handmatig worden aangepast om de effectiviteit te verbeteren. Aan de hand van oefeningen en verklarende inhoud geven we aan hoe het wijzigen van de architectuur van complexere modellen effectievere resultaten kan opleveren.

Hoe weten we of een model goed of slecht is in het classificeren van gegevens? De manier waarop computers modelprestaties beoordelen is soms moeilijk te begrijpen of kan een te grote vereenvoudiging zijn van het gedrag van het model in de echte wereld. Om modellen te bouwen die naar tevredenheid werken, moeten we intuïtieve manieren vinden om ze te beoordelen en moeten we doorgronden hoe deze metrische gegevens onze weergave kunnen beïnvloeden.

ROC-curven (Receiver Operator Charateric) zijn een krachtige manier om getrainde classificatiemodellen te beoordelen en te verfijnen. We introduceren deze curven en leggen uit wat het nut ervan is aan de hand van lesinhoud en praktische oefeningen.