Delen via


Machine Learning - Trainen

Belangrijk

De ondersteuning voor Azure Machine Learning-studio (klassiek) eindigt op 31 augustus 2024. U wordt aangeraden om vóór die datum over te stappen naar Azure Machine Learning.

Vanaf 1 december 2021 kunt u geen nieuwe resources voor Azure Machine Learning-studio (klassiek) meer maken. Tot en met 31 augustus 2024 kunt u de bestaande resources van Azure Machine Learning-studio (klassiek) blijven gebruiken.

De documentatie van ML-studio (klassiek) wordt buiten gebruik gesteld en wordt in de toekomst mogelijk niet meer bijgewerkt.

In dit artikel worden de modules in Machine Learning Studio (klassiek) beschreven voor het trainen van machine learning model. Training is het proces van het analyseren van invoergegevens met behulp van de parameters van een vooraf gedefinieerd model. In deze analyse leert het model de patronen en slaat het deze op in de vorm van een getraind model.

Notitie

Van toepassing op: Machine Learning Studio (klassiek)

Vergelijkbare modules voor slepen en neerzetten zijn beschikbaar in Azure Machine Learning designer.

In dit artikel wordt ook het algehele proces in Machine Learning Studio (klassiek) beschreven voor het maken, trainen, beoordelen en scoren van modellen.

Modellen voor machine learning maken en gebruiken

De gebruikelijke werkstroom voor machine learning omvat de volgende fasen:

  • Een geschikt algoritme kiezen en initiële opties instellen.
  • Het model trainen op compatibele gegevens.
  • Voorspellingen maken met behulp van nieuwe gegevens, op basis van de patronen in het model.
  • Het model evalueren om te bepalen of de voorspellingen nauwkeurig zijn, hoeveel fouten er zijn en of er sprake is van overfitting.

Machine Learning Studio (klassiek) ondersteunt een flexibel, aanpasbaar framework voor machine learning. Elke taak in dit proces wordt uitgevoerd door een specifiek type module, dat kan worden gewijzigd, toegevoegd of verwijderd, zonder de rest van uw experiment te verbreken.

De modules in deze categorie ondersteunen training voor verschillende typen modellen. Tijdens de training worden de gegevens geanalyseerd door het machine learning algoritme. Dit algoritme analyseert de distributie en het type van de gegevens, compileert statistieken en maakt patronen die later kunnen worden gebruikt voor voorspelling.

Meer informatie over modeltraining

Wanneer Machine Learning model traint, worden rijen met ontbrekende waarden overgeslagen. Als u de waarden daarom handmatig wilt herstellen, imputatie wilt gebruiken of een andere methode wilt opgeven voor het verwerken van ontbrekende waarden, gebruikt u de module Clean Missing Data voordat u de gegevensset traint.

U wordt aangeraden de module Metagegevens bewerken te gebruiken om andere problemen met de gegevens op te lossen. Mogelijk moet u de labelkolom markeren, gegevenstypen wijzigen of de juiste kolomnamen wijzigen.

Zie de categorie Gegevenstransformatie voor andere veelvoorkomende taken voor het opschonen van gegevens, zoals normalisatie, steekproeven, binning en schalen.

De juiste docent kiezen

De methode die u gebruikt om een model te trainen, is afhankelijk van het type model dat u maakt en het type gegevens dat het model nodig heeft. Zo biedt Machine Learning modules die specifiek zijn voor het trainen van anomaliedetectiemodellen, aanbevelingsmodellen en meer.

Controleer de lijst met trainingsmodules om te bepalen welke juist is voor uw scenario.

Als u niet zeker bent van de beste parameters die u kunt gebruiken bij het trainen van een model, gebruikt u een van de modules die zijn opgegeven voor parameterstuur en validatie:

  • Met Tune Model Hyperparameters kunt u een parameteropruiming uitvoeren op bijna alle classificatie- en regressiemodellen. Het traint meerdere modellen en retourneert vervolgens het beste model.

  • De Clustering-module Opsommen ondersteunt het afstemmen van modellen tijdens het trainingsproces en is alleen bedoeld voor gebruik met clusteringmodellen. U kunt een bereik van centroids opgeven en trainen op gegevens terwijl u automatisch de beste parameters detecteert.

  • De module Model kruis valideren is ook nuttig voor modeloptimalisatie, maar retourneert geen getraind model. In plaats daarvan biedt het metrische gegevens die u kunt gebruiken om het beste model te bepalen.

Modellen opnieuw trainen

Als u een productiemodel opnieuw wilt trainen, kunt u het experiment op elk moment opnieuw uitvoeren.

U kunt het proces voor opnieuw trainen ook automatiseren met behulp van webservices. Zie Retraining and updating Machine Learning models with Azure Data Factory (Modellen opnieuw trainen en bijwerken met Azure Data Factory) voor een overzicht.

Vooraf getrainde modellen gebruiken

Machine Learning bevat enkele modellen die vooraf zijn getraind, zoals de module Pretrained Cascade Image Classification. U kunt deze modellen gebruiken om te scoren zonder aanvullende gegevensinvoer.

Bovendien genereren sommige modules (zoals Time Series Anomalie Detection) geen getraind model in de iLearner-indeling. Maar ze nemen wel trainingsgegevens en maken intern een model, dat vervolgens kan worden gebruikt om voorspellingen te doen. Als u deze wilt gebruiken, configureert u de parameters en geeft u gegevens op.

Een momentopname van een getraind model opslaan

Als u het model wilt opslaan of exporteren, klikt u met de rechtermuisknop op de trainingsmodule en selecteert u Opslaan als getraind model. Het model wordt geëxporteerd naar de iLearner-indeling en opgeslagen in uw werkruimte, onder Getrainde modellen. Getrainde modellen kunnen opnieuw worden gebruikt in andere experimenten of worden verbonden met andere modules om te scoren.

U kunt ook de module Getraind model laden in een experiment gebruiken om een opgeslagen model op te halen.

Lijst met modules

De categorie Trainen bevat de volgende modules:

  • Clustering opsommen: voert een parameteropruiming uit op een clusteringmodel om de optimale parameterinstellingen te bepalen en traint het beste model.
  • Anomaliedetectiemodel trainen: traint een anomaliedetectiemodel en labelt gegevens uit een trainingsset.
  • Clusteringmodel trainen: traint een clusteringmodel en wijst gegevens uit de trainingsset toe aan clusters.
  • Matchbox Recommender trainen: traint een Bayesiaanse aanbevelingser met behulp van het Matchbox-algoritme.
  • Train Model: traint een classificatie- of regressiemodel uit een trainingsset.
  • Tune Model Hyperparameters: voert een parameteropruiming uit op een regressie- of classificatiemodel om de optimale parameterinstellingen te bepalen en traint het beste model.

Sommige modules vallen niet onder deze categorie, omdat ze een speciale indeling vereisen of zijn aangepast voor een specifieke taak:

Zie ook