Wat is Geautomatiseerde Machine Learning (AutoML)?
Geautomatiseerde machine learning (AutoML) automatiseert het proces van het toepassen van machine learning op gegevens. Met behulp van een gegevensset kunt u AutoML uitvoeren om verschillende gegevenstransformaties, machine learning-algoritmen en hyperparameters te herhalen om het beste model te selecteren.
Notitie
Dit artikel verwijst naar de ML.NET AutoML-API, die momenteel in preview is. Materiaal kan worden gewijzigd.
Hoe werkt AutoML?
Over het algemeen is de werkstroom voor het trainen van machine learning-modellen als volgt:
- Een probleem definiëren
- Gegevens verzamelen
- Gegevens vooraf verwerken
- Een model trainen
- Het model evalueren
Voorverwerking, training en evaluatie zijn een experimenteel en iteratief proces dat meerdere experimenten vereist totdat u bevredigende resultaten bereikt. Omdat deze taken vaak herhalend zijn, kan AutoML helpen deze stappen te automatiseren. Naast automatisering worden optimalisatietechnieken gebruikt tijdens het trainings- en evaluatieproces om algoritmen en hyperparameters te vinden en te selecteren.
Wanneer moet ik AutoML gebruiken?
Of u nu net aan de slag gaat met machine learning of als u een ervaren gebruiker bent, AutoML biedt oplossingen voor het automatiseren van het modelontwikkelingsproces.
- Beginners : als u geen kennis hebt met machine learning, vereenvoudigt AutoML het modelontwikkelingsproces door een set standaardinstellingen op te geven die het aantal beslissingen vermindert dat u moet nemen bij het trainen van uw model. Als u dit doet, kunt u zich richten op uw gegevens en het probleem dat u probeert op te lossen en AutoML de rest laten doen.
- Ervaren gebruikers : als u enige ervaring hebt met machine learning, kunt u de standaardwaarden van AutoML aanpassen, configureren en uitbreiden op basis van uw behoeften, terwijl u nog steeds gebruikmaakt van de automatiseringsmogelijkheden.
AutoML in ML.NET
- Featurizer - Convenience-API voor het automatiseren van gegevensvoorverwerking.
- Proefversie : één hyperparamters-optimalisatieuitvoering.
- Experiment : een verzameling AutoML-proefversies. ML.NET biedt een API op hoog niveau voor het maken van experimenten waarmee standaardwaarden worden ingesteld voor de afzonderlijke onderdelen van Sweepable Pipeline, Search Space en Tuner.
- Zoekruimte : het bereik van beschikbare opties waaruit u hyperparameters kunt kiezen.
- Tuner - De algoritmen die worden gebruikt om hyperparameters te optimaliseren. ML.NET ondersteunt de volgende tuners:
- Cost Frugal Tuner - Implementatie van Frugal Optimization voor kostengerelateerde Hyperparameters die rekening houden met trainingskosten
- Eci Cost Frugal Tuner - Implementatie van Cost Frugal Tuner voor hiërarchische zoekruimten. Standaardstemmer gebruikt door AutoML.
- SMAC - Tuner die gebruikmaakt van willekeurige forests om Bayesian-optimalisatie toe te passen.
- Grid Search - Tuner die het beste werkt voor kleine zoekruimten.
- Willekeurige zoekopdrachten
- Sweepable Estimator - Een ML.NET estimator die een zoekruimte bevat.
- Opruimende pijplijn : een ML.NET-pijplijn die een of meer Sweepable Estimators bevat.
- Trial Runner - AutoML-onderdeel dat gebruikmaakt van opruimende pijplijnen en proefinstellingen om proefresultaten te genereren van modeltraining en -evaluatie.
Het wordt aanbevolen voor beginners om te beginnen met de standaardwaarden van de experiment-API op hoog niveau. Voor meer ervaren gebruikers die op zoek zijn naar aanpassingsopties, gebruikt u de veegbare estimator, opruimende pijplijn, zoekruimte, proefloper en tuneronderdelen.
Zie voor meer informatie over hoe u aan de slag gaat met de AutoML-API de handleiding ML.NET Automatische Machine Learning-API (AutoML).
Ondersteunde taken
AutoML biedt vooraf geconfigureerde standaardwaarden voor de volgende taken:
- Binaire classificatie
- Classificatie met meerdere klassen
- Regressie
Voor andere taken kunt u uw eigen proefloper bouwen om deze scenario's mogelijk te maken. Zie de handleiding over het gebruik van de ML.NET AutoML-API (Automated Machine Learning) voor meer informatie.