Kies parameters om uw algoritmen te optimaliseren in Machine Learning Studio (klassiek)

VAN TOEPASSING OP: Van toepassing op. Machine Learning Studio (klassiek) Is niet van toepassing op. Azure Machine Learning

Belangrijk

De ondersteuning voor Azure Machine Learning-studio (klassiek) eindigt op 31 augustus 2024. U wordt aangeraden om vóór die datum over te stappen naar Azure Machine Learning.

Vanaf 1 december 2021 kunt u geen nieuwe resources voor Azure Machine Learning-studio (klassiek) meer maken. Tot en met 31 augustus 2024 kunt u de bestaande resources van Azure Machine Learning-studio (klassiek) blijven gebruiken.

Zie informatie over het verplaatsen van machine learning-projecten van ML Studio (klassiek) naar Azure Machine Learning.
Meer informatie over Azure Machine Learning

De documentatie van ML-studio (klassiek) wordt buiten gebruik gesteld en wordt in de toekomst mogelijk niet meer bijgewerkt.

In dit onderwerp wordt beschreven hoe u de juiste hyperparameterset kiest voor een algoritme in Machine Learning Studio (klassiek). De meeste machine learning-algoritmen hebben parameters die moeten worden ingesteld. Wanneer u een model traint, moet u waarden voor deze parameters opgeven. De werkzaamheid van het getrainde model is afhankelijk van de modelparameters die u kiest. Het proces voor het vinden van de optimale set parameters wordt modelselectie genoemd.

Er zijn verschillende manieren om modelselectie uit te voeren. In machine learning is kruisvalidatie een van de meest gebruikte methoden voor modelselectie en het is het standaardmechanisme voor modelselectie in Machine Learning Studio (klassiek). Omdat Machine Learning Studio (klassiek) zowel R als Python ondersteunt, kunt u altijd hun eigen modelselectiemechanismen implementeren met R of Python.

Er zijn vier stappen in het proces voor het vinden van de beste parameterset:

Definieer de parameterruimte: bepaal voor het algoritme eerst de exacte parameterwaarden die u wilt overwegen.
Definieer de instellingen voor kruisvalidatie: Bepaal hoe u de fold-structuur voor kruisvalidatie van de dataset kiest.
Definieer de maatstaf: bepaal welke maatstaf moet worden gebruikt voor het bepalen van de beste set parameters, zoals nauwkeurigheid, wortel van de gemiddelde kwadratische fout, precisie, herinnering of f-score.
Trainen, evalueren en vergelijken: Voor elke unieke combinatie van de parameterwaarden wordt kruisvalidatie uitgevoerd door en op basis van de metrische foutgegevens die u definieert. Na evaluatie en vergelijking kunt u het best presterende model kiezen.

In de volgende afbeelding ziet u hoe dit kan worden bereikt in Machine Learning Studio (klassiek).

De beste parameterset zoeken

De parameterruimte definiëren

U kunt de parameterset definiëren tijdens de initialisatiestap van het model. Het parameterdeelvenster van alle machine learning-algoritmen heeft twee trainermodi: Enkele parameter en parameterbereik. Kies de Parameterbereikmodus. In de modus Parameterbereik kunt u meerdere waarden invoeren voor elke parameter. U kunt door komma's gescheiden waarden invoeren in het tekstvak.

Beslissingsstructuur met twee klassen verhoogd, één parameter

U kunt ook het maximum- en minimumaantal punten van het raster definiëren en het totale aantal punten dat moet worden gegenereerd met Range Builder gebruiken. Standaard worden de parameterwaarden gegenereerd op een lineaire schaal. Maar als de schaal van logboeken wordt gecontroleerd, worden de waarden gegenereerd in de logboekschaal (de verhouding van de aangrenzende punten is constant in plaats van het verschil). Voor parameters voor gehele getallen kunt u een bereik definiëren met behulp van een afbreekstreepje. '1-10' betekent bijvoorbeeld dat alle gehele getallen tussen 1 en 10 (beide inclusief) de parameterset vormen. Een gemengde modus wordt ook ondersteund. De parameterset '1-10, 20, 50' bevat bijvoorbeeld gehele getallen 1-10, 20 en 50.

Beslissingsstructuur met twee klassen verhoogd, parameterbereik

Defineer kruisvalidatievouwen

De partitie- en voorbeeldmodule kan worden gebruikt om willekeurig vouwen toe te wijzen aan de gegevens. In de volgende voorbeeldconfiguratie voor de module definiëren we vijf vouwen en wijzen we een vouwnummer toe aan de voorbeeldexemplaren.

Partitie en voorbeeld

De metrische waarde definiëren

De module Tune Model Hyperparameters biedt ondersteuning voor het empirisch kiezen van de beste set parameters voor een bepaald algoritme en een bepaalde gegevensset. Naast andere informatie over het trainen van het model bevat het deelvenster Eigenschappen van deze module de metrische gegevens voor het bepalen van de beste parameterset. Het bevat twee verschillende vervolgkeuzelijsten voor respectievelijk classificatie- en regressiealgoritmen. Als het algoritme dat wordt overwogen een classificatie-algoritme is, wordt de regressiemetrie genegeerd en omgekeerd. In dit specifieke voorbeeld is de metrische waarde Nauwkeurigheid.

Sweepparameters

Trainen, evalueren en vergelijken

Dezelfde module Tune Model Hyperparameters traint alle modellen die overeenkomen met de parameterset, evalueert verschillende metrische gegevens en maakt vervolgens het best getrainde model op basis van de metrische gegevens die u kiest. Deze module heeft twee verplichte invoerwaarden:

De niet-getrainde cursist
De gegevensset

De module heeft ook een optionele gegevenssetinvoer. Koppel de gegevensset met gegevens over indelingen aan de verplichte invoer van de gegevensset. Als aan de gegevensset geen vouwgegevens zijn toegewezen, wordt standaard een kruisvalidatie van 10 vouwen uitgevoerd. Als de vouwtoewijzing niet is gedaan en er een validatiegegevensset beschikbaar is via de optionele gegevenssetpoort, wordt een train-test mode gekozen en wordt de eerste gegevensset gebruikt om het model te trainen voor elke parametercombinatie.

Classificatie van versterkte beslissingsstructuur

Het model wordt vervolgens geëvalueerd op de validatiegegevensset. In de linkeruitvoerpoort van de module worden verschillende metrische gegevens weergegeven als functies van parameterwaarden. De juiste uitvoerpoort geeft het getrainde model dat overeenkomt met het best presterende model op basis van de gekozen metrische waarde (nauwkeurigheid in dit geval).

Validatiedataset

U kunt de exacte parameters zien die u hebt gekozen door de juiste uitvoerpoort te visualiseren. Dit model kan worden gebruikt voor het scoren van een testset of in een geoperationaliseerde webservice na opslaan als getraind model.

Last updated on 2017-11-29

Kies parameters om uw algoritmen te optimaliseren in Machine Learning Studio (klassiek)

De parameterruimte definiëren

Defineer kruisvalidatievouwen

De metrische waarde definiëren

Trainen, evalueren en vergelijken

Aanvullende resources