Delen via


Parameters kiezen om uw algoritmen te optimaliseren in Machine Learning Studio (klassiek)

VAN TOEPASSING OP:Van toepassing op. Machine Learning Studio (klassiek) is niet van toepassing op.Azure Machine Learning

Belangrijk

De ondersteuning voor Azure Machine Learning-studio (klassiek) eindigt op 31 augustus 2024. U wordt aangeraden om vóór die datum over te stappen naar Azure Machine Learning.

Vanaf 1 december 2021 kunt u geen nieuwe resources voor Azure Machine Learning-studio (klassiek) meer maken. Tot en met 31 augustus 2024 kunt u de bestaande resources van Azure Machine Learning-studio (klassiek) blijven gebruiken.

De documentatie van ML-studio (klassiek) wordt buiten gebruik gesteld en wordt in de toekomst mogelijk niet meer bijgewerkt.

In dit onderwerp wordt beschreven hoe u de juiste hyperparameterset kiest voor een algoritme in Machine Learning Studio (klassiek). De meeste machine learning-algoritmen hebben parameters die moeten worden ingesteld. Wanneer u een model traint, moet u waarden opgeven voor deze parameters. De effectiviteit van het getrainde model is afhankelijk van de modelparameters die u kiest. Het proces voor het vinden van de optimale set parameters wordt modelselectie genoemd.

Er zijn verschillende manieren om modelselectie uit te voeren. In machine learning is kruisvalidatie een van de meest gebruikte methoden voor modelselectie en is dit het standaardmechanisme voor modelselectie in Machine Learning Studio (klassiek). Omdat Machine Learning Studio (klassiek) zowel R als Python ondersteunt, kunt u altijd hun eigen mechanismen voor modelselectie implementeren met behulp van R of Python.

Er zijn vier stappen in het proces voor het vinden van de beste parameterset:

  1. Definieer de parameterruimte: bepaal voor het algoritme eerst de exacte parameterwaarden die u wilt overwegen.
  2. Definieer de instellingen voor kruisvalidatie: Bepaal hoe u kruisvalidatievouwts kiest voor de gegevensset.
  3. Definieer de metrische waarde: Bepaal welke metrische waarde moet worden gebruikt voor het bepalen van de beste set parameters, zoals nauwkeurigheid, gemiddelde kwadratische fout, precisie, relevante overeenkomsten of f-score.
  4. Trainen, evalueren en vergelijken: Voor elke unieke combinatie van de parameterwaarden wordt kruisvalidatie uitgevoerd door en op basis van de metrische foutgegevens die u definieert. Na evaluatie en vergelijking kunt u het best presterende model kiezen.

In de volgende afbeelding ziet u hoe dit kan worden bereikt in Machine Learning Studio (klassiek).

De beste parameterset zoeken

De parameterruimte definiëren

U kunt de parameterset definiëren tijdens de initialisatiestap van het model. Het parameterdeelvenster van alle machine learning-algoritmen heeft twee trainermodi: Enkele parameter en parameterbereik. Kies de modus Parameterbereik. In de modus Parameterbereik kunt u meerdere waarden invoeren voor elke parameter. U kunt door komma's gescheiden waarden invoeren in het tekstvak.

Beslissingsstructuur met twee klassen, één parameter

U kunt ook de maximum- en minimumpunten van het raster definiëren en het totale aantal punten dat moet worden gegenereerd met Range Builder gebruiken. Standaard worden de parameterwaarden gegenereerd op een lineaire schaal. Maar als logboekschaal wordt gecontroleerd, worden de waarden gegenereerd in de logboekschaal (dat wil gezegd, is de verhouding van de aangrenzende punten constant in plaats van het verschil). Voor parameters voor gehele getallen kunt u een bereik definiëren met behulp van een afbreekstreepje. Bijvoorbeeld: '1-10' betekent dat alle gehele getallen tussen 1 en 10 (beide inclusief) de parameterset vormen. Er wordt ook een gemengde modus ondersteund. De parameterset '1-10, 20, 50' bevat bijvoorbeeld gehele getallen 1-10, 20 en 50.

Beslissingsstructuur met twee klassen, parameterbereik

Kruisvalidatievouws definiëren

De partitie- en voorbeeldmodule kan worden gebruikt om willekeurige vouwen toe te wijzen aan de gegevens. In de volgende voorbeeldconfiguratie voor de module definiëren we vijf vouwen en wijzen we willekeurig een vouwnummer toe aan de voorbeeldexemplaren.

Partitie en voorbeeld

De metrische waarde definiëren

De module Tune Model Hyperparameters biedt ondersteuning voor het empirisch kiezen van de beste set parameters voor een bepaald algoritme en een bepaalde gegevensset. Naast andere informatie over het trainen van het model bevat het deelvenster Eigenschappen van deze module de metrische waarde voor het bepalen van de beste parameterset. Er zijn twee verschillende vervolgkeuzelijsten voor respectievelijk classificatie- en regressiealgoritmen. Als het algoritme dat wordt overwogen een classificatie-algoritme is, wordt de metrische regressiewaarde genegeerd en omgekeerd. In dit specifieke voorbeeld is de metrische waarde nauwkeurigheid.

Parameters opruimen

Trainen, evalueren en vergelijken

Dezelfde module Tune Model Hyperparameters traint alle modellen die overeenkomen met de parameterset, evalueert verschillende metrische gegevens en maakt vervolgens het best getrainde model op basis van de metrische waarde die u kiest. Deze module heeft twee verplichte invoerwaarden:

  • De niet-getrainde cursist
  • De gegevensset

De module heeft ook een optionele gegevenssetinvoer. Koppel de gegevensset met vouwgegevens aan de verplichte gegevenssetinvoer. Als aan de gegevensset geen vouwgegevens worden toegewezen, wordt standaard een kruisvalidatie van 10 vouwen uitgevoerd. Als de vouwtoewijzing niet wordt uitgevoerd en er een validatiegegevensset wordt opgegeven op de optionele gegevenssetpoort, wordt er een train-testmodus gekozen en wordt de eerste gegevensset gebruikt om het model voor elke parametercombinatie te trainen.

Classificatie van de beslissingsstructuur verhoogd

Het model wordt vervolgens geëvalueerd op de validatiegegevensset. De linkeruitvoerpoort van de module toont verschillende metrische gegevens als functies van parameterwaarden. De juiste uitvoerpoort geeft het getrainde model dat overeenkomt met het best presterende model volgens de gekozen metrische waarde (nauwkeurigheid in dit geval).

Validatiegegevensset

U kunt de exacte parameters zien die zijn gekozen door de juiste uitvoerpoort te visualiseren. Dit model kan worden gebruikt bij het scoren van een testset of in een ge operationaliseerde webservice na het opslaan als een getraind model.