Versterkte beslissingsstructuur met meerdere klassen
In dit artikel wordt een onderdeel in Azure Machine Learning Designer beschreven.
Gebruik dit onderdeel om een machine learning-model te maken dat is gebaseerd op het boosted decision trees-algoritme.
Een versterkte beslissingsstructuur is een ensembleleermethode waarin de tweede boom de fouten van de eerste boom corrigeert, de derde boom corrigeert voor de fouten van de eerste en tweede bomen, enzovoort. Voorspellingen zijn gebaseerd op het ensemble van bomen samen.
Configureren
Met dit onderdeel maakt u een niet-getraind classificatiemodel. Omdat classificatie een leermethode onder supervisie is, hebt u een gelabelde gegevensset nodig die een labelkolom met een waarde voor alle rijen bevat.
U kunt dit type model trainen met behulp van het train model.
Voeg het onderdeel Multiclass Boosted Decision Tree toe aan uw pijplijn.
Geef op hoe u het model wilt trainen door de optie Trainer maken in te stellen.
Eén parameter: als u weet hoe u het model wilt configureren, kunt u een specifieke set waarden opgeven als argumenten.
Parameterbereik: selecteer deze optie als u niet zeker bent van de beste parameters en u een parameter-sweep wilt uitvoeren. Selecteer een bereik met waarden om deze te herhalen en de Tune Model Hyperparameters herhalen alle mogelijke combinaties van de instellingen die u hebt opgegeven om de hyperparameters te bepalen die de optimale resultaten opleveren.
Het maximum aantal bladeren per boom beperkt het maximum aantal terminalknooppunten (bladeren) dat in elke boom kan worden gemaakt.
Door deze waarde te verhogen, vergroot u mogelijk de grootte van de boom en bereikt u een hogere precisie, met het risico op overfitting en langere trainingstijd.
Het minimum aantal steekproeven per leaf-knooppunt geeft het aantal gevallen aan dat is vereist voor het maken van een terminalknooppunt (leaf) in een boomstructuur.
Door deze waarde te verhogen, verhoogt u de drempelwaarde voor het maken van nieuwe regels. Als u bijvoorbeeld de standaardwaarde 1 hebt, kan zelfs één geval ertoe leiden dat er een nieuwe regel wordt gemaakt. Als u de waarde verhoogt tot 5, moeten de trainingsgegevens ten minste vijf gevallen bevatten die aan dezelfde voorwaarden voldoen.
Het leerpercentage definieert de stapgrootte tijdens het leren. Voer een getal tussen 0 en 1 in.
De leersnelheid bepaalt hoe snel of traag de cursist convergeert op een optimale oplossing. Als de stap te groot is, kunt u de optimale oplossing overslaan. Als de stap te klein is, duurt het langer om de training te convergeren op de beste oplossing.
Het aantal bomen dat is gebouwd, geeft het totale aantal beslissingsstructuren aan dat in het ensemble moet worden gemaakt. Door meer beslissingsstructuren te creëren, kunt u mogelijk betere dekking krijgen, maar de trainingstijd zal toenemen.
Willekeurig getal seed stelt optioneel een niet-negatief geheel getal in dat moet worden gebruikt als de willekeurige seed-waarde. Het opgeven van een seed zorgt voor reproduceerbaarheid voor uitvoeringen met dezelfde gegevens en parameters.
Het willekeurige zaad is standaard ingesteld op 42. Opeenvolgende uitvoeringen met verschillende willekeurige zaden kunnen verschillende resultaten hebben.
Het model trainen:
Als u de modus Trainer maken instelt op Single Parameter, verbindt u een getagde gegevensset en het onderdeel Train Model.
Als u de modus Trainer maken instelt op Parameterbereik, verbindt u een getagde gegevensset en traint u het model met behulp van Tune Model Hyperparameters.
Notitie
Als u een parameterbereik doorgeeft aan Train Model, wordt alleen de standaardwaarde in de lijst met enkele parameters gebruikt.
Als u één set parameterwaarden doorgeeft aan het onderdeel Tune Model Hyperparameters , worden de waarden genegeerd en worden de standaardwaarden voor de cursist gebruikt wanneer er een reeks instellingen voor elke parameter wordt verwacht.
Als u de optie Parameterbereik selecteert en één waarde invoert voor een parameter, wordt die ene waarde die u hebt opgegeven tijdens de opruimen gebruikt, zelfs als andere parameters in een bereik met waarden veranderen.
Volgende stappen
Bekijk de set onderdelen die beschikbaar zijn voor Azure Machine Learning.