Delen via


Ondersteuningsvectormachineonderdeel van twee klassen

In dit artikel wordt een onderdeel in Azure Machine Learning Designer beschreven.

Gebruik dit onderdeel om een model te maken dat is gebaseerd op het algoritme van de ondersteuningsvectormachine.

Ondersteuningsvectormachines (SVM's) zijn een goed onderzochte klasse van leermethoden onder supervisie. Deze specifieke implementatie is geschikt voor het voorspellen van twee mogelijke resultaten, op basis van continue of categorische variabelen.

Nadat u de modelparameters hebt gedefinieerd, traint u het model met behulp van de trainingsonderdelen en geeft u een gelabelde gegevensset op die een kolom met labels of resultaten bevat.

Over support vector machines

Ondersteuningsvectormachines behoren tot de vroegste machine learning-algoritmen en SVM-modellen zijn in veel toepassingen gebruikt, van het ophalen van informatie tot tekst- en afbeeldingsclassificatie. SVM's kunnen worden gebruikt voor zowel classificatie- als regressietaken.

Dit SVM-model is een leermodel onder supervisie dat gelabelde gegevens vereist. In het trainingsproces analyseert het algoritme invoergegevens en herkent het patronen in een multidimensionale functieruimte met de naam hypervlak. Alle invoervoorbeelden worden weergegeven als punten in deze ruimte en worden toegewezen aan uitvoercategorieën op een zodanige manier dat categorieën worden verdeeld door zo breed en duidelijk mogelijk een kloof.

Voor voorspellingen wijst het SVM-algoritme nieuwe voorbeelden toe aan de ene categorie of de andere, waarbij deze in dezelfde ruimte worden toegewezen.

Configureren

Voor dit modeltype wordt aanbevolen dat u de gegevensset normaliseert voordat u deze gebruikt om de classificatie te trainen.

  1. Voeg het onderdeel Two-Class Support Vector Machine toe aan uw pijplijn.

  2. Geef op hoe u het model wilt trainen door de optie Trainer maken in te stellen.

    • Eén parameter: als u weet hoe u het model wilt configureren, kunt u een specifieke set waarden opgeven als argumenten.

    • Parameterbereik: Als u niet zeker bent van de beste parameters, kunt u de optimale parameters vinden met behulp van het onderdeel Tune Model Hyperparameters . U geeft een bepaald bereik van waarden op en de trainer doorloopt meerdere combinaties van de instellingen om de combinatie van waarden te bepalen die het beste resultaat opleveren.

  3. Bij het aantal iteraties typt u een getal dat het aantal iteraties aangeeft dat wordt gebruikt bij het bouwen van het model.

    Deze parameter kan worden gebruikt om de afweging tussen trainingssnelheid en nauwkeurigheid te regelen.

  4. Voor Lambda typt u een waarde die moet worden gebruikt als het gewicht voor L1-regularisatie.

    Deze regularisatiecoëfficiënt kan worden gebruikt om het model af te stemmen. Grotere waarden bestraffen complexere modellen.

  5. Selecteer de optie Normaliseer functies als u functies wilt normaliseren voordat u gaat trainen.

    Als u normalisatie toepast vóór de training, worden gegevenspunten gecentreerd op het gemiddelde en geschaald om één eenheid van de standaarddeviatie te hebben.

  6. Selecteer de optie Projecteer naar de eenheidsbol om coëfficiënten te normaliseren.

    Het projecteren van waarden naar eenheidsruimte betekent dat vóór de training gegevenspunten worden gecentreerd op 0 en geschaald om één eenheid van standaarddeviatie te hebben.

  7. Typ in random number seed een geheel getal dat moet worden gebruikt als seed als u de reproduceerbaarheid tussen uitvoeringen wilt garanderen. Anders wordt een systeemklokwaarde gebruikt als een seed, wat kan leiden tot iets andere resultaten tijdens uitvoeringen.

  8. Verbind een gelabelde gegevensset en train het model:

    • Als u de modus Trainer maken instelt op Single Parameter, verbindt u een getagde gegevensset en het onderdeel Train Model.

    • Als u de modus Trainer maken instelt op Parameterbereik, verbindt u een getagde gegevensset en traint u het model met behulp van Tune Model Hyperparameters.

    Notitie

    Als u een parameterbereik doorgeeft aan Train Model, wordt alleen de standaardwaarde in de lijst met enkele parameters gebruikt.

    Als u één set parameterwaarden doorgeeft aan het onderdeel Tune Model Hyperparameters , worden de waarden genegeerd en worden de standaardwaarden voor de cursist gebruikt wanneer er een reeks instellingen voor elke parameter wordt verwacht.

    Als u de optie Parameterbereik selecteert en één waarde invoert voor een parameter, wordt die ene waarde die u hebt opgegeven tijdens de opruimen gebruikt, zelfs als andere parameters in een bereik met waarden veranderen.

  9. Verzend de pijplijn.

Resultaten

Nadat de training is voltooid:

  • Als u een momentopname van het getrainde model wilt opslaan, selecteert u het tabblad Uitvoer in het rechterdeelvenster van het onderdeel Model trainen. Selecteer het pictogram Gegevensset registreren om het model op te slaan als een herbruikbaar onderdeel.

  • Als u het model wilt gebruiken voor scoren, voegt u het onderdeel Score Model toe aan een pijplijn.

Volgende stappen

Bekijk de set onderdelen die beschikbaar zijn voor Azure Machine Learning.