Delen via


Multiclass Logistic Regression-onderdeel

In dit artikel wordt een onderdeel in Azure Machine Learning Designer beschreven.

Gebruik dit onderdeel om een logistiek regressiemodel te maken dat kan worden gebruikt om meerdere waarden te voorspellen.

Classificatie met behulp van logistieke regressie is een leermethode onder supervisie en vereist daarom een gelabelde gegevensset. U traint het model door het model en de gelabelde gegevensset op te geven als invoer voor een onderdeel, zoals Train Model. Het getrainde model kan vervolgens worden gebruikt om waarden te voorspellen voor nieuwe invoervoorbeelden.

Azure Machine Learning biedt ook een tweeklasse logistieke regressiecomponent , die geschikt is voor de classificatie van binaire of dichotome variabelen.

Over logistieke regressie met meerdere klassen

Logistieke regressie is een bekende methode in statistieken die wordt gebruikt om de waarschijnlijkheid van een resultaat te voorspellen en is populair voor classificatietaken. Het algoritme voorspelt de kans op het optreden van een gebeurtenis door gegevens aan een logistieke functie toe te passen.

In logistieke regressie met meerdere klassen kan de classificatie worden gebruikt om meerdere resultaten te voorspellen.

Een logistieke regressie met meerdere klassen configureren

  1. Voeg het Multiclass Logistic Regression-onderdeel toe aan de pijplijn.

  2. Geef op hoe u het model wilt trainen door de optie Trainer maken in te stellen.

    • Eén parameter: gebruik deze optie als u weet hoe u het model wilt configureren en een specifieke set waarden als argumenten wilt opgeven.

    • Parameterbereik: selecteer deze optie als u niet zeker bent van de beste parameters en u een parameter-sweep wilt uitvoeren. Selecteer een bereik met waarden om deze te herhalen en de Tune Model Hyperparameters herhalen alle mogelijke combinaties van de instellingen die u hebt opgegeven om de hyperparameters te bepalen die de optimale resultaten opleveren.

  3. Optimalisatietolerantie, geef de drempelwaarde op voor de convergentie van de optimizer. Als de verbetering tussen iteraties kleiner is dan de drempelwaarde, stopt het algoritme en retourneert het huidige model.

  4. L1 regularisatiegewicht, L2 regularisatiegewicht: Typ een waarde die moet worden gebruikt voor de regularisatieparameters L1 en L2. Een niet-nulwaarde wordt aanbevolen voor beide.

    Regularisatie is een methode om overfitting te voorkomen door modellen met extreme coëfficiëntwaarden te bestraffen. Regularisatie werkt door de boete die is gekoppeld aan coëfficiëntwaarden toe te voegen aan de fout van de hypothese. Een nauwkeurig model met extreme coëfficiëntwaarden zou meer worden bestraft, maar een minder nauwkeurig model met meer conservatieve waarden zou minder worden bestraft.

    L1- en L2-regularisatie hebben verschillende effecten en toepassingen. L1 kan worden toegepast op sparse-modellen, wat handig is bij het werken met high-dimensionale gegevens. L2-regularisatie is daarentegen de voorkeur voor gegevens die niet worden geparseerd. Dit algoritme ondersteunt een lineaire combinatie van L1- en L2-regularisatiewaarden: dat wil gezegd, indien x = L1 en y = L2, ax + by = c definieert de lineaire span van de regularisatietermen.

    Er zijn verschillende lineaire combinaties van L1- en L2-termen bedacht voor logistieke regressiemodellen, zoals elastische net regularisatie.

  5. Random number seed: Typ een geheel getal dat moet worden gebruikt als de seed voor het algoritme als u wilt dat de resultaten worden herhaald over uitvoeringen. Anders wordt een systeemklokwaarde gebruikt als de seed, die iets andere resultaten kan opleveren bij uitvoeringen van dezelfde pijplijn.

  6. Verbind een gelabelde gegevensset en train het model:

    • Als u de modus Trainer maken instelt op Single Parameter, verbindt u een getagde gegevensset en het onderdeel Train Model.

    • Als u de modus Trainer maken instelt op Parameterbereik, verbindt u een getagde gegevensset en traint u het model met behulp van Tune Model Hyperparameters.

    Notitie

    Als u een parameterbereik doorgeeft aan Train Model, wordt alleen de standaardwaarde in de lijst met enkele parameters gebruikt.

    Als u één set parameterwaarden doorgeeft aan het onderdeel Tune Model Hyperparameters , worden de waarden genegeerd en worden de standaardwaarden voor de cursist gebruikt wanneer er een reeks instellingen voor elke parameter wordt verwacht.

    Als u de optie Parameterbereik selecteert en één waarde invoert voor een parameter, wordt die ene waarde die u hebt opgegeven tijdens de opruimen gebruikt, zelfs als andere parameters in een bereik met waarden veranderen.

  7. Verzend de pijplijn.

Volgende stappen

Bekijk de set onderdelen die beschikbaar zijn voor Azure Machine Learning.