Delen via


Regressie Poisson

Waarschuwing

Dit onderdeel IS AFGESCHAFT omdat de afhankelijkheid, het NimbusML-project , niet meer actief wordt onderhouden. Hierdoor ontvangt dit onderdeel geen toekomstige updates of beveiligingspatches. We zijn van plan dit onderdeel te verwijderen in toekomstige releases. Gebruikers worden aangeraden te migreren naar alternatieve oplossingen om te zorgen voor continue ondersteuning en beveiliging.

In dit artikel wordt een onderdeel in Azure Machine Learning Designer beschreven.

Gebruik dit onderdeel om een Poisson-regressiemodel in een pijplijn te maken. Poisson-regressie is bedoeld voor het voorspellen van numerieke waarden, meestal telt. Daarom moet u dit onderdeel gebruiken om uw regressiemodel alleen te maken als de waarden die u probeert te voorspellen aan de volgende voorwaarden voldoen:

  • De antwoordvariabele heeft een Poisson-verdeling.

  • Aantallen kunnen niet negatief zijn. De methode mislukt duidelijk als u deze probeert te gebruiken met negatieve labels.

  • Een Poisson-verdeling is een discrete verdeling; daarom is het niet zinvol om deze methode te gebruiken met niet-gehele getallen.

Tip

Als uw doel geen telling is, is Poisson-regressie waarschijnlijk geen geschikte methode. Probeer andere regressieonderdelen in de ontwerpfunctie.

Nadat u de regressiemethode hebt ingesteld, moet u het model trainen met behulp van een gegevensset met voorbeelden van de waarde die u wilt voorspellen. Het getrainde model kan vervolgens worden gebruikt om voorspellingen te doen.

Meer informatie over Poisson-regressie

Poisson-regressie is een speciaal type regressieanalyse dat doorgaans wordt gebruikt om het aantal modellen te modelleren. Poisson-regressie is bijvoorbeeld handig in deze scenario's:

  • Modelleren van het aantal kousen dat is gekoppeld aan vliegtuigvluchten

  • Het aantal noodoproepen schatten tijdens een gebeurtenis

  • Projecteren van het aantal klantvragen na een promotie

  • Onvoorziene tabellen maken

Omdat de antwoordvariabele een Poisson-verdeling heeft, maakt het model verschillende veronderstellingen over de gegevens en de waarschijnlijkheidsverdeling dan bijvoorbeeld de kleinste-kwadratenregressie. Poisson-modellen moeten daarom anders worden geïnterpreteerd dan andere regressiemodellen.

Poisson-regressie configureren

  1. Voeg het Poisson Regression-onderdeel toe aan uw pijplijn in de ontwerpfunctie. U vindt dit onderdeel onder Machine Learning-algoritmen in de categorie Regressie .

  2. Voeg een gegevensset toe die trainingsgegevens van het juiste type bevat.

    U wordt aangeraden gegevens normaliseren te gebruiken om de invoergegevensset te normaliseren voordat u deze gebruikt om de regressor te trainen.

  3. Geef in het rechterdeelvenster van het Poisson Regression-onderdeel op hoe u het model wilt trainen door de optie Trainermodus maken in te stellen.

    • Eén parameter: als u weet hoe u het model wilt configureren, geeft u een specifieke set waarden op als argumenten.

    • Parameterbereik: Als u niet zeker bent van de beste parameters, voert u een parameter opruimen met behulp van het onderdeel Tune Model Hyperparameters . De trainer doorloopt meerdere waarden die u opgeeft om de optimale configuratie te vinden.

  4. Optimalisatietolerantie: Typ een waarde die het tolerantie-interval tijdens optimalisatie definieert. Hoe lager de waarde, hoe langzamer en nauwkeuriger de fitting.

  5. L1 regularisatiegewicht en L2-regularisatiegewicht: Typ waarden die moeten worden gebruikt voor L1- en L2-regularisatie. Regularisatie voegt beperkingen toe aan het algoritme met betrekking tot aspecten van het model die onafhankelijk zijn van de trainingsgegevens. Regularisatie wordt vaak gebruikt om overfitting te voorkomen.

    • L1 regularisatie is handig als het doel is om een model te hebben dat zo sparse mogelijk is.

      L1 regularisatie wordt uitgevoerd door het L1-gewicht van de gewichtsvector af te trekken van de verliesexpressie die de cursist probeert te minimaliseren. De L1-norm is een goede benadering van de L0-norm, het aantal niet-nulcoördinaten.

    • L2 regularisatie voorkomt dat een enkele coördinaat in de gewichtsvector te veel in grootte groeit. L2-regularisatie is handig als het doel is om een model met kleine algemene gewichten te hebben.

    In dit onderdeel kunt u een combinatie van L1- en L2-regularisaties toepassen. Door de regularisatie van L1 en L2 te combineren, kunt u een boete opleggen aan de grootte van de parameterwaarden. De cursist probeert de boete te minimaliseren, in een compromis met het minimaliseren van het verlies.

    Zie L1 en L2 Regularisatie voor Machine Learning voor een goede bespreking van L1- en L2-regularisatie.

  6. Geheugengrootte voor L-BFGS: geef de hoeveelheid geheugen op die moet worden gereserveerd voor modelfitting en optimalisatie.

    L-BFGS is een specifieke methode voor optimalisatie, op basis van het algoritme Broyden–Fletcher–Goldfarb–Shanno (BFGS). De methode maakt gebruik van een beperkte hoeveelheid geheugen (L) om de volgende staprichting te berekenen.

    Door deze parameter te wijzigen, kunt u van invloed zijn op het aantal eerdere posities en kleurovergangen dat is opgeslagen voor de berekening van de volgende stap.

  7. Verbind de trainingsgegevensset en het niet-getrainde model met een van de trainingsonderdelen:

    Waarschuwing

    • Als u een parameterbereik doorgeeft aan Train Model, wordt alleen de eerste waarde in de lijst met parameterbereiken gebruikt.

    • Als u één set parameterwaarden doorgeeft aan het onderdeel Tune Model Hyperparameters , worden de waarden genegeerd en worden de standaardwaarden voor de cursist gebruikt wanneer er een reeks instellingen voor elke parameter wordt verwacht.

    • Als u de optie Parameterbereik selecteert en één waarde invoert voor een parameter, wordt die ene waarde die u hebt opgegeven tijdens de opruimen gebruikt, zelfs als andere parameters in een bereik met waarden veranderen.

  8. Verzend de pijplijn.

Resultaten

Nadat de training is voltooid:

  • Als u een momentopname van het getrainde model wilt opslaan, selecteert u het trainingsonderdeel en schakelt u over naar het tabblad Outputs+logs in het rechterdeelvenster. Klik op het pictogram Gegevensset registreren. U vindt het opgeslagen model als onderdeel in de onderdeelstructuur.

Volgende stappen

Bekijk de set onderdelen die beschikbaar zijn voor Azure Machine Learning.