Regressie Poisson

In dit artikel wordt een onderdeel in de Azure Machine Learning-ontwerpfunctie beschreven.

Gebruik dit onderdeel om een Poisson-regressiemodel in een pijplijn te maken. Poisson-regressie is bedoeld voor het voorspellen van numerieke waarden, meestal aantallen. Daarom moet u dit onderdeel alleen gebruiken om uw regressiemodel te maken als de waarden die u probeert te voorspellen, voldoen aan de volgende voorwaarden:

  • De antwoordvariabele heeft een Poisson-verdeling.

  • Aantallen mogen niet negatief zijn. De methode mislukt ronduit als u deze probeert te gebruiken met negatieve labels.

  • Een Poisson-verdeling is een discrete verdeling; Daarom is het niet zinvol om deze methode te gebruiken met niet-gehele getallen.

Tip

Als uw doel geen telling is, is Poisson-regressie waarschijnlijk geen geschikte methode. Probeer andere regressieonderdelen in de ontwerpfunctie.

Nadat u de regressiemethode hebt ingesteld, moet u het model trainen met behulp van een gegevensset met voorbeelden van de waarde die u wilt voorspellen. Het getrainde model kan vervolgens worden gebruikt om voorspellingen te doen.

Meer informatie over Poisson-regressie

Poisson-regressie is een speciaal type regressieanalyse dat doorgaans wordt gebruikt voor het modelleren van aantallen. Poisson-regressie is bijvoorbeeld handig in de volgende scenario's:

  • Modelleren van het aantal verkoudingen dat is gekoppeld aan vliegtuigvluchten

  • Het aantal noodoproepen tijdens een gebeurtenis schatten

  • Projecteren van het aantal vragen van klanten na een promotie

  • Tabellen voor onvoorziene gebeurtenissen maken

Omdat de responsvariabele een Poisson-verdeling heeft, maakt het model andere veronderstellingen over de gegevens en de waarschijnlijkheidsverdeling dan bijvoorbeeld kleinste-kwadratenregressie. Daarom moeten Poisson-modellen anders worden geïnterpreteerd dan andere regressiemodellen.

Poisson-regressie configureren

  1. Voeg het onderdeel Poisson Regression toe aan uw pijplijn in de ontwerpfunctie. U vindt dit onderdeel onder Machine Learning-algoritmen in de categorie Regressie .

  2. Voeg een gegevensset toe die trainingsgegevens van het juiste type bevat.

    We raden u aan gegevens normaliseren te gebruiken om de invoergegevensset te normaliseren voordat u deze gebruikt om de regressor te trainen.

  3. Geef in het rechterdeelvenster van het onderdeel Poisson Regression op hoe u het model wilt trainen door de optie Trainermodus maken in te stellen.

    • Enkele parameter: als u weet hoe u het model wilt configureren, geeft u een specifieke set waarden op als argumenten.

    • Parameterbereik: als u niet zeker bent van de beste parameters, voert u een parameter-sweep uit met behulp van het onderdeel Model hyperparameters afstemmen . De trainer doorloopt meerdere waarden die u opgeeft om de optimale configuratie te vinden.

  4. Optimalisatietolerantie: typ een waarde die het tolerantie-interval definieert tijdens optimalisatie. Hoe lager de waarde, hoe langzamer en nauwkeuriger de montage.

  5. L1 regularisatiegewicht en L2-regularisatiegewicht: typ waarden die moeten worden gebruikt voor de regularisatie van L1 en L2. Regularisatie voegt beperkingen toe aan het algoritme met betrekking tot aspecten van het model die onafhankelijk zijn van de trainingsgegevens. Regularisatie wordt vaak gebruikt om overfitting te voorkomen.

    • L1-regularisatie is handig als het doel is om een zo sparse mogelijk model te hebben.

      L1-regularisatie wordt gedaan door het L1-gewicht van de gewichtsvector af te trekken van de verliesexpressie die de cursist probeert te minimaliseren. De L1-norm is een goede benadering van de L0-norm, wat het aantal niet-nulcoördinaten is.

    • L2-regularisatie voorkomt dat een enkele coördinaat in de gewichtsvector te groot wordt. L2-regularisatie is handig als het doel is om een model met een klein totaalgewicht te hebben.

    In dit onderdeel kunt u een combinatie van L1- en L2-regularisaties toepassen. Door de regularisatie van L1 en L2 te combineren, kunt u een boete instellen op de grootte van de parameterwaarden. De cursist probeert de boete te minimaliseren, in een compromis met het minimaliseren van het verlies.

    Zie L1 en L2 Regularisatie voor Machine Learning voor een goede bespreking van de regularisatie van L1 en L2.

  6. Geheugengrootte voor L-BFGS: geef de hoeveelheid geheugen op die moet worden gereserveerd voor het aanpassen en optimaliseren van het model.

    L-BFGS is een specifieke methode voor optimalisatie, gebaseerd op het algoritme Broyden–Fletcher–Goldfarb–Shanno (BFGS). De methode gebruikt een beperkte hoeveelheid geheugen (L) om de volgende staprichting te berekenen.

    Door deze parameter te wijzigen, kunt u het aantal eerdere posities en kleurovergangen beïnvloeden dat is opgeslagen voor de berekening van de volgende stap.

  7. Verbind de trainingsgegevensset en het niet-getrainde model met een van de trainingsonderdelen:

    • Als u De modus Trainer maken instelt op Enkele parameter, gebruikt u het onderdeel Train Model .

    • Als u de modus Trainer maken instelt op Parameterbereik, gebruikt u het onderdeel Model hyperparameters afstemmen .

    Waarschuwing

    • Als u een parameterbereik doorgeeft aan Train Model, wordt alleen de eerste waarde in de lijst met parameterbereiken gebruikt.

    • Als u één set parameterwaarden doorgeeft aan het onderdeel Model hyperparameters afstemmen en er een reeks instellingen voor elke parameter wordt verwacht, worden de waarden genegeerd en worden de standaardwaarden voor de cursist gebruikt.

    • Als u de optie Parameterbereik selecteert en één waarde voor een parameter invoert, wordt die ene waarde die u hebt opgegeven, gebruikt tijdens de sweep, zelfs als andere parameters in een bereik van waarden veranderen.

  8. Verzend de pijplijn.

Resultaten

Nadat de training is voltooid:

  • Als u een momentopname van het getrainde model wilt opslaan, selecteert u het trainingsonderdeel en gaat u naar het tabblad Uitvoer+logboeken in het rechterdeelvenster. Klik op het pictogram Gegevensset registreren. U vindt het opgeslagen model als onderdeel in de onderdelenstructuur.

Volgende stappen

Bekijk de set onderdelen die beschikbaar zijn voor Azure Machine Learning.