Delen via


Waarschijnlijkheidsfunctie evalueren

Belangrijk

De ondersteuning voor Azure Machine Learning-studio (klassiek) eindigt op 31 augustus 2024. U wordt aangeraden om vóór die datum over te stappen naar Azure Machine Learning.

Vanaf 1 december 2021 kunt u geen nieuwe resources voor Azure Machine Learning-studio (klassiek) meer maken. Tot en met 31 augustus 2024 kunt u de bestaande resources van Azure Machine Learning-studio (klassiek) blijven gebruiken.

De documentatie van ML-studio (klassiek) wordt buiten gebruik gesteld en wordt in de toekomst mogelijk niet meer bijgewerkt.

Past bij een opgegeven waarschijnlijkheidsverdelingsfunctie voor een gegevensset

Categorie: Statistische functies

Notitie

Van toepassing op: alleen Machine Learning Studio (klassiek)

Vergelijkbare modules voor slepen en neerzetten zijn beschikbaar in Azure Machine Learning designer.

Moduleoverzicht

In dit artikel wordt beschreven hoe u de module Waarschijnlijkheidsfunctie evalueren in Machine Learning Studio (klassiek) gebruikt om statistische metingen te berekenen die de verdeling van een kolom beschrijven, zoals de Bernoulli-, Pareto- of Poisson-verdelingen.

Als u dit model wilt gebruiken, verbindt u een gegevensset die ten minste één kolom met numerieke waarden bevat en kiest u een waarschijnlijkheidsverdeling die u wilt testen. De module retourneert een gegevenstabel met waarden uit de opgegeven waarschijnlijkheidsfunctie.

U kunt een van deze waarden berekenen voor de gekozen waarschijnlijkheidsverdeling:

  • cumulatieve verdelingsfunctie (cdf)
  • inverse cumulatieve verdelingsfunctie (InverseCdf)
  • kansdichtheidsfunctie (Pdf)

Waarom is de waarschijnlijkheidsverdeling nuttig?

Wanneer u uw gegevens evalueert op basis van een waarschijnlijkheidsverdeling, worden kolomwaarden toegewezen aan een set waarden met bekende eigenschappen. Door te weten of uw gegevens overeenkomen met een van deze bekende distributies, kunt u mogelijk andere eigenschappen van uw gegevens afleiden. Over het algemeen krijgt u betere voorspellingen van een model wanneer u de distributie kunt identificeren die het beste bij de gegevens past.

De vraag welke waarschijnlijkheidsverdelingsfunctie moet worden gebruikt, is afhankelijk van de gegevens en de variabelen die worden gemeten. Sommige distributies zijn bijvoorbeeld ontworpen om de waarschijnlijkheid van discrete waarden te beschrijven; andere zijn alleen bedoeld voor gebruik met doorlopende numerieke variabelen. Voor sommige distributies moet u ook van tevoren een verwacht gemiddelde, vrijheidsgraden, enzovoort weten. Zie Ondersteunde kansverdelingen voor meer informatie

De kansfunctie evalueren configureren

  • Alle opties veranderen afhankelijk van het type waarschijnlijkheidsverdeling dat u wilt berekenen. Als u de kansverdelingsmethode wijzigt, worden andere selecties die u mogelijk hebt gemaakt, opnieuw ingesteld.

    Zorg er daarom voor dat u eerst de optie Distributie kiest.

  • De gegevensset die als invoer wordt gebruikt, moet numerieke gegevens bevatten. Andere typen gegevens worden genegeerd.

  • Voor elke analyse kunt u één kansverdelingsmethode toepassen. Als u een andere waarschijnlijkheidsverdeling wilt berekenen, voegt u een afzonderlijk exemplaar van de module toe voor elke distributie die u wilt testen.

  1. Voeg de module Kansfunctie evalueren toe aan uw experiment. U vindt deze module in de categorie Statistische functies in Machine Learning Studio (klassiek).

  2. Verbinding maken een gegevensset die ten minste één kolom met getallen bevat.

  3. Gebruik de optie Distributie om het soort waarschijnlijkheidsverdeling te selecteren dat u wilt berekenen. Zie Ondersteunde kansverdelingen voor een lijst met opties en de vereiste argumenten.

  4. Stel parameters in die vereist zijn voor de distributie.

  5. Kies een van de drie statistieken die u wilt maken: de cumulatieve verdelingsfunctie (cdf), de inverse cumulatieve verdelingsfunctie (InverseCdf) of de kansdichtheidsfunctie (pdf).

    Zie de sectie Technische opmerkingen voor definities.

  6. Gebruik de kolomkiezer om de kolommen te kiezen waarvoor de geselecteerde waarschijnlijkheidsverdeling moet worden berekend.

    • Alle kolommen die u selecteert, moeten een numeriek gegevenstype hebben.

    • Het gegevensbereik in de kolom moet ook geldig zijn, gezien de geselecteerde waarschijnlijkheidsfunctie. Anders kan er een fout of NaN-resultaat optreden.

    • Voor parseringskolommen worden waarden die overeenkomen met achtergrondnullen niet verwerkt.

  7. Gebruik de optie Resultaatmodus om op te geven hoe de resultaten moeten worden uitgevoerd. U kunt kolomwaarden vervangen door de waarschijnlijkheidsdistributiewaarden, de nieuwe waarden toevoegen aan de gegevensset of alleen de waarschijnlijkheidsverdelingswaarden retourneren.

  8. Voer het experiment uit of klik met de rechtermuisknop op de module Waarschijnlijkheidsfunctie evalueren en klik op Uitvoeren geselecteerd.

Resultaten

De volgende tabel bevat een voorbeeld van resultaten, met behulp van de optie Toevoegen , op één temperatuurkolom uit de voorbeeldgegevensset Forest Fires .

temp StandardNormal.Cdf(temp) StandardNormal.Pdf(temp) FFisher.cdf(temp FFisher.cdf(temp
8.2 1 1 0.984774 0.004349
18 1 1 0.997896 0.000311
14.6 1 1 0.996352 0.000648
8.3 1 1 0.985201 0.004187
11,4 1 1 0.993147 0.001502

De koppen van de gegenereerde kolommen bevatten de waarschijnlijkheidsverdeling die is gebruikt.

Als u niet zeker weet welke waarschijnlijkheidsverdeling waarschijnlijk past bij uw gegevens, kunt u een snel diagram maken van cumulatieve verdeling en kansdichtheid voor elke numerieke kolom.

  1. Klik met de rechtermuisknop op de uitvoer van de gegevensset of module en selecteer Visualiseren.
  2. Selecteer de interessekolom en selecteer in het deelvenster Histogramde cumulatieve verdeling of kansdichtheid.
  3. Een grafiek van de distributie, zoals het volgende, wordt vervangen door het histogram dat de gegevens vertegenwoordigt.

aml_histogram_cdf_pdf_chart

Ondersteunde kansverdelingen

De module Evaluate Probability Function ondersteunt de volgende verdelingen:

Bernoulli

De Bernoulli-verdeling is een verdeling over binaire waarden: met andere woorden, het modelleert de verwachte verdeling wanneer slechts twee waarden mogelijk zijn.

Als u wilt berekenen, selecteert u Bernoulli en stelt u de volgende opties in:

  • Kans op succes
    De parameter p geeft de kans op dat een 1 wordt gegenereerd. Typ een getal (float) tussen 0,0 en 1,0 dat de kans op succes aangeeft. De standaardwaarde is .5.

Bèta

De bèta-verdeling is een continue univariate verdeling.

Als u wilt berekenen, selecteert u Bèta en stelt u de volgende opties in:

  • Vorm
    Typ een waarde om de vorm van de verdeling te wijzigen.

    Een shapeparameter is een parameter van een waarschijnlijkheidsverdeling die de locatie of schaal niet definieert. Wanneer u daarom een waarde voor een shape invoert, verandert de parameter de vorm van de verdeling in plaats van deze te verplaatsen, uit te rekken of te verkleinen.

    De waarde moet een getal (double) zijn. De standaardwaarde is 1.0.

  • Schalen
    Typ een getal dat u wilt gebruiken voor het schalen van de distributie.

    Door een schaalwaarde toe te passen op de distributie, kunt u deze verkleinen of uitrekken.

    De standaardwaarde is 1,0. Waarden moeten positieve getallen zijn.

  • Bovengrens
    Typ een getal (double) dat de bovengrens van de verdeling vertegenwoordigt. De standaardwaarde is 1.0.

  • Ondergrens
    Typ een getal (double) dat de ondergrens van de verdeling vertegenwoordigt. De standaardwaarde is 0.0.

Binomiale

De binomiale verdeling is een discrete univariate-verdeling. De binomiale verdeling wordt gebruikt om het aantal gunstige uitkomsten in een steekproef te modelleren. Vervanging wordt gebruikt bij het nemen van steekproeven. Gebruik de Hypergeometrische verdeling voor steekproeven zonder vervanging.

Als u wilt berekenen, selecteert u Binomiaal en stelt u de volgende opties in:

  • Kans op succes
    Typ een getal (float) tussen 0,0 en 1,0 dat de kans op succes aangeeft. De standaardwaarde is .5.

  • Aantal proefversies
    Geef het aantal proefversies op.

    Gebruik een integer, met een minimumwaarde van 1. De standaardwaarde is 3.

Cauchy

De Cauchy-verdeling is een symmetrische continue waarschijnlijkheidsverdeling.

Als u wilt berekenen, selecteert u Cauchy en stelt u de volgende opties in:

  • Locatie
    Typ een getal (double) dat de locatie van het0e element aangeeft.

    Door een waarde voor de parameter Locatie op te geven, kunt u de waarschijnlijkheidsverdeling omhoog of omlaag verplaatsen naar een numerieke schaal.

    De standaardwaarde is 0.0.

ChiSquare

De chi-kwadratische verdeling is een som van de kwadraten van k onafhankelijke, standaard, normale, willekeurige variabelen.

Als u wilt berekenen, selecteert u ChiSquare en stelt u de volgende opties in:

  • Aantal vrijheidsgraden Typ een getal (double) om de vrijheidsgraden op te geven. De standaardwaarde is 1.0.

ChiSquareRightTailed

Deze optie biedt een rechtszijdige chi-kwadraatverdeling.

Als u wilt berekenen, selecteert u ChiSquareRightTailed en stelt u de volgende opties in:

  • Aantal vrijheidsgraden
    Typ een getal (double) om de vrijheidsgraden op te geven. De standaardwaarde is 1.0.

Exponentieel

De exponentiële verdeling is een verdeling over de reële getallen die worden geparameteriseerd door één niet-negatieve parameter.

Als u wilt berekenen, selecteert u Exponentieel en stelt u de volgende opties in:

  • Lambda
    Typ een getal (double) dat moet worden gebruikt als de lambda-parameter. De standaardwaarde is 1.0.

FFisher

Genereert de waarschijnlijkheid van de Fisher-statistiek voor een steekproef, ook wel bekend als de Fisher F-verdeling. Deze verdeling is tweezijdig.

Als u wilt berekenen, selecteert u FFisher en stelt u de volgende opties in:

  • Vrijheidsgraden van teller
    Typ een getal (double) om de vrijheidsgraden op te geven die in de teller worden gebruikt. De standaardwaarde is 3.0.

  • Noemergraden van vrijheid
    Typ een getal (double) om de vrijheidsgraden op te geven die in de noemer worden gebruikt. De standaardwaarde is 6.0.

FFisherRightTailed

Hiermee maakt u een rechtszijdige Fisher-distributie. De Fisher-distributie wordt ook wel de Fisher F-distributie, Snedecor-distributie of Fisher-Snedecor distributie genoemd. Deze specifieke vorm van de verdeling is rechtszijdig.

Als u wilt berekenen, selecteert u FFisherRightTailed en stelt u de volgende opties in:

  • Vrijheidsgraden van teller
    Typ een getal (double) om de vrijheidsgraden op te geven die in de teller worden gebruikt. De standaardwaarde is 3.0.

  • Noemergraden van vrijheid
    Typ een getal (double) om de vrijheidsgraden op te geven die in de noemer worden gebruikt. De standaardwaarde is 6.0.

Gamma

De gamma-verdeling is een familie van continue waarschijnlijkheidsverdelingen met twee parameters. Chi-kwadraat is bijvoorbeeld een speciaal geval van de gamma-verdeling.

Als u wilt berekenen, selecteert u Gamma en stelt u de volgende opties in:

  • Schalen
    Typ een waarde die u wilt gebruiken voor het schalen van de distributie.

    Door een schaalwaarde toe te passen op de distributie, kunt u deze verkleinen of uitrekken.

    De standaardwaarde is 1,0. Waarden moeten positieve getallen zijn.

  • Locatie
    Typ een getal (double) dat de locatie van het0e element aangeeft.

    Door een waarde voor de parameter Locatie op te geven, kunt u de waarschijnlijkheidsverdeling omhoog of omlaag verplaatsen naar een numerieke schaal.

    De standaardwaarde is 0.0.

GeneralizedValues

Hiermee maakt u een distributie die is ontwikkeld om extreme waarden te verwerken. De gegeneraliseerde extreme waardeverdeling (GEV) is eigenlijk een groep continue waarschijnlijkheidsverdelingen waarin de Gumbel-, Fréchet- en Weibull-verdelingen (ook wel type I, II en III extreme waardeverdelingen genoemd) worden gecombineerd.

Zie dit artikel in Wikipedia: Fisher-Tippet-Gnedenko theorema voor meer informatie over extreme waardetheorie.

Als u wilt berekenen, selecteert u GeneralizedValues en stelt u de volgende opties in:

  • Vorm
    Typ een waarde om de vorm van de verdeling te wijzigen.

    Een shapeparameter is een parameter van een waarschijnlijkheidsverdeling die de locatie of schaal niet definieert. Wanneer u daarom een waarde voor een shape invoert, verandert de parameter de vorm van de verdeling in plaats van deze te verplaatsen, uit te rekken of te verkleinen.

    De waarde moet een getal (double) zijn. De standaardwaarde is 1.0.

  • Schalen
    Typ een waarde die u wilt gebruiken voor het schalen van de distributie.

    Door een schaalwaarde toe te passen op de distributie, kunt u deze verkleinen of uitrekken.

    De standaardwaarde is 1,0. Waarden moeten positieve getallen zijn.

  • Locatie
    Typ een getal (double) dat de locatie van het0e element aangeeft.

    Door een waarde voor de parameter Locatie te typen, kunt u de waarschijnlijkheidsverdeling omhoog of omlaag verplaatsen naar een numerieke schaal.

    De standaardwaarde is 0.0.

Geometrische

De geometrische verdeling is een verdeling over positieve gehele getallen die worden geparameteriseerd door één positief reëel getal.

Als u wilt berekenen, selecteert u Geometrisch en stelt u de volgende opties in:

  • Kans op succes
    Typ een getal (float) tussen 0,0 en 1,0 dat de kans op succes aangeeft. De standaardwaarde is .5.

Notitie

Deze implementatie van de geometrische verdeling genereert geen nullen.

GumbelMax

De Gumbel-verdeling is een van de verschillende extreme waardeverdelingen. Met de optie GumbelMax wordt de maximale extreme waardetype 1-verdeling geïmplementeerd.

Als u wilt berekenen, selecteert u GumbelMax en stelt u de volgende opties in:

  • Schalen
    Typ een waarde die u wilt gebruiken voor het schalen van de distributie.

    Door een schaalwaarde toe te passen op de distributie, kunt u deze verkleinen of uitrekken.

    De standaardwaarde is 1,0. Waarden moeten positieve getallen zijn.

  • Locatie
    Typ een getal (double) dat de locatie van het0e element aangeeft.

    Door een waarde voor de parameter Locatie te typen, kunt u de waarschijnlijkheidsverdeling omhoog of omlaag verplaatsen naar een numerieke schaal.

    De standaardwaarde is 0.0.

GumbelMin

De Gumbel-verdeling is een van de verschillende extreme waardeverdelingen. De Gumbel-verdeling wordt ook wel de kleinste extreme waardeverdeling (SEV) of de kleinste extreme waardeverdeling (Type I) genoemd. Met de optie GumbelMin wordt de minimale extreme waardetype 1-verdeling geïmplementeerd.

Als u wilt berekenen, selecteert u GumbelMin en moet u de volgende opties instellen:

  • Schalen
    Typ een waarde die u wilt gebruiken voor het schalen van de distributie.

    Door een schaalwaarde toe te passen op de distributie, kunt u deze verkleinen of uitrekken.

    De standaardwaarde is 1,0. Waarden moeten positieve getallen zijn.

  • Locatie
    Typ een getal (double) dat de locatie van het0e element aangeeft.

    Door een waarde voor de parameter Locatie te typen, kunt u de waarschijnlijkheidsverdeling omhoog of omlaag verplaatsen naar een numerieke schaal.

    De standaardwaarde is 0.0.

Hypergeometrische

De hypergeometrische verdeling is een discrete waarschijnlijkheidsverdeling die het aantal gunstige uitkomsten in een reeks n tekent van een eindige populatie zonder vervanging, net zoals in de binomiale verdeling het aantal gunstige uitkomsten voor tekenen met vervanging wordt beschreven.

Als u wilt berekenen, selecteert u Hypergeometrisch en stelt u de volgende opties in:

  • Aantal monsters
    Typ een geheel getal dat het aantal te gebruiken voorbeelden aangeeft. De standaardwaarde is 9.

  • Aantal geslaagde bewerkingen
    Typ een geheel getal dat de waarde voor succes definieert. De standaardwaarde is 24.

  • Grootte van populatie
    Geef de populatiegrootte op die moet worden gebruikt bij het schatten van de hypergeometrische verdeling.

Laplace

De Laplace-distributie is een verdeling over de reële getallen, geparameteriseerd met een gemiddelde en met een schaalparameter.

Als u wilt berekenen, selecteert u Laplace-distributie en stelt u de volgende opties in:

  • Schalen
    Typ een waarde die u wilt gebruiken voor het schalen van de distributie.

    Door een schaalwaarde toe te passen op de distributie, kunt u deze verkleinen of uitrekken.

    De standaardwaarde is 1,0. Waarden moeten positieve getallen zijn.

  • Locatie
    Typ een getal (double) dat de locatie van het0e element aangeeft.

    Door een waarde voor de parameter Locatie te typen, kunt u de waarschijnlijkheidsverdeling omhoog of omlaag verplaatsen naar een numerieke schaal.

    De standaardwaarde is 0.0.

Logistieke

De logistieke distributie is vergelijkbaar met de normale distributie, maar heeft geen limiet aan de linkerkant van de distributie. De logistieke distributie wordt gebruikt in logistieke regressie- en neurale netwerkmodellen en voor het modelleren van life sciences-gegevens.

Als u wilt berekenen, selecteert u Logistiek en stelt u de volgende opties in:

  • Schalen
    Typ een waarde die u wilt gebruiken voor het schalen van de distributie.

    Door een schaalwaarde toe te passen op de distributie, kunt u deze verkleinen of uitrekken.

    De standaardwaarde is 1,0. Waarden moeten positieve getallen zijn.

  • Bedoel
    Typ een getal (double)dat de geschatte gemiddelde waarde van de verdeling aangeeft. De standaardwaarde is 0.0.

Logaritmische

De logaritmische verdeling is een continue univariate-verdeling.

Als u wilt berekenen, selecteert u Logarial en stelt u de volgende opties in:

  • Bedoel
    Typ een getal (double) dat de geschatte gemiddelde waarde van de verdeling aangeeft. De standaardwaarde is 0.0.

  • Standaarddeviatie
    Typ een positief getal (double) dat de geschatte standaarddeviatie van de verdeling aangeeft. De standaardwaarde is 1.0.

NegativeBinomial

De negatieve binomiale verdeling is een verdeling over de natuurlijke getallen met twee parameters (r, p). In het speciale geval dat r een geheel getal is, kunt u de verdeling interpreteren als het aantal zijden vóór hetrth-hoofd wanneer de waarschijnlijkheid van het hoofd p is.

Als u wilt berekenen, selecteert u NegativeBinomial en stelt u de volgende opties in:

  • Kans op succes
    Typ een getal (float) tussen 0,0 en 1,0 dat de kans op succes aangeeft. De standaardwaarde is .5.

  • Aantal geslaagde bewerkingen
    Typ een geheel getal dat de waarde voor succes aangeeft. De standaardwaarde is 24.

Normaal

De normale verdeling wordt ook wel de Gaussiaanse verdeling genoemd.

Als u wilt berekenen, selecteert u Normaal en stelt u de volgende opties in:

  • Bedoel
    Typ een getal (double) dat de geschatte gemiddelde waarde van de verdeling aangeeft. De standaardwaarde is 0.0.

  • Standaarddeviatie
    Typ een positief getal (double) dat de geschatte standaarddeviatie van de verdeling aangeeft. De standaardwaarde is 1.0.

Pareto

De Pareto-verdeling is een machtswetsverdeling die samenvalt met sociale, wetenschappelijke, geofysische, actuariele en vele andere soorten waarneembare verschijnselen.

Als u wilt berekenen, selecteert u Pareto en stelt u de volgende opties in:

  • Vorm
    Typ een waarde (optioneel) om de vorm van de verdeling te wijzigen.

    Een shapeparameter is een parameter van een waarschijnlijkheidsverdeling die de locatie of schaal niet definieert. Als u daarom een waarde voor de shape invoert, wordt de vorm van de verdeling gewijzigd in plaats van de shape te verplaatsen, uit te rekken of te verkleinen.

    De waarde moet een getal (double) zijn. De standaardwaarde is 1.0.

  • Schalen
    Typ een waarde (optioneel) om de schaal van de distributie te wijzigen. Door een schaalwaarde toe te passen op de verdeling, kunt u deze verkleinen of uitrekken.

    De waarde moet een getal (double) zijn. De standaardwaarde is 1.0.

Poisson

In deze implementatie wordt de methode van Knuth gebruikt om gedistribueerde Willekeurige Variabelen van Poisson te genereren. Zie Poisson-regressie voor meer informatie over de Poisson-verdeling.

Als u wilt berekenen, selecteert u Poisson en stelt u de volgende opties in:

  • Bedoel
    Typ een getal (double) dat de geschatte gemiddelde waarde van de verdeling aangeeft. De standaardwaarde is 0.0.

Rayleigh

De Rayleigh-verdeling is een continue waarschijnlijkheidsverdeling. Als voorbeeld van hoe het ontstaat, heeft de windsnelheid een Rayleigh-verdeling als de onderdelen van de tweedimensionale windsnelheidsvector niet-gerelateerd zijn en normaal verdeeld zijn met gelijke variantie.

Als u wilt berekenen, selecteert u Rayleigh en stelt u de volgende opties in:

  • Ondergrens
    Typ een getal (double) dat de ondergrens van de verdeling vertegenwoordigt. De standaardwaarde is 0.0.

Standaardnormaal

Deze optie biedt de standaard normale verdeling, zonder andere parameters.

Als u wilt berekenen, selecteert u StandardNormal en selecteert u de kolommen.

TStudent

Met deze optie wordt de univariate student t-distributie geïmplementeerd.

Als u wilt berekenen, selecteert u TStudent en stelt u de volgende opties in:

  • Aantal vrijheidsgraden
    Typ een getal (double) om de vrijheidsgraden op te geven. De standaardwaarde is 1.0.

TStudentRightTailed

Implementeert de univariate student t-verdeling met behulp van één rechterstaart.

Als u wilt berekenen, selecteert u TStudentRightTailed en stelt u de volgende opties in:

  • Aantal vrijheidsgraden
    Typ een getal (double) om de vrijheidsgraden op te geven. De standaardwaarde is 1.0.

TStudentTwoTailed

Implementeert een tweezijdige t-verdeling van studenten.

Als u wilt berekenen, selecteert u TStudentTwoTailed en stelt u de volgende opties in:

  • Aantal vrijheidsgraden
    Typ een getal (double) om de vrijheidsgraden op te geven. De standaardwaarde is 1.0.

Uniforme

De uniforme verdeling wordt ook wel de rechthoekige verdeling genoemd.

Als u wilt berekenen, selecteert u Uniform en stelt u de volgende opties in:

  • Ondergrens
    Typ een getal (double) dat de ondergrens van de verdeling aangeeft. De standaardwaarde is 0.0.

  • Bovengrens
    Typ een getal (double) dat de bovengrens van de verdeling aangeeft. De standaardwaarde is 1.0.

Weibull

De Weibull-distributie wordt veel gebruikt in betrouwbaarheidstechniek. U kunt de parameter Shape gebruiken om veel andere distributies te modelleren.

Als u wilt berekenen, selecteert u Weibull en stelt u de volgende opties in:

  • Vorm
    Typ een waarde (optioneel) om de vorm van de verdeling te wijzigen.

    Een shapeparameter is een parameter van een waarschijnlijkheidsverdeling die de locatie of schaal niet definieert. Als u daarom een waarde voor de shape invoert, wordt de vorm van de verdeling gewijzigd in plaats van de shape te verplaatsen, uit te rekken of te verkleinen.

    De waarde moet een getal (double) zijn. De standaardwaarde is 1.0.

  • Schalen
    Typ een waarde (optioneel) om de schaal van de distributie te wijzigen. Door een schaalwaarde toe te passen op de verdeling, kunt u deze verkleinen of uitrekken.

    De waarde moet een getal (double) zijn. De standaardwaarde is 1.0.

Technische opmerkingen

Deze sectie bevat implementatiedetails, tips en antwoorden op veelgestelde vragen.

Implementatiegegevens

Deze module ondersteunt alle distributies die worden geleverd in de bibliotheek open source MATH.NET Numerieke gegevens. Zie de documentatie voor de bibliotheek Math.Net.Numerics.Distribution voor meer informatie.

Rechtszijdige en tweezijdige distributies worden weergegeven als afzonderlijke distributies, niet als geparameteriseerde versies van basisdistributies. Het huidige gedrag is het behouden van compatibiliteit met Excel.

Definities

Deze module ondersteunt het berekenen van een van deze waarden voor de opgegeven distributie:

  • cdf of de cumulatieve verdelingsfunctie

    Retourneert de kans voor een samengestelde gebeurtenis, gedefinieerd als de som van currences wanneer de willekeurige variabele een waarde kleiner dan een bepaalde waarde x neemt.

    Met andere woorden, het beantwoordt de vraag: 'Hoe vaak zijn steekproeven die kleiner zijn dan of gelijk zijn aan deze waarde?'

    Deze functie kan worden gebruikt met zowel continue als discrete numerieke variabelen.

  • InverseCdf of de inverse cumulatieve verdelingsfunctie

    Retourneert de waarde die is gekoppeld aan een specifieke cumulatieve waarschijnlijkheidswaarde (cdf).

    Met andere woorden, het beantwoordt de vraag: "Wat is de waarde van x waarmee de cdf-functie de cumulatieve kans y retourneert?"

  • pdf of de kansdichtheidsfunctie

    Beschrijft de relatieve kans dat een willekeurige variabele een specifieke waarde is.

    Met andere woorden, het beantwoordt de vraag: "Hoe vaak zijn steekproeven precies op deze waarde?"

Verwachte invoer

Naam Type Beschrijving
Gegevensset Gegevenstabel Invoergegevensset

Moduleparameters

Name Bereik Type Standaard Beschrijving
Distributie Alle Kansdistributie Standaardnormaal Selecteer het soort waarschijnlijkheidsverdeling dat u wilt genereren.
Methode Alle ProbabilityDistributionMethod Cdf Selecteer de methode die u wilt gebruiken bij het berekenen van de geselecteerde waarschijnlijkheidsverdeling.

Opties zijn de cumulatieve verdelingsfunctie (cdf), de inverse cumulatieve verdelingsfunctie (InverseCdf) en de kansdichtheidsfunctie of massafunctie (pdf).
Negatieve binomiale distributiemethode Alle KansDistributionMethodForNegativeBinomial Cdf Als u de negatieve binomiale verdeling selecteert, geeft u de methode op die wordt gebruikt voor het evalueren van de distributie.
Kans op succes [0.0;1.0] Float 0,5 Typ een waarde die moet worden gebruikt als de kans op succes.
Vorm Alle Float 1.0 Typ een waarde die de vorm van de verdeling wijzigt.
Schalen >=0,0 Float 1.0 Typ een waarde die de schaal van de distributie wijzigt om deze groter of kleiner te maken.
Aantal experimenten >=1 Geheel getal 3 Geef het aantal experimenten op.
Ondergrens Alle Float 0,0 Typ een getal dat moet worden gebruikt als de ondergrens van de distributie
Bovengrens Alle Float 1.0 Typ een getal dat moet worden gebruikt als de bovengrens van de distributie
Locatie Alle Float 0,0 Typ de locatie van het nulelement in de verdeling.
Aantal vrijheidsgraden Alle Float 1.0 Geef het aantal vrijheidsgraden op.
Vrijheidsgraden van teller Alle Float 3,0 Geef het aantal vrijheidsgraden in de teller op.
Noemer vrijheidsgraden Alle Float 6.0 Geef het aantal vrijheidsgraden in de noemer op.
Lambda >=0,0 Float 1.0 Geef een waarde op voor de lambda-parameter.
Aantal monsters Alle Geheel getal 9 Geef het aantal steekproeven op.
Aantal geslaagde Alle Geheel getal 24 Typ een waarde die u wilt gebruiken als het aantal geslaagde waarden.
Grootte van populatie Alle Geheel getal 52 Geef de grootte van de populatie op.
Gemiddeld Alle Float 0,0 Typ de geschatte gemiddelde waarde.
Standaarddeviatie >=0,0 Float 1.0 Typ de geschatte standaarddeviatie.
Kolomset Alle ColumnSelection Kies de kolommen waarover u de waarschijnlijkheidsverdeling wilt berekenen.
Resultaatmodus Alle Outputto ResultOnly Geef op hoe de resultaten moeten worden opgeslagen in de uitvoergegevensset. De opties zijn om nieuwe kolommen toe te voegen, bestaande kolommen te vervangen of alleen de resultaten uit te voeren.

Uitvoer

Naam Type Beschrijving
Resultatengegevensset Gegevenstabel Uitvoergegevensset

Uitzondering

Zie Modulefoutcodes voor een volledige lijst met foutberichten.

Uitzondering Beschrijving
Fout 0017 Uitzondering treedt op als een of meer opgegeven kolommen een type hebben dat niet wordt ondersteund door de huidige module.

Zie Machine Learning Foutcodes voor een lijst met fouten die specifiek zijn voor Studio-modules (klassiek).

Zie Machine Learning REST API-foutcodes voor een lijst met API-uitzonderingen.

Zie ook

Statistische functies
A-Z-modulelijst