Megosztás:


summary.mlModel: Microsoft R Machine Learning-modell összefoglalása.

A Microsoft R Machine Learning-modell összefoglalása.

Használat

 ## S3 method for class `mlModel':
summary  (object, top = 20, ...)

Érvek

object

Egy MicrosoftML-elemzésből visszaadott modellobjektum.

top

Megadja az olyan lineáris modellek összegzésében megjelenítendő leggyakoribb együtthatók számát, mint az rxLogisticRegression és az rxFastLinear. Először az torzítás jelenik meg, majd az egyéb súlyok, csökkenő sorrendbe rendezve az abszolút értékeket. Ha be van NULLállítva, az összes nem nulla együttható jelenik meg. Ellenkező esetben csak az első top együtthatók jelennek meg.

...

Az összegző metódusnak továbbadandó további argumentumok.

Részletek

Összefoglalja az eredeti függvényhívást, a
a modell betanítása céljából használt adatkészlet, valamint a modellben lévő együtthatók statisztikái.

Érték

A summaryMicrosoftML-elemzési objektumok metódusa egy listát ad vissza, amely tartalmazza az eredeti függvényhívást és a használt mögöttes paramétereket. A coef metódus egy elnevezett súlykontrasztot ad vissza, amely a modellobjektum információit dolgozza fel.

Az rxLogisticRegression esetében az alábbi statisztikák is megjelenhetnek az összegzésben, ha showTrainingStats a beállítás értéke TRUE.

training.size

A modell betanítása során használt adatkészlet mérete a sorok száma alapján.

deviance

A modell devianciáját az adja meg -2 * ln(L) , hogy hol L van annak a valószínűsége, hogy a megfigyeléseket a modellbe foglalt összes funkcióval szerezze be.

null.deviance

A null devianciát az adja meg -2 * ln(L0) , hogy hol L0 valószínű, hogy a megfigyeléseket a jellemzők hatástalanul megkapják. A null modell az torzításokat is tartalmaz, ha van ilyen a modellben.

aic

Az AIC -t (Akaike Information Criterion) a modell együtthatóinak száma határozza 2 * k ``+ deviancek meg. Az torzítás az együtthatók egyike. Az AIC a modell relatív minőségének mértéke. Foglalkozik a modell jó illeszkedése (devianciával mérve) és a modell összetettsége (együtthatók számával mérve) közötti kompromisszummal.

coefficients.stats

Ez egy adatkeret, amely a modell minden egyes együtthatójának statisztikáit tartalmazza. Minden együttható esetében a következő statisztikák jelennek meg. Az torzítás az első sorban jelenik meg, a fennmaradó együtthatók pedig a p-érték növekvő sorrendjében.

  • BecslésA modell becsült együtthatójának értéke.
  • Std ErrorThis a koefficiens becslésének nagy mintaeltérésének négyzetgyöke.
  • z-ScoreWe a nullhipotézisen tesztelhető, amely azt állítja, hogy az együtthatónak nullának kell lennie, az együttható pontosságát illetően a becslés és a standard hiba arányának kiszámításával. A nullhipotézis szerint, ha nem alkalmazunk normalizálást, a vonatkozó együttható becslése a normális eloszlást követi 0 középértékkel és a fent kiszámított szórással egyenlő szórást. A z-pontszám az együttható becslése és az együttható standard hibája közötti arányt adja eredményül.
  • Pr(>|z|) Ez a z-pontszám kétoldalas tesztjének megfelelő p-érték. A pontossági szint alapján a program hozzáfűzi a pontosságjelzőt a p-értékhez. Ha F(x) a normál normál eloszlás N(0, 1)CDF-je, akkor P(>|z|) = 2 - ``2 * F(|z|).

Szerző(k)

Microsoft Corporation Microsoft Technical Support

Lásd még

rxFastTrees, rxFastForest, rxFastLinear, rxOneClassSvm, rxNeuralNet, rxLogisticRegression.

Példák


 # Estimate a logistic regression model
 logitModel <- rxLogisticRegression(isCase ~ age + parity + education + spontaneous + induced,
                   transforms = list(isCase = case == 1),
                   data = infert)
 # Print a summary of the model
 summary(logitModel)

 # Score to a data frame
 scoreDF <- rxPredict(logitModel, data = infert, 
     extraVarsToWrite = "isCase")

 # Compute and plot the Radio Operator Curve and AUC
 roc1 <- rxRoc(actualVarName = "isCase", predVarNames = "Probability", data = scoreDF) 
 plot(roc1)
 rxAuc(roc1)

 #######################################################################################
 # Multi-class logistic regression  
 testObs <- rnorm(nrow(iris)) > 0
 testIris <- iris[testObs,]
 trainIris <- iris[!testObs,]
 multiLogit <- rxLogisticRegression(
     formula = Species~Sepal.Length + Sepal.Width + Petal.Length + Petal.Width,
     type = "multiClass", data = trainIris)

 # Score the model
 scoreMultiDF <- rxPredict(multiLogit, data = testIris, 
     extraVarsToWrite = "Species")    
 # Print the first rows of the data frame with scores
 head(scoreMultiDF)
 # Look at confusion matrix
 table(scoreMultiDF$Species, scoreMultiDF$PredictedLabel)

 # Look at the observations with incorrect predictions
 badPrediction = scoreMultiDF$Species != scoreMultiDF$PredictedLabel
 scoreMultiDF[badPrediction,]