Jegyzet
Az oldalhoz való hozzáférés engedélyezést igényel. Próbálhatod be jelentkezni vagy könyvtárat váltani.
Az oldalhoz való hozzáférés engedélyezést igényel. Megpróbálhatod a könyvtár váltását.
A Microsoft R Machine Learning-modell összefoglalása.
Használat
## S3 method for class `mlModel':
summary (object, top = 20, ...)
Érvek
object
Egy MicrosoftML-elemzésből visszaadott modellobjektum.
top
Megadja az olyan lineáris modellek összegzésében megjelenítendő leggyakoribb együtthatók számát, mint az rxLogisticRegression és az rxFastLinear. Először az torzítás jelenik meg, majd az egyéb súlyok, csökkenő sorrendbe rendezve az abszolút értékeket. Ha be van NULLállítva, az összes nem nulla együttható jelenik meg. Ellenkező esetben csak az első top együtthatók jelennek meg.
...
Az összegző metódusnak továbbadandó további argumentumok.
Részletek
Összefoglalja az eredeti függvényhívást, a
a modell betanítása céljából használt adatkészlet, valamint a modellben lévő együtthatók statisztikái.
Érték
A summaryMicrosoftML-elemzési objektumok metódusa egy listát ad vissza, amely tartalmazza az eredeti függvényhívást és a használt mögöttes paramétereket. A coef metódus egy elnevezett súlykontrasztot ad vissza, amely a modellobjektum információit dolgozza fel.
Az rxLogisticRegression esetében az alábbi statisztikák is megjelenhetnek az összegzésben, ha showTrainingStats a beállítás értéke TRUE.
training.size
A modell betanítása során használt adatkészlet mérete a sorok száma alapján.
deviance
A modell devianciáját az adja meg -2 * ln(L) , hogy hol L van annak a valószínűsége, hogy a megfigyeléseket a modellbe foglalt összes funkcióval szerezze be.
null.deviance
A null devianciát az adja meg -2 * ln(L0) , hogy hol L0 valószínű, hogy a megfigyeléseket a jellemzők hatástalanul megkapják. A null modell az torzításokat is tartalmaz, ha van ilyen a modellben.
aic
Az AIC -t (Akaike Information Criterion) a modell együtthatóinak száma határozza 2 * k ``+ deviancek meg. Az torzítás az együtthatók egyike. Az AIC a modell relatív minőségének mértéke. Foglalkozik a modell jó illeszkedése (devianciával mérve) és a modell összetettsége (együtthatók számával mérve) közötti kompromisszummal.
coefficients.stats
Ez egy adatkeret, amely a modell minden egyes együtthatójának statisztikáit tartalmazza. Minden együttható esetében a következő statisztikák jelennek meg. Az torzítás az első sorban jelenik meg, a fennmaradó együtthatók pedig a p-érték növekvő sorrendjében.
- BecslésA modell becsült együtthatójának értéke.
- Std ErrorThis a koefficiens becslésének nagy mintaeltérésének négyzetgyöke.
- z-ScoreWe a nullhipotézisen tesztelhető, amely azt állítja, hogy az együtthatónak nullának kell lennie, az együttható pontosságát illetően a becslés és a standard hiba arányának kiszámításával. A nullhipotézis szerint, ha nem alkalmazunk normalizálást, a vonatkozó együttható becslése a normális eloszlást követi 0 középértékkel és a fent kiszámított szórással egyenlő szórást. A z-pontszám az együttható becslése és az együttható standard hibája közötti arányt adja eredményül.
- Pr(>|z|) Ez a z-pontszám kétoldalas tesztjének megfelelő p-érték. A pontossági szint alapján a program hozzáfűzi a pontosságjelzőt a p-értékhez. Ha
F(x)a normál normál eloszlásN(0, 1)CDF-je, akkorP(>|z|) = 2 - ``2 * F(|z|).
Szerző(k)
Microsoft Corporation Microsoft Technical Support
Lásd még
rxFastTrees, rxFastForest, rxFastLinear, rxOneClassSvm, rxNeuralNet, rxLogisticRegression.
Példák
# Estimate a logistic regression model
logitModel <- rxLogisticRegression(isCase ~ age + parity + education + spontaneous + induced,
transforms = list(isCase = case == 1),
data = infert)
# Print a summary of the model
summary(logitModel)
# Score to a data frame
scoreDF <- rxPredict(logitModel, data = infert,
extraVarsToWrite = "isCase")
# Compute and plot the Radio Operator Curve and AUC
roc1 <- rxRoc(actualVarName = "isCase", predVarNames = "Probability", data = scoreDF)
plot(roc1)
rxAuc(roc1)
#######################################################################################
# Multi-class logistic regression
testObs <- rnorm(nrow(iris)) > 0
testIris <- iris[testObs,]
trainIris <- iris[!testObs,]
multiLogit <- rxLogisticRegression(
formula = Species~Sepal.Length + Sepal.Width + Petal.Length + Petal.Width,
type = "multiClass", data = trainIris)
# Score the model
scoreMultiDF <- rxPredict(multiLogit, data = testIris,
extraVarsToWrite = "Species")
# Print the first rows of the data frame with scores
head(scoreMultiDF)
# Look at confusion matrix
table(scoreMultiDF$Species, scoreMultiDF$PredictedLabel)
# Look at the observations with incorrect predictions
badPrediction = scoreMultiDF$Species != scoreMultiDF$PredictedLabel
scoreMultiDF[badPrediction,]