Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Shrnutí modelu Microsoft R Machine Learning
Použití
## S3 method for class `mlModel':
summary (object, top = 20, ...)
Argumenty
object
Objekt modelu vrácený z analýzy MicrosoftML .
top
Určuje počet horních koeficientů, které se mají zobrazit v souhrnu lineárních modelů, jako je rxLogisticRegression a rxFastLinear. Jako první se zobrazí předsudky následované dalšími váhami seřazenými podle jejich absolutních hodnot v sestupném pořadí. Pokud je nastavena hodnota NULL, zobrazí se všechny nenulové koeficienty. V opačném případě se zobrazí pouze první top koeficienty.
...
Do metody souhrnu se předají další argumenty.
Podrobnosti
Poskytuje souhrnné informace o původním volání funkce,
datová sada používaná k trénování modelu a statistiky pro koeficienty v modelu.
Hodnota
Metoda summary objektů analýzy MicrosoftML vrátí seznam, který obsahuje původní volání funkce a použité základní parametry. Metoda coef vrátí pojmenovaný vektor váhy, zpracování informací z objektu modelu.
V případě rxLogisticRegression se v souhrnu mohou vyskytovat také následující statistiky, pokud showTrainingStats je nastavena na TRUEhodnotu .
training.size
Velikost datové sady použité k trénování modelu z hlediska počtu řádků.
deviance
Odchylka modelu je dána tím, kde -2 * ln(L)L je pravděpodobnost získání pozorování se všemi funkcemi začleněnými do modelu.
null.deviance
Odchylka hodnoty null je dána tím, kde -2 * ln(L0)L0 je pravděpodobnost získání pozorování bez účinku z vlastností. Model null obsahuje předsudky, pokud existuje v modelu.
aic
Kritérium AIC (Akaike Information Criterion) je definováno jako 2 * k ``+ deviance, kde k je počet koeficientů modelu. Předsudky se počítají jako jeden z koeficientů. AIC je míra relativní kvality modelu. Zabývá se kompromisem mezi dobrotou fitu modelu (měřenou odchylkou) a složitostí modelu (měřeno počtem koeficientů).
coefficients.stats
Toto je datový rámec obsahující statistiky pro každý koeficient v modelu. Pro každý koeficient jsou uvedeny následující statistiky. Předsudky se zobrazí v prvním řádku a zbývající koeficienty ve vzestupném pořadí p-hodnoty.
- OdhadPokudá hodnota koeficientu modelu.
- Std ErrorThis je druhá odmocnina velkého vzorku odchylky odhadu koeficientu.
- z-ScoreWe může testovat s nulovou hypotézou, která uvádí, že koeficient by měl být nulový, pokud jde o významnost koeficientu výpočtem poměru odhadu a jeho standardní chyby. Při nulové hypotéze platí, že pokud neexistuje žádná regularizace, odhad týkající se koeficientu se řídí normálním rozdělením se střední hodnotou 0 a směrodatnou odchylkou, která se rovná standardní chybě vypočítané výše. Skóre z vypíše poměr mezi odhadem koeficientu a standardní chybou koeficientu.
- Pr(>|z|) Toto je odpovídající p-hodnota pro oboustranný test skóre z. Na základě úrovně významnosti se k p-hodnotě připojí indikátor významnosti. Pokud
F(x)je CDF standardního normálního rozděleníN(0, 1), pakP(>|z|) = 2 - ``2 * F(|z|).
Autori
Microsoft Corporation Microsoft Technical Support
Viz také
rxFastTrees, rxFastForest, rxFastLinear, rxOneClassSvm, rxNeuralNet, rxLogisticRegression.
Příklady
# Estimate a logistic regression model
logitModel <- rxLogisticRegression(isCase ~ age + parity + education + spontaneous + induced,
transforms = list(isCase = case == 1),
data = infert)
# Print a summary of the model
summary(logitModel)
# Score to a data frame
scoreDF <- rxPredict(logitModel, data = infert,
extraVarsToWrite = "isCase")
# Compute and plot the Radio Operator Curve and AUC
roc1 <- rxRoc(actualVarName = "isCase", predVarNames = "Probability", data = scoreDF)
plot(roc1)
rxAuc(roc1)
#######################################################################################
# Multi-class logistic regression
testObs <- rnorm(nrow(iris)) > 0
testIris <- iris[testObs,]
trainIris <- iris[!testObs,]
multiLogit <- rxLogisticRegression(
formula = Species~Sepal.Length + Sepal.Width + Petal.Length + Petal.Width,
type = "multiClass", data = trainIris)
# Score the model
scoreMultiDF <- rxPredict(multiLogit, data = testIris,
extraVarsToWrite = "Species")
# Print the first rows of the data frame with scores
head(scoreMultiDF)
# Look at confusion matrix
table(scoreMultiDF$Species, scoreMultiDF$PredictedLabel)
# Look at the observations with incorrect predictions
badPrediction = scoreMultiDF$Species != scoreMultiDF$PredictedLabel
scoreMultiDF[badPrediction,]