Sdílet prostřednictvím


summary.mlModel: Souhrn modelu Microsoft R Machine Learning.

Shrnutí modelu Microsoft R Machine Learning

Použití

 ## S3 method for class `mlModel':
summary  (object, top = 20, ...)

Argumenty

object

Objekt modelu vrácený z analýzy MicrosoftML .

top

Určuje počet horních koeficientů, které se mají zobrazit v souhrnu lineárních modelů, jako je rxLogisticRegression a rxFastLinear. Jako první se zobrazí předsudky následované dalšími váhami seřazenými podle jejich absolutních hodnot v sestupném pořadí. Pokud je nastavena hodnota NULL, zobrazí se všechny nenulové koeficienty. V opačném případě se zobrazí pouze první top koeficienty.

...

Do metody souhrnu se předají další argumenty.

Podrobnosti

Poskytuje souhrnné informace o původním volání funkce,
datová sada používaná k trénování modelu a statistiky pro koeficienty v modelu.

Hodnota

Metoda summary objektů analýzy MicrosoftML vrátí seznam, který obsahuje původní volání funkce a použité základní parametry. Metoda coef vrátí pojmenovaný vektor váhy, zpracování informací z objektu modelu.

V případě rxLogisticRegression se v souhrnu mohou vyskytovat také následující statistiky, pokud showTrainingStats je nastavena na TRUEhodnotu .

training.size

Velikost datové sady použité k trénování modelu z hlediska počtu řádků.

deviance

Odchylka modelu je dána tím, kde -2 * ln(L)L je pravděpodobnost získání pozorování se všemi funkcemi začleněnými do modelu.

null.deviance

Odchylka hodnoty null je dána tím, kde -2 * ln(L0)L0 je pravděpodobnost získání pozorování bez účinku z vlastností. Model null obsahuje předsudky, pokud existuje v modelu.

aic

Kritérium AIC (Akaike Information Criterion) je definováno jako 2 * k ``+ deviance, kde k je počet koeficientů modelu. Předsudky se počítají jako jeden z koeficientů. AIC je míra relativní kvality modelu. Zabývá se kompromisem mezi dobrotou fitu modelu (měřenou odchylkou) a složitostí modelu (měřeno počtem koeficientů).

coefficients.stats

Toto je datový rámec obsahující statistiky pro každý koeficient v modelu. Pro každý koeficient jsou uvedeny následující statistiky. Předsudky se zobrazí v prvním řádku a zbývající koeficienty ve vzestupném pořadí p-hodnoty.

  • OdhadPokudá hodnota koeficientu modelu.
  • Std ErrorThis je druhá odmocnina velkého vzorku odchylky odhadu koeficientu.
  • z-ScoreWe může testovat s nulovou hypotézou, která uvádí, že koeficient by měl být nulový, pokud jde o významnost koeficientu výpočtem poměru odhadu a jeho standardní chyby. Při nulové hypotéze platí, že pokud neexistuje žádná regularizace, odhad týkající se koeficientu se řídí normálním rozdělením se střední hodnotou 0 a směrodatnou odchylkou, která se rovná standardní chybě vypočítané výše. Skóre z vypíše poměr mezi odhadem koeficientu a standardní chybou koeficientu.
  • Pr(>|z|) Toto je odpovídající p-hodnota pro oboustranný test skóre z. Na základě úrovně významnosti se k p-hodnotě připojí indikátor významnosti. Pokud F(x) je CDF standardního normálního rozdělení N(0, 1), pak P(>|z|) = 2 - ``2 * F(|z|).

Autori

Microsoft Corporation Microsoft Technical Support

Viz také

rxFastTrees, rxFastForest, rxFastLinear, rxOneClassSvm, rxNeuralNet, rxLogisticRegression.

Příklady


 # Estimate a logistic regression model
 logitModel <- rxLogisticRegression(isCase ~ age + parity + education + spontaneous + induced,
                   transforms = list(isCase = case == 1),
                   data = infert)
 # Print a summary of the model
 summary(logitModel)

 # Score to a data frame
 scoreDF <- rxPredict(logitModel, data = infert, 
     extraVarsToWrite = "isCase")

 # Compute and plot the Radio Operator Curve and AUC
 roc1 <- rxRoc(actualVarName = "isCase", predVarNames = "Probability", data = scoreDF) 
 plot(roc1)
 rxAuc(roc1)

 #######################################################################################
 # Multi-class logistic regression  
 testObs <- rnorm(nrow(iris)) > 0
 testIris <- iris[testObs,]
 trainIris <- iris[!testObs,]
 multiLogit <- rxLogisticRegression(
     formula = Species~Sepal.Length + Sepal.Width + Petal.Length + Petal.Width,
     type = "multiClass", data = trainIris)

 # Score the model
 scoreMultiDF <- rxPredict(multiLogit, data = testIris, 
     extraVarsToWrite = "Species")    
 # Print the first rows of the data frame with scores
 head(scoreMultiDF)
 # Look at confusion matrix
 table(scoreMultiDF$Species, scoreMultiDF$PredictedLabel)

 # Look at the observations with incorrect predictions
 badPrediction = scoreMultiDF$Species != scoreMultiDF$PredictedLabel
 scoreMultiDF[badPrediction,]