Compartir a través de


WorksheetFunction.LinEst(Object, Object, Object, Object) Método

Definición

Calcula el valor estadístico de una línea mediante el método de los "mínimos cuadrados" con el fin de calcular la línea recta que mejor se adapta a los datos, y devuelve una matriz que describe la línea. Como esta función devuelve una matriz de valores, debe especificarse como una fórmula de matriz.

public object LinEst (object Arg1, object Arg2, object Arg3, object Arg4);
Public Function LinEst (Arg1 As Object, Optional Arg2 As Object, Optional Arg3 As Object, Optional Arg4 As Object) As Object

Parámetros

Arg1
Object

Valores conocidos de y: conjunto de valores conocidos de y en la relación y = mx + b.

Arg2
Object

Valores conocidos de x: conjunto opcional de valores de x que se conocen en la relación y = mx+b.

Arg3
Object

Constante: un valor lógico que especifica si se fuerza la constante b para que sea igual a 0.

Arg4
Object

Estadística: valor lógico que especifica si se van a devolver estadísticas de regresión adicionales.

Devoluciones

Comentarios

La ecuación de la línea es la siguiente:

y = mx + b o

y = m1x1 + m2x2 + ... + b (si hay varios rangos de valores x)

donde el valor de y dependiente es una función de los valores de x independientes. Los valores de m son coeficientes que corresponden a cada valor de x y b es un valor constante. Tenga en cuenta que y, x y m pueden ser vectores. La matriz que LinEst devuelve es {mn,mn-1,...,m1,b}. LinEst también puede devolver estadísticas de regresión adicionales.

Si la matriz de valores conocidos de y se encuentra en una sola columna, cada columna de valores conocidos de x se interpreta como una variable independiente.

Si la matriz de valores conocidos de y está en una sola fila, cada fila de valores conocidos de x se interpreta como una variable independiente.

La matriz de valores conocidos de x puede incluir uno o varios conjuntos de variables. Si solo se usa una variable, los valores conocidos de y y de x pueden ser rangos de cualquier forma, siempre y cuando tengan las mismas dimensiones. Si se usa más de una variable, el argumento de valores conocidos de y tiene que ser un vector (es decir, un rango compuesto por una fila o por una columna).

Si se omite el argumento de valores conocidos de x, se supone que ésta es la matriz {1,2,3,...} que tiene el mismo tamaño que la de los valores conocidos de y.

Si const es true o se omite, b se calcula normalmente.

Si const es false, b se establece en 0 y los valores m se ajustan para ajustarse a y = mx.

Si stats es truuue, LinEst devuelve las estadísticas de regresión adicionales, por lo que la matriz devuelta es {mn,mn-1,...,m1,b; sen,sen-1,...,se1,seb; r2,sey; F,df; ssreg,ssresid}.

Si las estadísticas son falsas o se omiten, LinEst devuelve solo los coeficientes m y la constante b.

Las estadísticas de regresión adicionales son las siguientes:

se1,se2,...,senValores de error típicos para los coeficientes m1,m2,...,mn.
SebValor de error estándar de la constante b (seb = #N/A cuando const es false).
R2Coeficiente de determinación. Compara los valores de y previstos y reales y asigna un valor de 0 a 1. Si es 1, hay una correlación perfecta en la muestra: no hay diferencia entre el valor de y previsto y el valor de y real. En el otro extremo, si el coeficiente de determinación es 0, la ecuación de regresión no sirve para predecir el valor de y.
SeyError típico para el valor previsto de y.
FLa estadística F o el valor observado por F. Use la estadística F para determinar si la relación observada entre las variables dependientes e independientes se produce por casualidad.
DfGrados de libertad. Utilice los grados de libertad para hallar valores críticos de F en una tabla estadística. Compare los valores que encuentra en la tabla con la estadística F devuelta por LinEst para determinar un nivel de confianza para el modelo.
ssregSuma de regresión de cuadrados.
ssresidSuma residual de cuadrados.

En la siguiente ilustración se muestra el orden en que se devuelven las estadísticas de regresión adicionales.

Figura 1: Hoja de cálculo

Puede describir cualquier línea recta con la pendiente y la intersección Y:

Pendiente (m):

Para encontrar la pendiente de una línea, a menudo escrita como m, tome dos puntos en la línea, (x1,y1) y (x2,y2); la pendiente es igual a (y2 - y1)/(x2 - x1).

Interceptación Y (b):

La intersección y de una línea, a menudo escrita como b, es el valor de y en el punto donde la línea cruza el eje Y.

La ecuación de una línea recta es y = mx + b. Cuando se conocen los valores de m y b, se puede calcular cualquier punto de la línea rellenando el valor de y o de x en la ecuación. También puede usar la Trend(Object, Object, Object, Object) función .

Cuando solo tiene una variable x independiente, puede obtener los valores de pendiente e intersección Y directamente mediante las fórmulas siguientes:

Pendiente:

=INDEX(LINEST(known_y,known_x),1)

Interceptación Y:

=INDEX(LINEST(known_y,known_x),2)

La precisión de la línea calculada por LineEst depende del grado de dispersión de los datos. Cuantos más lineales sean los datos, más preciso será el modelo LineEst . LineEst usa el método de mínimos cuadrados para determinar el mejor ajuste para los datos. Cuando solo tiene una variable x independiente, los cálculos de m y b se basan en las fórmulas siguientes:

Figura 2: Ecuación

Figura 3: Ecuación

donde x e y son medios de ejemplo, es decir, x = AVERAGE (x conocidos) y y = AVERAGE(known_y's).

Las funciones de ajuste de línea y curva LineEst y LogEst(Object, Object, Object, Object) pueden calcular la mejor línea recta o curva exponencial que se adapte a los datos. Sin embargo, tendrá que decidir cuál de los dos resultados se adapta mejor a los datos. Puede calcular TREND(valores conocidos de y, valores conocidos de x) para una línea recta, o GROWTH(valores conocidos de y, valores conocidos de x) para una curva exponencial. Estas funciones, sin el argumento de valores nuevos de x, devuelven una matriz de valores y previstos a lo largo de la línea o curva en los puntos de datos reales. A continuación, puede comparar los valores previstos con los valores reales. Puede ser conveniente dibujarlos en un gráfico para poder compararlos visualmente.

En el análisis de regresión, Microsoft Excel calcula para cada punto la diferencia al cuadrado entre el valor previsto de y para ese punto y su valor real de y. La suma de estas diferencias al cuadrado se denomina suma residual de los cuadrados, ssresid. Microsoft Excel calcula, a continuación, la suma total de los cuadrados, sstotal. Cuando const = true o se omite, la suma total de cuadrados es la suma de las diferencias cuadradas entre los valores y reales y el promedio de los valores y. Cuando const = false, la suma total de cuadrados es la suma de los cuadrados de los valores y reales (sin restar el valor y medio de cada valor y individual). Por tanto, la suma de regresión de los cuadrados, ssreg, se puede hallar a partir de: ssreg = sstotal - ssresid. Cuanto menor sea la suma residual de los cuadrados, comparada con la suma total de los cuadrados, mayor será el valor del coeficiente de determinación, r2, que es un indicador de cómo la ecuación resultante del análisis de regresión explica la relación entre las variables. r2 es igual a ssreg/sstotal.

En algunos casos, una o varias de las columnas X (supongamos que Y y X están en columnas) pueden no tener ningún valor predictivo adicional en presencia de las otras columnas X. En otras palabras, la eliminación de una o varias columnas X podría dar lugar a valores Y predichos que sean igualmente precisos. En ese caso, estas columnas X redundantes deben omitirse del modelo de regresión. Este fenómeno se denomina "colinearidad" porque cualquier columna X redundante se puede expresar como una suma de múltiplos de las columnas X no redundantes. LinEst comprueba si hay colinearidad y quita las columnas X redundantes del modelo de regresión cuando las identifica. Las columnas X eliminadas se pueden reconocer en la salida LinEst como que tienen 0 coeficientes, así como 0 se. Si una o varias columnas se quitan como redundantes, df se ve afectado porque df depende del número de columnas X que se usan realmente con fines predictivos. Si df se cambia porque se quitan las columnas X redundantes, los valores de sey y F también se ven afectados. La colinearidad debe ser relativamente rara en la práctica. Sin embargo, un caso en el que es más probable que surja es cuando algunas columnas X contienen solo 0 y 1 como indicadores de si un sujeto de un experimento es o no miembro de un grupo determinado. Si const = true o se omite, LinEst inserta eficazmente una columna X adicional de los 1 para modelar la interceptación. Si tiene una columna con un 1 para cada asunto si es varón, o 0 si no, y también tiene una columna con un 1 para cada sujeto si es mujer, o 0 si no, esta última columna es redundante porque las entradas en ella se pueden obtener de restar la entrada en la columna "indicador masculino" de la entrada de la columna adicional de los 1 agregados por LineEst.

df se calcula de la siguiente manera cuando no se quita ninguna columna X del modelo debido a la colinearidad: si hay k columnas de known_x y const = true o omitidas, df = n – k – 1. Si const = false, df = n - k. En ambos casos, cada columna X se quita debido a que la colinealidad aumenta en 1 el valor de df.

Las fórmulas que devuelven matrices deben escribirse como fórmulas de matriz. Cuando especifique como argumento una constante matricial, como valores conocidos de x, utilice comas para separar los valores de una misma fila y signos de punto y coma para separar las filas. Los caracteres separadores pueden ser diferentes según la configuración local definida en Configuración regional y de idioma en el Panel de control.

Tenga en cuenta que los valores de y previstos por la ecuación de regresión puede que no sean válidos si quedan fuera del rango de los valores de y utilizados para determinar la ecuación. El algoritmo subyacente usado en la función LinEst es diferente del algoritmo subyacente usado en las Slope(Object, Object) funciones y Intercept(Object, Object) . La diferencia entre estos algoritmos puede producir resultados distintos cuando los datos son indeterminados y colineales. Por ejemplo, si los puntos de datos del argumento de valores conocidos de y son 0 y los puntos de datos del argumento de valores conocidos de x son 1:

LineEst devuelve un valor de 0. El algoritmo LinEst está diseñado para devolver resultados razonables para los datos collinear y, en este caso, se puede encontrar al menos una respuesta. Slope(Object, Object) y Intercept(Object, Object) devolver un #DIV/0! Error. El Slope(Object, Object) algoritmo y Intercept(Object, Object) está diseñado para buscar una única respuesta y, en este caso, puede haber más de una respuesta.

Se aplica a